சியோலி ஜியோ, சின் ஜெங், லியாங் மா, கீதா குட்டி, எமிலி கோகினேனி
PacBio RS, புதிதாக வளர்ந்து வரும் மூன்றாம் தலைமுறை டிஎன்ஏ வரிசைமுறை தளம், நிகழ்நேர, ஒற்றை-மூலக்கூறு, நானோ-நிட்ச் வரிசைமுறை தொழில்நுட்பத்தை அடிப்படையாகக் கொண்டது, இது மிக நீண்ட வாசிப்புகளை (20-kb வரை) உருவாக்க முடியும். முதல் மற்றும் இரண்டாம் தலைமுறை வரிசைமுறை தொழில்நுட்பங்கள் மூலம். ஒரு புதிய தளமாக, வரிசைமுறை பிழை விகிதத்தையும், PacBio வரிசை தரவுகளுடன் தொடர்புடைய தரக் கட்டுப்பாடு (QC) அளவுருக்களையும் மதிப்பிடுவது முக்கியம். இந்த ஆய்வில், PacBio RS வரிசைப்படுத்தல் தளத்தைப் பயன்படுத்தி 10 முன்பே அறியப்பட்ட, நெருங்கிய தொடர்புடைய DNA ஆம்பிளிகான்களின் கலவை வரிசைப்படுத்தப்பட்டது. சுற்றறிக்கை ஒருமித்த வரிசை (CCS) ரீட்களை மேற்கூறிய வரிசைமுறை பரிசோதனையிலிருந்து அறியப்பட்ட குறிப்பு வரிசைகளுக்கு சீரமைத்த பிறகு, சராசரி பிழை விகிதம் QC இல்லாமல் 2.5% ஆக இருந்தது மற்றும் SVM அடிப்படையிலான பல அளவுரு QC முறையுடன் 1.3% ஆக மேம்படுத்தப்பட்டது. கூடுதலாக, வெவ்வேறு QC அணுகுமுறைகளின் விளைவுகளை மதிப்பிடுவதற்கு ஒரு கீழ்நிலை பயன்பாடாக டி நோவோ அசெம்பிளி பயன்படுத்தப்பட்டது. CCS வாசிப்புகள் பிந்தைய பிழை-திருத்தப்பட்டாலும், வெற்றிகரமான கீழ்நிலை பயோ-இன்ஃபர்மேடிக்ஸ் பகுப்பாய்வு முடிவுகளை உருவாக்க CCS வாசிப்புகளில் பொருத்தமான QC ஐச் செய்வது இன்னும் அவசியம் என்பதை இந்த அளவுகோல் ஆய்வு சுட்டிக்காட்டுகிறது.