发布网友 发布时间:2022-04-30 03:43
共1个回答
热心网友 时间:2023-10-10 02:23
测序原理依然是CG一直用的Sequencing by ligation (SBL) 而非illumina家明显占优势的Sequencing by synthesis (SBS)。 虽然CG在前一段时间买了SBS的专利,但在这款测序仪上明显没有使用。28bp的读长应该是4个7mer连起来的长度。
2. 读长是28bp。50x coverage一个WGS,每年10000个WGS,一个run跑8天来算的话,一个run的通量大概是32.8T,就数据量讲,绝对是测序仪中航母的体量的 #当然占地面积更是#。准确度按照官方的话说应该是“unbelievable accuracy”,大概错误率是1E-6这个级别,显然是比任何面试的测序仪正确率都远远要高。但是请不要忽略了CG这台测序仪的读长只有28bp,而请考虑把illumina的读长从250bp和150bp砍到28bp再比较正确率的情况。
3.1 先说优势。数据产量巨大,因而单位成本一定很低,适合做人类基因组的重测序。CG打从出生就标榜是“人类基因组重测序的最佳测序”。28bp的读长,复杂度低的“人类”基因组(或是外显子组)处理起来尚且算是得心应手。28bp只能做重测序,组装什么的还是撸撸睡吧。而对于NIPT以及类似的技术,测序过程就是“堆砌数据量”,仅需检测拷贝数变化而不关注覆盖度和SNP水平的变异,CG这款新机器可能是非常好的选择(我不是很确定的是,28bp这个长度是否可能对大规模混样而需要许多复杂度较高的barcode什么的造成一定的麻烦)。而类似于未来的面向肿瘤无创早起筛查的游离肿瘤细胞(ctC)检测, 游离肿瘤DNA(ctDNA)检测,以及面向产前胎儿基因组测序的胎儿有核红细胞(FNRBC)检测,所测绝大部分数据将是无用数据,CG这种“数据不要钱”的的优势可能就会显现。不就是堆数据量么,咱在行。
3.2 劣势嘛,数据量太大也是一个劣势——凑不满run,一般人根本跑不动。参考Hiseq X尴尬的现状。然后读长是硬伤,所以除了“人类”“重测序”以外,几乎没办法应用于别的领域了(熊猫那种比人类基因组复杂度还要远低的大概还是可以啦)。以及28bp对pooling时barcode的影响,表示略担心。其他的,参考CG以前的机器,其运行稳定性是个考验,毕竟8天时间不短,反应量数据量都巨大,不知道会不会很容易需要“售后”。