个样本,每个样本都是海昼在某一时刻的全基因组,每个基因组包含30亿个碱基对,数据总量约3Gb
其中全外显子占约%1,数据总量约30m
其它已知基因约2.2万个,每个包含基因间区的大约7K
按照数据在计算机内的存储方式,全基因组测序(GS)的数据量为30x3G = 90G 全外显子测序(ES)的数据量为100x30m = 3G 靶向测序(panel)的数据量为500 x 400 x 7k = 1.4G 以上数字全部乘以,便是卢赫即将徜徉在其中的数据海洋
也就是358.94pb而已,一点都不多
才怪
在大停电之前,全球每日互联网流量也就是600pb而已
那个躺在病床上奄奄一息的白发老家伙,用一个多月的时间里,制造了用几百吨硬盘才装的完的数据,而其中真正有用可能连0.