北京生命科学研究所测序中心主任蔡涛,在本场论坛中是唯一一位从生物信息学角度来讨论大数据应用实践的,他认为,互联网背景下的大数据和生物学、医学以及生命科学中传统方法采集的数据各有特征,目前互联网背景下的大数据还不能和上述三个领域的数据在数据量上相比较。简单说,首先,细胞,组织等结构是具有活性的,其功能,表达水平甚至其分子结构在时间维度上也是连续变化的。拘于现有的采集技术和数据整理水平,当前各类数据库提供的数据往往是静态的,这造成研究人员面临样本数目稀少的局面,但这并不是说客观世界本来就数据稀少,因为动态性,或者说运动,才是生命活动的固有属性;其次,即使是从静态角度来看,互联网背景下的大数据在特征组合方面也远低于上述三个领域的数据,在这些领域,通常都面临特征组合的爆炸问题,比如所有已知物种的蛋白质分子的空间结构预测问题,就已经远超现有人类的科学计算能力。不是说生物信息学将消亡,而是刚刚才开始。正因为生物信息的重要性,生物信息学才融入到相关领域的各个方面。个人认为目前还处于数据收集的阶段,数据远不够丰富,距离客观实际还有差距,因此生物信息学领域要出现重要成果,还需要等待,巧妇难为无米之炊。
浏览5661次
浏览1447次
浏览10028次
浏览9189次
浏览9492次
浏览1263次
2025-01-08 昆明
2025-06-20 深圳
2025-04-19 南京
2025-08-15 上海
打开微信扫一扫,分享到朋友圈