首页>会议文档 >

李国杰 - 重视大数据与人工智能的基本理论和基础设施

page:
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施
李国杰 - 重视大数据与人工智能的基本理论和基础设施

李国杰 - 重视大数据与人工智能的基本理论和基础设施

所属会议:CBDS 2017第四届中国国际大数据大会会议地点:北京


下载

手机看
活动家APP客户端

扫二维码下载
或点击下载
Android iOS

10254次
浏览次数

文档介绍

中国工程院李国杰院士在大会上作主旨报告,指出大数据人工智能是信息时代的新阶段,未来10到15年对经济贡献最大的是信息技术融入各个产业的新产品、提供个性化产品和服务的新业态、产业链跨界融合的新模式。

演讲实录

大家上午好,最近因为大数据人工智能很火,大数据的应用的很多,我讲两点:
第一点,我们现在到底是一个什么时代?因为现在社会上都说现在中国信息时代已经过去了,经过物联网的时代,现在已经进入大数据的时代,现在到底是一个什么时代。从人类社会发展的长周期来看,应该说人类有文明以来分为三个时代:农业时代、工业时代和信息时代,前面原始人类界的时期都没有算。信息实际是从二战以后开始,现在算起来也就半个多个世纪,与工业时代相比,信息时代可能正处在从蒸汽机时代阶段向电器时代阶段的转变期。
大数据与人工智能是信息时代的一个新阶段。我们过去讲信息化,网络化,现在是智能化,好像那个都不重要了,其实我觉得与其强调智能化和数字化、网络化的区隔,不如多强调智能化和信息化的密切联系,数字化和网络化如果没有做好的话,我觉得智能化不好做。
在中国科学院人工牵头咨询的时候,我自己参考了过去国外信息传播的概念,对经济长波的预测,一个长波大概是20年,并且有缩短的趋势。伴随着互联网、移动中心这些改变,到2008年金融危机了,应该是到了高峰点往下走,所以现在是什么时候呢?现在经济涨了3%到4%,是经济的衰退期,我们现在讲如火如荼,但是总体来讲是一个衰退期,是一个低潮。
历史上经济的衰退期正好是重大的发明期,再结合2012年的发展,西方已经加快下一波的发展,大概是这么一个总趋势,这是我个人的判断。但是不管怎么变,前面都是属于信息时代。
从这个时代我们得出一个结论应该是:
未来10到15年对经济贡献最大的可能不是大数据和人工智能的新技术,而是信息技术荣辱各个产业的新产品、提供个性换产品和服务的新业态、产业链跨界融合的新模式。这些创新主要是已知技术的新组合。这些创新大多数是已知技术新的融合。
在经济的衰退复苏期要特别重视基础性技术的发明,未来10到15年应力争在大数据和人工智能领域做出像电子计算机、集成电路、互联网一样的重大发明。现在各种各样的学习谈不上重大的发明,这些是小的发明,是它自己冒出来的,我们希望未来有重大发明出来。
历史上重大基础发明都经过较长时间的技术改进和扩散之后才能产生巨大经济效益,信息技术也不应例外。从2016年到2025年的10年内,汽车、消费品、电力、物流等行业的数字化转型有望带来100亿美元的社会与企业家职。大数据和人工智能提升传统产业的前景十分光明。
这里面有一张图,我经常讲技术的发展S线现在比较慢,但是S线前面有1960年到1980年经过一段时间,但是你会发现以后还有一个S线,这是是专利技术的增长量来反映技术法则,中国的法则可能还有几倍、十几倍的增长在后面,不是说走完了就完了,经过的可能是经济技术。
大家最近讲人工智能,讲大数据以后,我是做计算机出身,我一直觉得搞人工智能老实讲,人工智能是一个新的学科,涉及脑科学、计算机科学、统计学和社会科学等等。但是到目前为止脑科学对人工智能的贡献是很小,现在所谓的机器学习,谈不上神经科学有多大的影响。
统计学对人工智能有很大的影响,但是没有人说把人工智能当成统计学的一个分子。从目前来看,人工智能本质上是计算机的一个分支,从应用来看,人工智能是计算机技术的非平凡的一年。所谓的智能化前提就是计算器化,目前不存在脱离计算机的优势。所以我觉得我们应该强调学科的融合,从老的学科分离出新学科很常见,计算机应该积极支持新学科的成长。但是,大数据和人工智能要注重只是的融合,钱学森先生就说过“必集大车,才能得智慧”。人工智能的权威就说过,人工智能的任务是在研究还没有解决的计算机问题。从这个意义上来讲,所谓智能时代不是后信息时代,大数据更不是。将来我们要把钢铁变成碳纤维就是高谈,现在是一个硅基时代。
第二点,是关于重视大数据和人工智能基本理论和基础设施。一个看法人工智能等于A+B+C,A就是算法,B就是大数据,C就是算力。我的看法是把大数据AI结合在一起看,大数据肯定是A+B+C+D+E,A还是算法,B是基本理论或者基础设施,C是计算能力,D是领域知识,E是生态环境。由于时间有限,我今天没有时间展开讲,我就讲两点,今天主要是讲B基本理论。
大数据和人工智能要特别重视大众的刚性需求,我以前在2011年的时候写了一篇文章叫为“大众计算”,今后的几十年信息技术发展方向计算是为大众服务,为多数人服务。就我们关心的高端的消费人群,因为我们经常讲以前当年我们小时候是毛主席老说水深火热,现在人工智能和大数据需要关心大众刚性的需求,包括健康、出行、安全这些都是刚性需求。我们要多做一些真正的解决问题的探索,这样才有一定作用。
要满足大数据的刚性需求一定要有基础设施,工业时代就是铁路、公路、机场,智能化阶段的基础设施是:大数据中心、机器学习训练平台等。大数据的存储、管理和分析成为新的基础设施,所以大数据也催生了Scolable AI也成为基础设施。
我们中国人是很重视“名”的,信息领域是不断的造新名词,但是一般新的名词或者一个新的学科一旦上升为国家意志以后,原来的技术学科就被边缘化了,现以“系统结构”和“基础软件”申请国家项目,已经很难拿到经费。
在2016年国家自然科学基金计算机学科的4863项申请项目中,计算机科学的基础理论只有16项,计算机体系结构22项,程序设计语言及支撑环境13项,高速数据传输技术2项。但是,计算机图像与视频处理有439项,模式识别理论及应用357项,人工智能应用258项。所以构建大数据和AI基础设施离不开“系统结构”和“基础软件”,基础设施不能进入世界一流或者不能自主可控。
国务院已经公布了《新一代人工智能发展规划》,规划里面分析更多的是应用为主的开发,涉及到人工智能基本理论的比较少,在未来应该高度重视这些基础数据,数据和科学,其实在座的可能都是企业界的,除了应用之外还应该重视科学,什么叫数据科学?数据科学是用数据的办法来研究科学和用科学的办法来研究数据,这个叫做数据科学。前面像什么经济学、天文学那些,后面讲的就是统计学习。这种事情要搞起来一定要数学家、计算机科学家和各个领域的深度合作。
深度学习为什么这么有效?没有人解释为什么,最近以色列希伯来大学有一个学者Tishby提出一个理论叫“信息瓶颈”,他发现深度学习与“物理重整化是完全相同的过程,提出“学习最重要的部分是忘记”。我们应重视这一类的基础研究。
未来5年内,需要新增至少1000倍数量的AI研发工程师,现在需要硕士博士研发的AI技术及10年后将是高中生的课外作业。
很多人老拿人跟机器学习去比,其实这个是错的,人脑出生的大脑已经是经过大数据学习完的,他是几百万年进化过来的,几百万年数数代代经过非常多的大数据形成,所以体现在大脑的结构上面,出生以后人类个体的发育已经不是大数据了,他是形成一些小数据来修改大脑,所以出生的时候大脑连接非常多,以后不是增加连接,是越学越少慢慢做减法的过程。所以它不是讲现在人脑学习的过程。
人类大数据学习体现在基因“进化”上,当代人的学习过程对计算机的大数据学习并没有多大启发。要从动物和人类的进化中获取大数据学习的“经验”。人脑是进化出来的,不是科学出来的,要理解大脑必须理解进化。
学术界普遍将人工智能的研究途径归纳为三类:符号主义、连接主义和行为主义。虽然也有人将行为主义称为“进化主义”。但主要还是指以Brooks为代表感知—行动学派。
上世纪90年代初形状的“计算智能”,学派不仅研究人工神经网络,还研究遗传算法、进化程序、混沌计算等,进化计算的主要优点是简单、通用、鲁棒性强和适合运用于并行处理。
领域知识绝不可忽视,基于大数据的研究地四范式成为热门以后,“数据就是力量”,大有取代“知识就是力量”之势。但许多教训提醒我们:领域知识决不可忽视。
离散的数据背后可能是一个连续的模型,这个连续的模型需要深入掌握领域知识才能获得。进化计算实质上是自适应的机器学习方法,它的核心思想是利用进化历史中获得的信息和知识指导搜索或计算,这些知识需要从领域专家获得。
美国曼哈顿工程的负责人奥本海默在二战胜利以后说:“我们得到一棵硕果累累的大树,并拼命地摇晃,结果得到了雷达和原子弹……,其全部精神实质在于队已知的疯狂而粗暴地掠夺,而毫无对未知的认真而谦虚地探索。”
谢谢大家!(发言完)

×

打开微信扫一扫,分享到朋友圈