哈尔滨工业大学刘挺 - 自然语言处理的十个发展趋势

2017中国人工智能大会（CCAI 2017）所有文档
北京航空航天大学王蕴红 - 人工智能技术与艺术的鉴赏创作
11226次
澳大利亚新南威尔士大学 Toby Walsh - 人工智能造福人类的那一面
4358次
清华大学黄民烈 - 人机对话技术初探
6112次
东南大学张敏灵 - 弱监督机器学习范式
9499次
Masashi Sugiyama - 弱监督机器学习研究新进展
10168次
香港科技大学杨强 - 深度学习的迁移模型
7167次
中国科学技术大学陈恩红 - 深度学习与自然语言处理
6364次
中国科学院兰艳艳 - 信息检索与机器器学习的华尔兹
4728次
南加州大学刘燕 - 艺术与人工智能的明天——人机信任合作
2623次
中国科学院宗成庆 - 语言智能与应用
8948次
清华大学史元春 - 科幻与创新
9424次
《中国科学报》主任记者王静 - 科学艺术交相辉映
6085次
清华大学张敏-当人工智能“科学遇到艺术”的一点杂谈
1741次
香港中文大学张胜誉——个性化推荐和资源分配在金融和经济中的应用
7853次
Thomas G. Dietterich-构建强健的人工智能：原因及方式
1174次
上海交通大学邓小铁 - 金融博弈下的价值学习
10911次
香港智能金融科技柳崎峰 - 金融机构从移动时代到智能时代
4530次

哈尔滨工业大学刘挺 - 自然语言处理的十个发展趋势

所属会议：2017中国人工智能大会（CCAI 2017）会议地点：杭州


下载


手机看

扫二维码下载
或点击下载 Android iOS

   

10485次
浏览次数

2017中国人工智能大会（CCAI 2017）所有文档北京航空航天大学王蕴红 - 人工智能技术与艺术的鉴赏创作澳大利亚新南威尔士大学 Toby Walsh - 人工智能造福人类的那一面清华大学黄民烈 - 人机对话技术初探东南大学张敏灵 - 弱监督机器学习范式 Masashi Sugiyama - 弱监督机器学习研究新进展香港科技大学杨强 - 深度学习的迁移模型中国科学技术大学陈恩红 - 深度学习与自然语言处理中国科学院兰艳艳 - 信息检索与机器器学习的华尔兹南加州大学刘燕 - 艺术与人工智能的明天——人机信任合作中国科学院宗成庆 - 语言智能与应用清华大学史元春 - 科幻与创新《中国科学报》主任记者王静 - 科学艺术交相辉映清华大学张敏-当人工智能“科学遇到艺术”的一点杂谈香港中文大学张胜誉——个性化推荐和资源分配在金融和经济中的应用 Thomas G. Dietterich-构建强健的人工智能：原因及方式上海交通大学邓小铁 - 金融博弈下的价值学习香港智能金融科技柳崎峰 - 金融机构从移动时代到智能时代

文档介绍



刘挺，哈尔滨工业大学教授，社会计算与信息检索研究中心主任。主要研究方向为自然语言处理和社会计算，是国家973课题、国家自然科学基金重点项目的负责人。研制出语言技术平台LTP、中文语言知识图谱“大词林”，被业界广为使用。多次担任国家863重点项目总体组专家、973项目专家组成员、基金委会评专家，入选科技部中青年科技创新领军人才。中国计算机学会（CCF）理事、CCF哈尔滨主席；中国中文信息学会常务理事、社会媒体处理专委会主任；曾任国际顶级会议ACL、EMNLP领域主席，多次担任全国学术会议（SMP、CCIR）的大会主席、程序委员会主席。曾获国家科技进步二等奖、省科技进步一等奖、钱伟长中文信息处理科学技术一等奖。

演讲实录

本次大会的第一场分论坛讨论是关于语言智能领域的八大问题。讨论期间，哈工大的刘挺教授对自然语言处理的发展趋势做了一次精彩的归纳，他把这里的趋势分成了十个方面：

趋势1：语义表示——从符号表示到分布表示

自然语言处理一直以来都是比较抽象的，都是直接用词汇和符号来表达概念。但是使用符号存在一个问题，比如两个词，它们的词性相近但词形不匹配，计算机内部就会认为它们是两个词。举个例子，荷兰和苏格兰这两个国家名，如果我们在一个语义的空间里，用词汇与词汇组合的方法，把它表示为连续、低维、稠密的向量的话，就可以计算不同层次的语言单元之间的相似度。这种方法同时也可以被神经网络直接使用，是这个领域的一个重要的变化。

从词汇间的组合，到短语、句子，一直到篇章，现在有很多人在做这个事，这和以前的思路是完全不一样的。

有了这种方法之后，再用深度学习，就带来了一个很大的转变。原来我们认为自然语言处理要分成几个层次，但是就句法分析来说，它是人为定义的层次，那它是不是一定必要的？这里应该打一个问号。

实际工作中，我们面临着一个课题——信息抽取。我之前和一个单位合作，初衷是我做句法分析，然后他们在我的基础上做信息抽取，相互配合，后来他们发表了一篇论文，与初衷是相悖的，它证明了没有句法分析，也可以直接做端到端的直接的实体关系抽取，

这很震撼，不是说现在句法分析没用了，而是我们认为句法分析是人为定义的层次，在端到端的数据量非常充分，可以直接进行信息抽取的时候，那么不用句法分析，也能达到类似的效果。当端到端的数据不充分时，才需要人为划分层次。

趋势2：学习模式——从浅层学习到深度学习

浅层到深层的学习模式中，浅层是分步骤走，可能每一步都用了深度学习的方法，实际上各个步骤是串接起来的。直接的深度学习是一步到位的端到端，在这个过程中，我们确实可以看到一些人为贡献的知识，包括该分几层，每层的表示形式，一些规则等，但我们所谓的知识在深度学习里所占的比重确实减小了，主要体现在对深度学习网络结构的调整。

趋势3：NLP平台化——从封闭走向开放

以前我们搞研究的，都不是很愿意分享自己的成果，像程序或是数据，现在这些资料彻底开放了，无论是学校还是大企业，都更多地提供平台。NLP领域提供的开放平台越来越多，它的门槛也越来越降低。

语音和语言其实有很大的差别，我认识的好几位国内外的进入NLP的学者，他们发现NLP很复杂，因为像语音识别和语音合成等只有有限的问题，而且这些问题定义非常清晰。但到了自然语言，要处理的问题变得纷繁复杂，尤其是NLP和其他的领域还会有所结合，所以问题非常琐碎。

趋势4：语言知识——从人工构建到自动构建

AlphaGo告诉我们，没有围棋高手介入他的开发过程,到AlphaGo最后的版本，它已经不怎么需要看棋谱了。所以AlphaGo在学习和使用过程中都有可能会超出人的想像，因为它并不是简单地跟人学习。

美国有一家文艺复兴公司，它做金融领域的预测，但是这个公司不招金融领域的人，只是招计算机、物理、数学领域的人。这就给了我们一个启发，计算机不是跟人的顶级高手学，而是用自己已有的算法，去直接解决问题。

但是在自然语言处理领域，还是要有大量的显性知识的，但是构造知识的方式也在产生变化。比如，现在我们开始用自动的方法，自动地去发现词汇与词汇之间的关系，像毛细血管一样渗透到各个方面。

趋势5：对话机器人——从通用到场景化

最近出现了各种图灵测试的翻版，就是做知识抢答赛来验证人工智能，从产学研应用上来讲就是对话机器人，非常有趣味性和实用价值。

这块的趋势在哪里？我们知道，从Siri刚出来，国内就开始做语音助手了，后来语音助手很快下了马，因为它可以听得到但是听不懂，导致后面的服务跟不上。后来国内把难度降低成了聊天，你不是调戏Siri吗，我就做小冰就跟你聊。但是难度降低了，实用性却跟不上来，所以在用户的留存率上，还是要打个问号。

现在更多的做法和场景结合，降低难度，然后做任务执行，即希望做特定场景时的有用的人机对话。在做人机对话的过程中，大家热情一轮比一轮高涨，但是随后大家发现，很多问题是由于自然语言的理解没有到位，才难以产生真正的突破。

趋势6：文本理解与推理——从浅层分析向深度理解迈进

Google等都已经推出了这样的测试机——以阅读理解作为一个深入探索自然语言理解的平台。就是说，给计算机一篇文章，让它去理解，然后人问计算机各种问题，看计算机是否能回答，这样做是很有难度的，因为答案就在这文章里面，人会很刁钻地问计算机。所以说阅读理解是现在竞争的一个很重要的点。

趋势7：文本情感分析——从事实性文本到情感文本

多年以前，很多人都在做新闻领域的事实性文本，而如今，搞情感文本分析的似乎更受群众欢迎，这一块这在商业和政府舆情上也都有很好地应用。

趋势8：社会媒体处理——从传统媒体到社交媒体

相应的，在社会媒体处理上，从传统媒体到社交媒体的过渡，情感的影响是一方面，大家还会用社交媒体做电影票房的预测，做股票的预测等等。

但是从长远的角度看，社会、人文等的学科与计算机学科的结合是历史性的。比如，在文学、历史学等学科中，有相当一部分新锐学者对本门学科的计算机的大数据非常关心，这两者在碰撞，未来的前景是无限的，而自然语言处理是其中重要的、基础性的技术。

趋势9：文本生成——从规范文本到自由文本

文本生成这两年很火，从生成古诗词到生成新闻报道到再到写作文。这方面的研究价值是很大的，它的趋势是从生成规范性的文本到生成自由文本。比如，我们可以从数据库里面生成一个可以模板化的体育报道，这个模板是很规范的。然后我们可以再向自由文本过渡，比如写作文。

趋势10：NLP+行业——与领域深度结合，为行业创造价值

最后是谈与企业的合作。现在像银行、电器、医药、司法、教育、金融等的各个领域对NLP的需求都非常多。

我预测NLP首先是会在信息准备的充分的，并且服务方式本身就是知识和信息的领域产生突破。还比如司法领域，它的服务本身也有信息，它就会首先使用NLP。NLP最主要将会用在以下四个领域，医疗、金融、教育和司法。

Hans Uszkoreit

德国人工智能研究中心（DFKI）科技总监

了解更多 >

哈尔滨工业大学刘挺 - 自然语言处理的十个发展趋势

北京航空航天大学王蕴红 - 人工智能技术与艺术的鉴赏创作

澳大利亚新南威尔士大学 Toby Walsh - 人工智能造福人类的那一面

清华大学黄民烈 - 人机对话技术初探

东南大学张敏灵 - 弱监督机器学习范式

Masashi Sugiyama - 弱监督机器学习研究新进展

香港科技大学杨强 - 深度学习的迁移模型

中国科学技术大学陈恩红 - 深度学习与自然语言处理

中国科学院兰艳艳 - 信息检索与机器器学习的华尔兹

南加州大学刘燕 - 艺术与人工智能的明天——人机信任合作

中国科学院宗成庆 - 语言智能与应用

清华大学史元春 - 科幻与创新

《中国科学报》主任记者王静 - 科学艺术交相辉映

清华大学张敏-当人工智能“科学遇到艺术”的一点杂谈

香港中文大学张胜誉——个性化推荐和资源分配在金融和经济中的应用

Thomas G. Dietterich-构建强健的人工智能：原因及方式

上海交通大学邓小铁 - 金融博弈下的价值学习

香港智能金融科技柳崎峰 - 金融机构从移动时代到智能时代

哈尔滨工业大学刘挺 - 自然语言处理的十个发展趋势

文档介绍

演讲实录

相关会议文档推荐

Hans Uszkoreit

相关会议

哈尔滨工业大学 刘挺 - 自然语言处理的十个发展趋势

哈尔滨工业大学 刘挺 - 自然语言处理的十个发展趋势

文档介绍

演讲实录

相关会议文档推荐

Hans Uszkoreit

相关会议

哈尔滨工业大学刘挺 - 自然语言处理的十个发展趋势

哈尔滨工业大学刘挺 - 自然语言处理的十个发展趋势