张胜誉演讲《个性化推荐和资源分配在金融和经济中的应用》张胜誉,现任香港中文大学计算机系副教授,同时担任清华大学,上海交通大学,新加坡国立大学,上海财经大学等高校访问教授。主要研究方向包括人工智能,增强学习,资源分配,量子计算等方面的算法与复杂性分析,及其在经济和金融科技方面的应用。张胜誉教授本科毕业于复旦大学数学系,硕士毕业于清华大学计算机系人工智能实验室,师从应明生教授,博士毕业于普林斯顿大学计算机系,师从于姚期智教授。后在加州理工学院计算机系及量子信息中心做博士后研究。担任Theoretical Computer Science等期刊的编委。在STOC/FOCS/SODA/ICALP/ICML/QIP等会议上发表论文二十余篇。
谢谢大会的邀请!我今天想谈一点个性化推荐和资源分配在金融和经济中的应用。
金融领域的人工智能
首先我想说一下个人对人工智能进入金融领域的比较有趣的几个类别的总结。
第一类是AI的技术服务 ,比如机器人客服,或者是财务报表的自动生成和分析,还有基于生物特征的识别。这些应用可以让企业降低成本,提高效率和准确率。
第二类是金融产品或者是金融服务的个性化推荐 ,以及寻找优质的潜在客户。比如说这张图是一个大型国有银行首页上对个人理财产品的推荐。这个列表很长,我只是列出了其中的前面一部分。这里可以看到列表中有关于银行收益率、起购金额等等不同的特征,可供每个用户进行选择。
另一个例子是财经新闻网站推送相关新闻,这里也可以看到这份昨晚的手机截图中的第三个新闻跟我们这个大会的主题有很强的关系。在金融推荐中,我们希望能够根据用户的浏览行为、个人特征、过往的消费和借贷记录等,为其推荐用户最可能感兴趣的产品或服务。有一些数据,即使本身看起来和金融并没有直接关系,也可能对金融个性化推荐有很大的帮助。
第三类是分配定价 ,比较常见的场景有P2P网贷,拼车,合租和其他共享经济的形式。因为需要决定把什么样的人和什么样的物品分派到一起,所以就应该考虑如何分配和定价的问题。共享经济预计会在七、八年内占到经济总量一半以上,所以这部分的研究显得越来越重要。
第四类是投资管理 ,AI可以帮助提供更好的一些量化投资和管理,这里会涉及到算法交易,风险管理,舆情分析等。
第五类是关于防伪的 ,比如说银行和电商怎样做反欺诈。
最后一类是关于产品的增强 ,这里相对来说提到的稍微少一点,但是我觉得这可能会是下一步非常有趣的一类应用,比如设计更具个体差异化的保险产品,以及过一会我会谈及的一些方向。
现在简单讲一下这六类里面其中两类中我最近做的一点小工作。
智能金融 · 个性化推荐
第一类是关于个性化推荐的情况。我们刚才已经看到过的,有理财产品或者是金融类新闻的每天推送的情况。我们知道,对于不同的用户来说,可能关注点是不一样的,甚至有时候用户自己都不知道,自己的风险承受能力怎样,自己到底希望要一个怎样的预期年化收益率。但是我们依然希望通过观察用户的点击历史,慢慢地学到用户潜在的一些特性参数。这是一个(像刚才梦迪提到的)增强学习的过程,其中需要处理所谓的“Exploration Exploitation Tradeoff”:要在推荐一些确定知道适合该用户的,和推荐一些相对未知但可能更适合一些新的(理财产品),这两者之间找到恰当的平衡。
再有一些其他的场景,比如说金融类的新闻推荐的时候就会遇到一些更麻烦的问题。新闻由于其本身的特性,更新得特别快,推送一个过时的新闻是没有意义的。另外在移动端,推荐显示的一般是一个新闻列表,这样就会有一个反馈非常少的问题。比如说我第一屏推20个,不是这20个所有的反馈我都能拿到。我可能看到的是用户点击了第二个、第六个,但是第6个之后发生了什么事情就完全不知道了,可能第7、8个新闻用户看了标题不感兴趣所以就没点,也可能看完第6个就关掉app了,第7、8个他根本连标题都没有看。这种对列表的推荐和反馈信息会跟以前传统的情景很不一样。
有一类办法能够一定程度上解决这种冷启动(cold start),或者是目标的变化非常迅速的情况,就是用强化学习里Contextual Multi-Armed Bandit的算法。我们去年做的一个结果是,如果你做T次这样的推荐,平均来看,每一次你离最优解的只相差1/√T,也就是说在对用户隐藏参数和未来信息都不确定的情况下,我们的算法仍然会非常接近于最优推荐。
稍微讲一点这里的细节。我们这里的模型是说,假设你有一个可以执行的Action的集合,在每一轮的时候这个Action的集合可以比如根据来的用户不同而不一样。这个Action就是一个你要推荐的有序列表(ordered list)。当用户看到这个列表以后,就会从前往下一个一个去检查,然后会在一个地方停止了,而不再检查后面的项目。这里我们并不知道在哪里停止了,我们能拿到的反馈只是用户在哪里点击过了。
有时在其他场景中有不只点击的反馈,比如App推荐,你会看到用户下载行为;电商的产品推荐,你会看到用户购买行为;不一样的场景会有不同的反馈。但是无论那种反馈,我们看到以后需要根据这些信息,来决定下一步怎样做。我们用后悔度(Regret)来衡量算法的有效性:在整个的T轮推荐里面,我们算法的行为,和如果我们知道所以隐含参数的情况下应该选择的最优行为之间的差别。我们没有办法展开很多的细节,只能说我们的结果是在T轮中,我们的Regret可以控制在√T这么大。后来,我们又进行了一系列的延伸,能够处理多个点击的情况,非线性点击率期望的情况,和结合用户间相似度的方法等。
智能金融 · 分配定价
现在我们再来谈谈另一个专题——共享经济。简单地说,共享经济就是多个人分享一个物品。衣食住行里面,衣和食可能暂时难于共享,但是住和行共享还是比较常见的,比如说住可以是合租公寓,行可以是拼车。这里一般的模型是每个人对物品有不同的效用函数。比如对于公寓来说,有的人喜欢朝南的,有的喜欢有独立卫生间的等等;对租车来说,如果当前的乘客离某个司机比较近,那么对于乘客来说,那个车的效用更大。
如果是多人同时共享,涉及的就不仅是人和物品之间的匹配问题,还有人和人之间的匹配问题。比如,在共享公寓的情况下,两个人是否作息一致,业余爱好一致;如果是车的话,两个人是不是有相近的起止点等,这些都决定了两人的匹配度。
对于共享经济来说,一个关键点问题是怎样分配和定价。这里需要考虑的往往不仅仅是一个社会总效用的问题,还有一个社会公平和稳定性的问题。在合租公寓的情境下,我们在去年的一个结果中发现,即使不用考虑效率和公平之间的平衡,单单考虑最大化社会效率本身,在一个最基本的模型下,都是NP-hard的问题,所以,基本是没有办法有效时间找到的。
另一方面,即使我们只是想要公平而忽略社会效率的话,也是无法做到无嫉妒分配方案的。但是好在我们给出了一个算法,可以很快的找到一个解,既达到最优解至少2/3的社会效率,又可以拥有交换稳定性。也就是说,一方面最有效和最公平即使单独都很难获得,另一方面我们却可以同时达到比较公平和比较有效。今年,这个工作又拓展到了能解决在线输入的情况。
我们最近还考虑了拼车问题。出租车公司实时收到大量的拼车需求和司机的位置,那么问题就是如何进行人车匹配及定价。我们的结果是总等待时间最少是一个NP-hard的问题,但是我们可以找到一个2.5倍的近似最优解。这个问题还有很多研究的维度,目前正在进行。
智能金融 · 产品增强
最后我想讲一点最近遇到一些很有趣的AI和金融的结合点。一个是用AI进行驾驶预警,就是在车里装一个面向司机的摄象头,然后实时监控司机的行为,当发现司机困了时,后台会有一个人工服务,进行提醒,并告诉司机最近的服务区在哪里。
另一个是,通过收集司机的各种驾驶数据,给出一个评价体系,给司机打一个分,告诉他最近的驾驶习惯好不好。有趣的是这些公司真的发现,在他们不停的反馈下,很多司机的驾驶行为得到了不停的改善,驾驶越来越安全。反过来和保险公司结合,改善的分数可以被用于降低车险。
还有一个就是有的保险公司开始做一件有趣的事。在买一个健康险后,通过每天记录你运动的步数,来不断对保费进行微调,通过降低保费来鼓励健康运动。
最后几句:前两天联想说“让世界充满爱(AI)”,我想今天这个论坛基本谈的是要让AI充满金融。我的希望是不管是AI还是“爱”,在我们让人工智能进入到金融的时候,希望AI的作用不仅仅是降低成本、提高效率,增加利润,而且能帮助企业建立一个更加公平透明的机制,给个人提供一个更加合理的理财结构,促进一个更加安全的出行环境,和鼓励一个更加将健康的生活方式。
我的分享就到这里,谢谢大家。
浏览5720次
浏览1866次
浏览11334次
浏览6366次
浏览10030次
浏览8578次
2025-01-08 昆明
2025-04-19 南京
2024-12-27 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈