宜信大数据创新中心技术总监郑赟分享了主题为《大数据驱动的在线快速信贷业务实践》精彩演讲。郑赟在演讲中先解释了大数据风控引擎,通过爬虫从互联网获取个人和企业的公开数据,并用知识图谱的方式将其结构化,结合其他数据源,自动分析进件的风险点,并通过搜索引擎技术提供企业和个人的风险数据查询,为人工或者机器决策提供信息。在郑赟看来,在在线快速信贷业务中客户信用评估模型是个难点,因为样本少(相对于广告、推荐系统)、表现特征多,且上述两个层面的模型容易造成拟合。他给出的建议是在特征工程方面要基于原始特征和领域知识总结出新特征,在模型上考虑决策树(早期样本量少、可解释性好)及随机森林(区分度强)。