本次分享将介绍 Linkedin derived data platform以及其如何帮助 Linkedin更好的管理机器学习的结果数据集。包括 Linkedin机器学习的基本流程,着重于如何将结果数据集应用于线上 application,并阐述原有流程的痛点;介绍 derived data platform的整体设计以及几个关键技术点,例如如何合并批量和实时数据。通过几个实例,例如数据标准化和相关性计算,来介绍 derived data platformr如何存储海量结果数据集,并为线上 application提供高可用,高性能的服务。最后将总结在新平台上线和迁移过程中的一些经验,例如如何进行对用户无感知的迁移。
浏览7444次
浏览1232次
浏览3279次
浏览5274次
浏览4224次
浏览4593次
2025-06-20 深圳
2025-04-19 南京
2025-08-15 上海
2025-05-23 上海
打开微信扫一扫,分享到朋友圈