针对金融数据的多样性,实时性,和对准确性的要求。Thomson Reuters应用大数据技术整合现有数据的过程中遇到了诸多挑战,并且积累了自己独特的经验。这次演讲将总结一些现有的经验并和听众讨论一些可行性。 • 案例分析,分析现有企业内部对数据处理的挑战。主要针对应用案例的复杂性,进行全面的分析,和方案选择。 • 自动化数据格式转换,如何使用规则定义进行数据的自动化转换。在Spark中,数据转换同时支持Batch & Streaming。 • 半结构化数据的处理,如何在Spark的基础上构建非结构化数据处理的DSL,我们将深入Spark SQL Catalyst的实现并且结合ANTLR构建一种新的编程语言。 • 图数据库的使用案例,如何引入图数据库,并且构建分布式大型图数据库实现。
浏览1233次
浏览1579次
浏览4209次
浏览1348次
浏览10630次
浏览6872次
2025-01-08 昆明
2025-04-19 南京
2024-12-27 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈