2017年12月7-9日,2017中国大数据技术大会(BDTC)在京盛大召开。12月9日,在数据库论坛,犹他大学计算机系副教授,目前担任ACM TODS和IEEE副编辑的李飞飞,分享了《Towards Building Interactive and Online Analytical Systems》(译《建立互动和在线分析系统》)的主题分享。 支持大数据交互查询和分析,是许多数据驱动应用程序的重要需求,但在大数据时代,基于IO优化的外部存储器模型由于高时延不再有效。新系统(如Spark,Impala)将更依赖于商用集群的内存计算来提供横向扩展的交互式数据分析。在大时空数据的背景下,李飞飞提出的Simba系统,提供了一个集群上的可扩展和高效的内存分析。Simba扩展了Spark SQL引擎,通过SQL和DataFrame API(例如,空间连接,knn连接,轨迹)支持丰富的查询和分析语义。通过设计一个有效的查询优化器,利用其索引支持和查询优化。
浏览5167次
浏览4129次
浏览6260次
浏览7441次
浏览11268次
浏览4356次
2025-06-20 深圳
2025-04-19 南京
2025-08-15 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈