业务量增加,数据量翻番,需要面对百TB ~ PB级别的数据量,且是结构化数据,同时需要达到毫秒/秒级分析。在这种情况下寻求新的解决方案选型:mpp(Impala)+ mesa的工程实现。这种选型在技术特性上可以支持MySQL、高并发小查询、大查询高吞吐、高容错、列式存储、物化视图、在线表结构修改等特征需求。实施后效果很明显,在演讲中会介绍百度内部使用情况,目前开源的使用情况,并会和GP、Impala+kudu的性能做些对比。
浏览5035次
浏览8919次
浏览4104次
浏览7652次
浏览2910次
浏览8259次
2024-08-23 上海
2024-09-25 上海
2024-07-20 上海
2024-06-28 上海
打开微信扫一扫,分享到朋友圈