华为大数据设计部部长、Apache Carbondata PMC Committer李昆在主题演讲《CarbonData——面向交互式分析的索引文件格式》在演讲中对比了当前几大存储主流技术的优劣。首先是NoSQL,其速度快,只能通过Key访问,一键一值,适合实时应用对接,不适合分析型应用。第二是并行数据库(Parallel Database),它采用细粒度控制并行计算,适合中小规模数据分析(数据集市),但缺点是扩展能力有上限、查询内容错能力弱,不适合海量数据分析(企业级数仓)。另一个是Search Engine,适合多条件过滤及文本分析,但无法完成复杂计算,且数据膨胀较大 ,需要专用语法,难以迁移。最后为SQL on Hadoop,它适合海量数据计算,不足是仍然使用为批处理设计的存储,可用场景有限。
浏览3102次
浏览4128次
浏览6260次
浏览7439次
浏览11267次
浏览4355次
2025-06-20 深圳
2025-04-19 南京
2025-08-15 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈