2017年12月7-9日,2017中国大数据技术大会(BDTC)在京盛大召开。12月8日,在大数据分析与生态系统论坛,阿里巴巴计算平台事业部高级技术专家徐冬,所做的分享题目是《复杂数据分布的查询优化》,从数据分布的历史和原理开始,介绍我们的思路和解决办法。 他认为数据分布的问题在大数据处理领域由来已久。很不幸,如今流行的大数据处理系统仍然没有很好地解决这个问题。在MaxCompute 2.0全新的优化器中,阿里引入了复杂数据分布,添加了分区剪枝、分布上拉、下推以及分布对齐等优化措施。我们在最新的版本里面已经发布包括HASH和一部分RANGE相关的优化,大家可以在公有云版本很快可以享受到。