所属会议:SDCC 2016中国软件开发者大会会议地点:北京
扫二维码下载或点击下载 Android iOS
搜索引擎每天处理几万亿的超链与网页数据,过去多数工作由MapReduce完成,从一篇网页产生到网民能搜索到有天级延迟。 2014年开始,我们对核心搜索架构进行了大规模重构,设计实现了海量实时数据库Tera,并以此为基础,构建了第三代抓取与索引系统,将网页收录延迟降低到分钟级。 核心数据库Tera存储了全网数万亿的链接与网页信息,支撑了每天近十万亿次的实时查询与更新操作,当前已经在github开源。本次议题 主要介绍Tera的设计思想,以及在实现与生产应用过程中的经验与教训。
浏览1268次
浏览1610次
浏览4222次
浏览1366次
浏览10647次
浏览6906次
阿里巴巴
2025-06-20 深圳
2025-04-19 南京
2025-08-15 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈