所属会议:SDCC 2016中国软件开发者大会会议地点:北京
扫二维码下载或点击下载 Android iOS
搜索引擎每天处理几万亿的超链与网页数据,过去多数工作由MapReduce完成,从一篇网页产生到网民能搜索到有天级延迟。 2014年开始,我们对核心搜索架构进行了大规模重构,设计实现了海量实时数据库Tera,并以此为基础,构建了第三代抓取与索引系统,将网页收录延迟降低到分钟级。 核心数据库Tera存储了全网数万亿的链接与网页信息,支撑了每天近十万亿次的实时查询与更新操作,当前已经在github开源。本次议题 主要介绍Tera的设计思想,以及在实现与生产应用过程中的经验与教训。
浏览1464次
浏览1894次
浏览4364次
浏览1556次
浏览10802次
浏览7127次
阿里巴巴
2026-01-16 上海
2026-01-09 深圳
2025-12-17 北京
2025-12-13 上海
打开微信扫一扫,分享到朋友圈