滴滴出行盛克华 - 滴滴高性能列式KV存储系统实践

SACC2016 （第八届）中国系统架构师大会所有文档
开九易云拓朱龙春 - 互联网对传统企业应用架构冲击和机遇
5233次
淘宝郑士汉 - Weex架构简介和性能优化实战
3554次
周亚金 - 安卓应用保护技术发展
4873次
小米电视工程师朱辉 - ZRAM那点事pdf
9784次
小米朱辉 - 支持任意数量watchpoin的建议
8622次
学而思赵文杰 - 交互式直播推流编码器的设计
5047次
搜狗甄丽霞 - 基于Kafka-spark streaming的数据处理系统及测试
10715次
蚂蚁金服郑波 - 网商银行金融云的架构之路
4301次
饿了么徐巍 - 饿了么基础设施进化史
4647次
光载无限许开强 - CDN直播系统的优化
972次
搜狗杨剑飞 - 统一数据平台的实践及思考
2719次
网易蜂巢尧飘海 - 网易蜂巢公有容器云架构之路
8185次
超多维郁树达 - 前进的路上，VR有哪些绕不开的坑
10617次
美团点评喻继鹏 - 互联网行业财务系统架构探讨
3086次
阅文集团徐海峰 - 阅文集团自主分布式文件系统
8647次
哈尔滨银行姜岩 - 运维架构调整与运维工厂模式的建立
5402次
百度张建伟 - 百度大数据离线计算平台流式shuffle服务
2787次
深圳瑞赛张平 - 专业化的风控服务平台的技术架构及实践
3064次
魔窗张申竣 - 创业公司的大数据平台选型和进化
5870次
去哪儿网张子天 - Spider-QunarAndroid客户端架构的前世今生
10049次
蜗牛云赵刚 - 京东VRAR实验室在电商VR中的实践
3389次
云计算公司技术专家赵伟 - 负载均衡利器HAProxy功能剖析及部署案例
11005次
中国移动王烨 - 中国移动私有云管理平台架构和实践
2760次
优酷土豆宋慎义 - 为全民直播量身定做流媒体平台
6762次
Linkedin China Engineer Supervisor魏佳 - 图数据库Neo4J的实践之路
3315次
美图魏家富 - 美图公司运维自动化系统架构设计
1143次
阿里巴巴郝豪 - 阿里Android instant run探索与实践
7301次
美团外卖夏华夏 - 架构师的三个基本要求
7830次
爱奇艺谢丹铭 - 爱奇艺业务风控系统
3619次
爱奇艺刘俊晖 - 爱奇艺大数据平台的构建之路
6434次
爱奇艺刘文峰 - 爱奇艺云架构实践优化
9596次
易到用车刘宇 - PHP高性能服务框架架构与实践
8622次
网易刘长伟 - 网易蜂巢Docker研发实践
5212次
刘喆 - 大数据时代AdMaster的运维架构
3917次
去哪儿网路绪清 - 基于大数据的消费信贷平台
6499次
中国移动罗刚毅 - 中国移动异构虚拟化平台统一管理研发与实践
1443次
优酷土豆吕红亮 - 视频精准推荐系统实践
9815次
小米VR团队马坤 - VR技术与展望
5571次
资深云计算架构师马耀泉 - 云计算的高可用实践探索与分享
4366次
袋鼠云宁海元 - 企业级云数据库管控架构设计与实践
5566次
汽车之家欧阳梦南 - 汽车之家移动APP架构演进与性能优化历程
9640次
光载无限欧曜伟 - 光载无限监控体系的变革与演进
7048次
阿里巴巴袁冶平 - 阿里大数据平台发布管理体系
6166次
Hyper.sh 裴彤 - 基于 hyper 容器技术的新一代容器云
3707次
58到家任桃术 - 58到家分布式服务框架
1331次
阿里巴巴桑毅宏 - 互联网公司骨干网规划构
10244次
上汽集团龚瀚申 - 上汽集团基于容器技术的尝试实践
9658次
京东寿如阳 - 京东虚假交易识别系统
6357次
信泰人寿章晨曦 - 数据分发平台的架构设计与实践
6042次
爱可生王伟 - 数据之大，云动未来——传统企业从IT到DT的互联网创新最佳实践
6192次
上交所孙长昊 - 上交所基于容器技术的微服务架构技术实践
9336次
魅族覃军 - 魅族基础系统运维之路示
9059次
美团唐义哲 - 美团业务风控系统构建经验
4073次
腾讯程彬 - 腾讯云数据库CDB技术演进之路
2198次
一点资讯王成光 - 轻量级分布式实时计算框架light_drtc
5479次
京东王大泳 - 京东数据中心网络监控实践
2061次
农银王福强 - 农银人寿新一代核心业务系统云平台实践题
9888次
Intel 王华峰、毛玮、张天伦 - 分布式流式数据处理框架：功能对比以及性能评估
6686次
时速云王磊 - 容器云平台在企业中的运维管理和场景实践
11346次
达乎科技王茜 - SDN对传统网络的变革和价值提升
9148次
搜狐视频李修鹏 - 搜狐视频个性化推荐架构设计和实践
5216次
北京邮电大学李昕 - SDN向左，WAN向右
10972次
蜗牛云李晨光 - VR沉浸式视频在移动平台的优化技术分析
2885次
武汉泰迪智慧科技李成华 - 深度学习在自然语言中的应用
8911次
华胜信泰李海翔 - 数据库引擎技术架构
7704次
360 李纪峰 - 云平台安全架构剖析
8402次
蚂蚁金服李三红 - Java企业应用-性能优化原则，方法与策略
3579次
拍拍贷徐王锦 - 金融行业数据库架构变迁
11268次
京东杨海明 - 京东云的架构实践之路
2949次
神策数据曹犟 - 从日志统计到大数据分析
8313次
饿了么常盛 - 饿了么实时架构演进
10448次
DBI 常艳玲 - 架构师现状调查报告解读
4326次
日志易陈军 - IT运维分析与海量日志搜索分析
5000次
华为陈亮 - Apache CarbonData，实现大数据即席查询秒级响应
1549次
百度外卖师陈霖 - 百度外卖服务化实战
11326次
腾讯微信陈晓鹏 - 微信运维实时监控数据上报及存储设计实践
3222次
雪球单艳蕾 - 雪球运维架构体系探索
3536次
证券董国兴 - 传统金融行业企业架构创新与实践
9659次
腾御安樊付强 - GNU工具链里的漏洞利用缓解技术
3300次
国家工商总局付宏伟 - 工商数据中心架构创新之路
11031次
七牛云何李石 - 七牛融合CDN实践
8165次
宜信侯松 - 大数据全流程平台在互联网金融场景下的实现和借鉴意义
7637次
饿了么张雪峰 - 架构师需要面对的两个【架构】
1508次
Apache HAWQ 简丽荣 - 数据仓库架构的变迁
5288次

滴滴出行盛克华 - 滴滴高性能列式KV存储系统实践

所属会议：SACC2016 （第八届）中国系统架构师大会会议地点：北京


下载


手机看

扫二维码下载
或点击下载 Android iOS

   

9234次
浏览次数

SACC2016 （第八届）中国系统架构师大会所有文档开九易云拓朱龙春 - 互联网对传统企业应用架构冲击和机遇淘宝郑士汉 - Weex架构简介和性能优化实战周亚金 - 安卓应用保护技术发展小米电视工程师朱辉 - ZRAM那点事pdf 小米朱辉 - 支持任意数量watchpoin的建议学而思赵文杰 - 交互式直播推流编码器的设计搜狗甄丽霞 - 基于Kafka-spark streaming的数据处理系统及测试蚂蚁金服郑波 - 网商银行金融云的架构之路饿了么徐巍 - 饿了么基础设施进化史光载无限许开强 - CDN直播系统的优化搜狗杨剑飞 - 统一数据平台的实践及思考网易蜂巢尧飘海 - 网易蜂巢公有容器云架构之路超多维郁树达 - 前进的路上，VR有哪些绕不开的坑美团点评喻继鹏 - 互联网行业财务系统架构探讨阅文集团徐海峰 - 阅文集团自主分布式文件系统哈尔滨银行姜岩 - 运维架构调整与运维工厂模式的建立百度张建伟 - 百度大数据离线计算平台流式shuffle服务深圳瑞赛张平 - 专业化的风控服务平台的技术架构及实践魔窗张申竣 - 创业公司的大数据平台选型和进化去哪儿网张子天 - Spider-QunarAndroid客户端架构的前世今生蜗牛云赵刚 - 京东VRAR实验室在电商VR中的实践云计算公司技术专家赵伟 - 负载均衡利器HAProxy功能剖析及部署案例中国移动王烨 - 中国移动私有云管理平台架构和实践优酷土豆宋慎义 - 为全民直播量身定做流媒体平台 Linkedin China Engineer Supervisor魏佳 - 图数据库Neo4J的实践之路美图魏家富 - 美图公司运维自动化系统架构设计阿里巴巴郝豪 - 阿里Android instant run探索与实践美团外卖夏华夏 - 架构师的三个基本要求爱奇艺谢丹铭 - 爱奇艺业务风控系统爱奇艺刘俊晖 - 爱奇艺大数据平台的构建之路爱奇艺刘文峰 - 爱奇艺云架构实践优化易到用车刘宇 - PHP高性能服务框架架构与实践网易刘长伟 - 网易蜂巢Docker研发实践刘喆 - 大数据时代AdMaster的运维架构去哪儿网路绪清 - 基于大数据的消费信贷平台中国移动罗刚毅 - 中国移动异构虚拟化平台统一管理研发与实践优酷土豆吕红亮 - 视频精准推荐系统实践小米VR团队马坤 - VR技术与展望资深云计算架构师马耀泉 - 云计算的高可用实践探索与分享袋鼠云宁海元 - 企业级云数据库管控架构设计与实践汽车之家欧阳梦南 - 汽车之家移动APP架构演进与性能优化历程光载无限欧曜伟 - 光载无限监控体系的变革与演进阿里巴巴袁冶平 - 阿里大数据平台发布管理体系 Hyper.sh 裴彤 - 基于 hyper 容器技术的新一代容器云 58到家任桃术 - 58到家分布式服务框架阿里巴巴桑毅宏 - 互联网公司骨干网规划构上汽集团龚瀚申 - 上汽集团基于容器技术的尝试实践京东寿如阳 - 京东虚假交易识别系统信泰人寿章晨曦 - 数据分发平台的架构设计与实践爱可生王伟 - 数据之大，云动未来——传统企业从IT到DT的互联网创新最佳实践上交所孙长昊 - 上交所基于容器技术的微服务架构技术实践魅族覃军 - 魅族基础系统运维之路示美团唐义哲 - 美团业务风控系统构建经验腾讯程彬 - 腾讯云数据库CDB技术演进之路一点资讯王成光 - 轻量级分布式实时计算框架light_drtc 京东王大泳 - 京东数据中心网络监控实践农银王福强 - 农银人寿新一代核心业务系统云平台实践题 Intel 王华峰、毛玮、张天伦 - 分布式流式数据处理框架：功能对比以及性能评估时速云王磊 - 容器云平台在企业中的运维管理和场景实践达乎科技王茜 - SDN对传统网络的变革和价值提升搜狐视频李修鹏 - 搜狐视频个性化推荐架构设计和实践北京邮电大学李昕 - SDN向左，WAN向右蜗牛云李晨光 - VR沉浸式视频在移动平台的优化技术分析武汉泰迪智慧科技李成华 - 深度学习在自然语言中的应用华胜信泰李海翔 - 数据库引擎技术架构 360 李纪峰 - 云平台安全架构剖析蚂蚁金服李三红 - Java企业应用-性能优化原则，方法与策略拍拍贷徐王锦 - 金融行业数据库架构变迁京东杨海明 - 京东云的架构实践之路神策数据曹犟 - 从日志统计到大数据分析饿了么常盛 - 饿了么实时架构演进 DBI 常艳玲 - 架构师现状调查报告解读日志易陈军 - IT运维分析与海量日志搜索分析华为陈亮 - Apache CarbonData，实现大数据即席查询秒级响应百度外卖师陈霖 - 百度外卖服务化实战腾讯微信陈晓鹏 - 微信运维实时监控数据上报及存储设计实践雪球单艳蕾 - 雪球运维架构体系探索证券董国兴 - 传统金融行业企业架构创新与实践腾御安樊付强 - GNU工具链里的漏洞利用缓解技术国家工商总局付宏伟 - 工商数据中心架构创新之路七牛云何李石 - 七牛融合CDN实践宜信侯松 - 大数据全流程平台在互联网金融场景下的实现和借鉴意义饿了么张雪峰 - 架构师需要面对的两个【架构】 Apache HAWQ 简丽荣 - 数据仓库架构的变迁

文档介绍



Rockstable是滴滴内部自研的一套高性能分布式KV存储系统，其特点是支持列模式，支持高并发、低延迟、高可用，目前支撑了滴滴内部主要的特征实时存取需求，本次主要介绍其内部的实现原理。主要技术点：分布式kv存储、列式存储、高性能。

演讲实录

大家好，我是滴滴的盛克华，负责滴滴的后台的引擎相关的工作。今天给大家分享的是我们内部使用的KV存储系统，名字叫Rockstable。大概分成四部分，第一个是Rockstable的简介，第二个是用Rockstable系统解决什么样的问题，以及我们为什么要做这样的一套系统，第三个是这个系统目前在公司内部的使用情况，第四个是内部的实现方式，希望能给大家带来一些思路上的提示。演讲大纲如下：
Rockstable是一个分布式的KV存储系统，所以并非一个文件系统。Rockstable支持劣势，这个劣势是非固定的去做劣势的格式的规定，可以随意的加减。
Rockstable系统解决了滴滴后台各种时时特征的需求。这个是最原始的动力也是我们做这个系统的原始出发点。
多更新源;滴滴的业务，主要是做司机和订单的匹配，我们要存储司机每个维度的特征，订单每个维度的特征，以及乘客每个维度的特征，所以都在这里，并且很多特征和数据源都是时时变化更新的。有些数据是司机端上报的，有的是离线挖掘的，有的是业务系统时时写入的，所以数据源使用很多。
　　多使用方;Rockstable是一套非常基础的特征系统，所以依赖这个特征系统使用的业务也很多，最直接的是我们的派单系统。
　　高度稀疏;这个是很多业务场景都遇到同样的问题，批量读写，这个问题很严重，我们是每个时刻对大量的订单大量的司机做匹配的，所以同一时刻要读取大量的K，所以批量是主要的一个使用接口。
　　高并发、低延迟、高可用;这里对性能的要求尤其苛刻，高并发不用讲，低延迟也是非常敏感，如果延迟很直接导致我们分担的慢。
　我们现在的使用情况：访问量在早高峰或者是晚高峰的时候，读取的是大概两千万的KPS，K是一个司机或者是一个订单或者是一个乘客的维度，写入大概是五十万的KPS，所以访问量是非常巨大的。
　　我们希望存储司机很多维的特征，有一些维度在不断的调研，有一些维度特征是有用的，我们需要逐步的加进来，现在是百级别的样子，数据量是三副本，TB级的数据量，为了保证低延迟，存储主要是在内存和SSD里面。
这一张图主要是描绘了我们的总体架构设计。下面的大框是我们内部的实现，上面是我们的应用方，各个APP，这个APP不只是说客户端，是我们的上游的后台服务。蓝色框是接入层，所有的读写从这里接入，橙色框是存数据的地方，是很简单的二层结构，比较特殊的是有一个对立集群。右边有一个存取一些信息的，这个和用的分布式设计是比较类似的。
　　最左边有一个监控系统，右边有一个管理系统。左边虚线是队列集群，做故障处理的，你挂了一台机器，我们写入数据流会导入队列里面，等机器恢复的时候我们要从队列里面恢复数据。
这张图主要是实现概述，讲Rockstable系统有一些什么样的主动特性。
　　最终一致性;支持A副本，这个是根据我们的需求来的，很多系统是要强一致，我看到的大部分的互联网应用里最终一致性是够用了，所以我们采用的是最终一致性。
　　支持表、列结构;我们可以创建表或者是删除表，对不同的业务或者是不同的数据我们建不同的表。这个是列，这个列可以随意的加减，不需要做任何的操作，这样的话我们的业务会更灵活方便，想加一列就会可以加进去的，不用做另外的工作。
　　批量读批量写;也是最基本的。
　　支持TTL;就是我们的生命周期，他也有三个维度，第一个是表级别，这个是我的表设置一天数据只能绑定一天，设置一个小时就绑定一个小时，过期就自动删除，这个表是一天的或者是一个月的，你可以针对K设置一个小时或者是一天，这个K如果是绑定一天，对部分的列设置秒级别或者是分钟级别都可以，所以TTL设置是比较分布的，
　　白名单;出于稳定性的考虑，访问系统的来源有很多，各种各样的业务系统在读取数据，为了保证系统的稳定性做了严格的限制，读写限额，以及白名单的控制。
　　支持MC、THRIFT两种接口;我们以前在系统上线之前我们线上的业务是由MC做的，所以支持他是方便我们上线。THRIFT用的比较广泛的框架，这个用的比较多，所有的劣势操作，批量的读写都在这个接口里实现。
　　批量数据扫描、修复：因为MC的协议是比较简单的，可以支持批量的读，但是没有办法支持批量的写。支持批量数据扫描和数据修复，对数据的维护方而言是相当重要的，我需要知道上T的数据里有哪些错误的数据。
　　数据的持久化;有一些场合数据要求是很高的，有一些数据访问量低，但是他的数据量大，将这些放到磁盘上，这样的话可以利用存储空间支持数据持久化。
　　支持集群间的数据同步;这个也比较重要，但是相对而言用的少一点，我们可以把一个集群的数据时时的或者是手动的，自动导到另外一个集群上去，这样的话我们可以做集群的拷贝或者是做数据的同步。
下面讲集群的一个管理方式，我们集群有接近上千台的机器，这么多的数据，这么的并发在上面，如何管理集群?我们是开发了一些比较丰富的管理工具，最主要的是有一个命令行的管理入口，支持一些管理人的操作，比如说创建，删除，查看表。
数据模型每个表根据ID进行均匀的分片，每个分片存储三个副本，这样的话我们对一个数据有了一个基本的概念，就是一个表，一个复本一个分片，这样的一个TRP组织了一个最小的数据单元，他是一个最小的数据管理的一个模型，他里面包含一定量的KV。
自动平衡是以TRP的力度进行的，如果现在有一百台的机器的集群，我们扩二十台上去，如何扩数据的平衡，我们找到需要迁移的TRP，从原来的机器上每个挑一点TRP往空白的上面迁移，首先把原始的TRP停掉，停了一个以后另外的一个是正常工作的，把这个停了以后就会开始写队列。从原机器往目标机器拷这个数据，拷贝完以后在新的机器上把TRP起动起来，开始消费队列，把数据追平，然后开始访问新的TRP，所有的操作基本上是一个自动的过程。
作为一个时时的线上系统，特别是存储系统，他的稳定性是至关重要的，如果存储系统崩溃了所有的系统就崩溃了，所以我们做了大量的监控建设，基本上一个集群我们有二百多个监控曲线，这里面有非常详细的监控，错误统计，各个环节的耗时，以及集群的示例的统计一些使用情况，各种读写各种MC各种接口等等。
我们做系统最主要的目的是应付高性能的场景，他是需要特别的低延迟，我们最终做的延迟是这样，耗时差不多三个九，在五毫秒以内，性能是非常满意的。
NodeMgr是我们自己内部的一个动态结点管理的工具，这里主要是支持了一些故障的自动摘除与结点的恢复，我们的集群这个层面对外是上百个机器的IP，访问的时候经常会发生IP的故障或者是经常做一些扩容，如果上游不能应付这样的变化的话是非常被动。