首页>会议文档 >

KSC视频云 魏代政-视频直播运维难点与解决方案

page:
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案
KSC视频云 魏代政-视频直播运维难点与解决方案

KSC视频云 魏代政-视频直播运维难点与解决方案

所属会议:GOPS 2016全球运维大会 • 北京站会议地点:北京


下载

手机看
活动家APP客户端

扫二维码下载
或点击下载
Android iOS

10636次
浏览次数
GOPS 2016全球运维大会 • 北京站所有文档 韩晓光 - 传统运维VS互联网运维:从哪里来到哪里去? 高级架构师-刘源-大规模分布式存储的开发与实践 云集智造(灵犀) 熊亚军-混合 IT 时代需要什么样的监控系统 中交兴路车联网 许颖维- 中小企业如何优雅地管理多机房服务器账号 七牛云 陈爱珍-七牛百亿级请求量数据处理系统架构演进 腾讯 方锦亮-腾讯大规模集群跨城迁移之术 eBay 方伟-建立基于Kafka的企业级数据传输平台 平安证券 刘宏霞-券商大数据质量保障之道 运维自动化-张乐-持续交付:高效率和高质量可以兼得 蓝鲸 党受辉 - 【从零打造百人级别的DevOps团队】等 光载无限 欧曜伟-分布式监控系统的容器化变迁与 CICD 实践 Google, SRE孙宇聪-Google 运维技术平台与设计思想浅析 Qunar DevOPS叶璐-去哪儿私有云建设和自动化管理 云杉网络 张天鹏-云网络数据分析及应用 陈运维自动化-陈尔冬-第三种运维 迅达云成科技 陈震-云计算资源的全球部署经验 携程 胡俊雅-SaltStack在携程万台服务器上的运维实践 腾讯 洪楷-腾讯游戏运维服务体系 优维科技 王津银 - DevOps运维体系框架与其精益实践 —以运维为始,以运营为终,以交付为桥 乐视 邓良驹-乐视电商云高可用架构与实现 去哪儿网 吕晓旭-去哪儿实时流系统实践 广州尚航 尹璐-高可用性自适应安全网络 京东 赵明-手机京东统一与开放的监控体系构建 ThoughtWorks 金明-建设持续交付容器云平台 IBM马达-PaaS平台中的资源管理及调度 DOM-Toda-A Heart of EXIN DevOps Master 沙盘教练梁定安-凤凰项目沙盘精要 EXIN 国际信息科学考试学会 孙振鹏 - DevOpsDays 即将首次落户中国 优维科技CEO 王津银王津银-持续交付及互联网实践 阿里巴巴 范伦挺-阿里大数据计算平台运维实践 优云 刘东海-运维演进正确之道 - ITIL+DevOps双态运维 微信支付 莫晓东-微信支付数据库管理和优化实践 盛大游戏 胥峰-盛大游戏万台服务器自动化运维实战 微信支付 周汤-微信支付数据库管理和优化实践 金融保险-任明-传统企业运维演进及开源实践 金融保险-张晓诚-平安证券的自动化运维演进 中信银行 周海鹏-“十问”:银行私有云建设若干问题 博云 李亚琼-场景化运维——平台、引擎与自动化 点乐 赵舜东-中小企业 DevOps 实践之路 360 陈思雨&李福-从漏洞组合攻击看运维安全之殇 YY直播 韩方-YY直播安全运维从“0”到“1”的实践 奇虎360 王珂&任言-XSS攻击与企业级的解决方案 金山孙召增-企业内网APM实战 凤凰网 王建新-大型互联网公司与创业公司的 IT 对比分析 首都在线周东波-运维背后的逻辑 HIM陈贻泰-大中型互联网企业 IT 基础架构概览 高效运维 发起人萧田国-DevOps 2.0:重塑运维价值 主会场-Toda-DevOps & TPS - For success your Business 蓝鲸 党受辉 - 遇见蓝鲸,也许是个机会- Google SRE孙宇聪-SRE:Google 运维解密 中国移动王晓征-浙江移动云运维实践 DevOps Master 白皮书,企业 DevOps 的成功之路

文档介绍

主会场上魏代政发表了主题演讲《视频直播运维难点与解决方案》,主要目录:目录:KSC视频云业务介绍、KSC视频云架构、KSC视频云运维难点、全方位监控与巡检、大规模集群管理、容量管理

演讲实录

金山云视频云事业部运维总监魏代政在发表演讲

他指出,优质的云架构是平台的根基和灵魂,金山视频云具备一站式,超融合的解决方案,服务能力方面追求高吞吐和高可靠。监控全面精准、故障快速隔离、科学的容量调度与建设规划,是保障超大规模视频CDN系统持续稳定运行的三大首要任务。

一站式、超融合、高吞吐、高可靠,打造完美视频云解决方案

从解决方案角度,金山视频云具备一站式,超融合的特点,即:从播放SDK到CDN系统,从CDN系统到直播源站,从直播源站到点播源站,在线/离线转码,连麦服务,美颜&动态贴纸等,一应俱全,可以为客户一站式解决所有问题。

与此同时,兼容和友商进行源流互推共享,方便用户整合各家云服务优势达到自身服务质量的极致提升。

从服务能力方面,金山视频云一直秉承高吞吐,高可靠的追求。

而在基础设施建设方面,金山视频云的CDN具备6大三线上层、200+CDN节点、6TB带宽储备,并计划在2017年实现500+节点、10TB带宽储备。在直播源站方面则具备10万路流、5万路实时转码,而且整个架构具备快速水平扩展能力。

从上述数据不难看出,金山视频云的海量流量承载能力,能力的背后是大量的节点和设备,和众多条可用数据链路的冗余。那么,面对如此多的机房、设备以及众多的网络数据流链路,在如此之快的成长和发展速度下,金山视频云是如何保障平台稳定性,如何做到高可靠呢?

魏代政指出,监控全面精准、故障快速隔离、科学的容量调度与建设规划是保障金山视频云服务持续高速发展的三个首要任务。

运维主动出击,将隐患扼杀于萌芽阶段

对于云平台而言,面对超大规模CDN系统,应如何保证平台持续稳定运行呢?在运维方面,需要实现以下目标,即:

l 监控&巡检:全面无遗漏、告警精准数量少、定位问题速度快,发现问题于萌芽;

l 集群机器管理:故障快速隔离、故障修复优先级、全程可控无泄漏;

l 带宽容量管理:容量安全不过载、流量徒增扛得住、满足保底不浪费、容忍节点离线割接、容忍节点故障离线。

保障监控全面精准

金山视频云监控是一个全链路的系统架构,从基础设施到软件服务到用户请求再到用户端上的数据,统统进行了全面收集和整合分析。基于链路监控,可以精准的发现是在全链路的哪个环节上出现了故障,如“鹰眼”般敏锐、精准。

故障快速隔离

CDN是一个超大型的分布式缓存,从设备和网络资源方面都有很大的冗余度,能够容忍单点故障。能精确识别出来的故障(物理机故障,网络故障,软件故障灯),要做到快速隔离,这是快速止损保证服务质量的有效方式。

在大规模节点设备维护方面,金山云CDN有一整套机器全生命周期管理系统,做到机器设备从采购到上线服务,从上线服务到故障离线,从故障离线到修复回归线上的整个机器生命周期全程跟踪,并实现了部分状态转换的自动化。

金山视频云在机器采购、预处理、压测、初始化到机器故障被摘除及故障处理的各个环节中,充分保障机器的各种生命状态的管理和维护。如果出现故障,第一时间进行快速隔离、修复、再利用。各个状态的机器时刻在监控,就像带领士兵打仗一样,高度自动化的盘点前线士兵数量,受伤的士兵数量,及时撤下伤员,快速跟进并治愈伤员再次派上战场,各个环节衔接流畅,处理及时,从而实现机器的高在线率、高出勤率,保证群体总战斗力输出。

科学的容量调度与建设规划

容量管理成功的关键在于容量调度和建设规划。

调度是以带宽容量数据为依据,数据的准确性决定了调度系统的表现是否符合预期,保证容量数据的准确性是做好容量管理和调度的关键。金山视频云对带宽容量数据有多种持续进行的稽核手段,从CDN日志和交换机物理层面采集进行了例行的稽核,进而保障数据的准确性,一旦出现问题立即人工介入干预,及时消除数据噪声,将数据修正,保证调度系统的数据支撑是正确可靠的。

建设规划方面,金山视频云根据中国核心运营商的网络结构特点,结合自身容量数据,按照一定的片区、省份对各个运营商的资源利用率进行分析,产出建设决策,做到片区利用率均衡,每个省份和片区都具备一定的冗余带宽,容忍流量徒增,容忍部分节点因故障或者割接而暂时离线。

在目前阶段,为了保证服务的绝对稳定,金山视频云的调度采用了“自动化方式调度”+“人工干预”的双保险机制,来实现容量安全不过载、流量徒增扛得住、满足保底不浪费、容忍节点离线的目标,随着调度系统的不断优化,目前人工干预已经变得很少。

移动视频云第一平台并非一蹴而就,金山视频云在客户积累中获取经验,在培育市场的同时,不断地提高自身的技术输出能力。作为视频云领域的先行者,金山视频云还将在技术上持续打磨、与时俱进,以技术引领视频行业的革新,将未来“视”界带到今天。


×

打开微信扫一扫,分享到朋友圈