魅族服务器规模从数百到数千,系统运维在这个过程中也多碰到许多问题和挑战,主要介绍我们如何通过标准化、自动化、数据化由运维变运营的过程以及对未来精细化运营的规划,并讲重点讲述flyme 运营成本体系。
魅族运维平台高级架构师覃军以魅族运维架构为基础,向大家进行了精彩的分享。
魅族近几年发展迅猛,经统计,2015年应用商店拥有超过100万款应用,应用总下载量超过 100亿,营收能力同比增长12倍,从这些数据就不难想象魅族运维的压力是非常巨大的,魅族服务器规模也从2011年的个位数增长到今天的数千,无一不凸显出魅族的发展之迅猛。覃军提到,魅族主要从质量、效率、成本以及安全四个方面的理念来进行运维方面的工作。
据覃军介绍,魅族的运维工作大致可以分为四个阶段:远古时代(2011-2011.12)、石器时代 (2012.1-2014.6)、青铜时代 (2014.7-2015.12)以及铁器时代 (2016.1)。并简单的对每个阶段进行了分析并对近几年所出现的问题从几个方面进行了回顾总结:
●基础设施规划(业务爆发式增长)
IDC迁移,从单个变为多个,建设两地三中心从而提高业务可用性。在IDC方面要保留足够的机柜预留资源,从而保证快速部署需求。在去IOE方面,建设以KVM为基础的魅族云平台,引入了Docker容器平台,实现了微服务。
●监控告警与定位 (及时发现与定位)
能够及时的进行告警定位,并根据告警系统进行分级,通过不同的途径来告知用户。自动化方面能够自动添加监控设备,根据CMDB业务树进行巡检,保证监控覆盖率BI告警,提高了运维人员的工作效率。
●成本控制
监控系统和容量管理平台相结合并通过容器服务化来提高资源使用率。在供应商管理方面引入多家厂商来提高厂商竞争力和服务质量。建立内部营收Flyme内部结算体系。
●业务同质化与差异性(维护成本)
覃军认为说到运维必须要提标准化和规范性,在标准化方面魅族做到了OS标准化、硬件标准化、软件标准化、架构标准化、组件标准化以及协议标准化。魅族运维在规范行方面做到了日志规范以及部署规范等几方面。
●手工重复操作,依赖人(效率)
利用运维的自动化和平台化达到快速交付的要求,通过上线流程、标准化打包、自助发布、灰度发布等来提高运维效率。
● 预案
覃军提到在预案方面,魅族正在争取做到异地双活,快速切换措施,并相应做一些专线切换演练。
随后覃军针对魅族的运维系统、监控系统等展开了一一介绍。并对魅族的运营现状做了简单的分享。
最后对魅族系统运维未来的发展方向做了简单的介绍,他讲到魅族未来要基于自己的私有云平台、开发平台以及大数据一起为魅族业务进行服务,并从监控自动化、运维自动化、流程管理以及安全管理等几个方面来保证业务的服务质量。
覃军老师的精彩分享对广大听众来讲很是受用,让大家对运维系统有了更深一步的了解,此外美图运维总监魏家富、日志易CEO成军、阿里巴巴资深运维工程师袁志平以及哈尔滨银行科技部副总姜岩等行业专家纷纷从行业的痛点热点以及自身独特的见解方面做了精彩分享,赢得了广大与会听众的共鸣。
浏览7433次
浏览5253次
浏览4216次
浏览7657次
浏览9599次
浏览1401次
2025-01-08 昆明
2025-06-20 深圳
2025-04-19 南京
2025-08-15 上海
打开微信扫一扫,分享到朋友圈