首页>会议文档 >

阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践

page:
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践
阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践

阿里巴巴 陈立波——机器学习在大规模服务器治理复杂场景的实践

所属会议:CNUTCon 全球运维技术大会2017会议地点:上海


下载

手机看
活动家APP客户端

扫二维码下载
或点击下载
Android iOS

2825次
浏览次数
CNUTCon 全球运维技术大会2017所有文档 京东 赵玉开——京东物流系统自动化运维平台技术揭密 麻袋理财 王耀——麻袋理财安全与合规建设 海纳云计算 邹均——区块链和可问责服务 浙江大学 才振功——容器环境下的智能运维技术研发与实践 UCloud 叶理灯——容器与Serverless架构实践 苏宁云商 王志强——苏宁大数据平台运维实践 腾讯 吴树生——腾讯TB级别的海量日志监控平台 腾讯 尹烨——腾讯游戏容器云平台的演进之路 百度 王栋——为什么说AIOps是未来,百度的思考与实践 携程 王潇俊——携程容器云优化与实践 腾讯 管鹤鸣——运维+,腾讯游戏海量运营的催化剂 阿里巴巴 林昊(毕玄)——从自动化到智能化的阿里运维体系 Hypernetes & Kubernetes Maintainer倪朋飞——多租户Kubernetes实践:从容器运行时到SDN PingCAP 邓栓——分布式数据库系统TiDB在Kubernetes平台的自动化运维实践 冰鉴科技 朱清——风控系统在容器化时代的实践 华为 黄强——华为使用Docker支持系统容器的优化实践 百度 曹轩——基于日志trace的智能故障定位系统 好买财富 王晔倞——基于资产配置业务场景下的全链路监控平台 宜信 张真——AIOps的核心技术之一:任务机器人如何在金融运维,运营中落地 才云科技 赵慧智——Kubernetes与AI相结合架构、落地解析 华为 杜军——Kubernetes在大规模场景下的service性能优化实战 阿里巴巴 张磊(宗超)——阿里巴巴大数据运维实践 阿里巴巴 宋健(宋意)——阿里巴巴基础运维平台实践 百度 李玉明——百度运维大数据存储平台设计与实践 VMware 张海宁——采用Harbor开源企业级Registry实现高效安全的镜像运维

文档介绍

我们今天面临的问题,云、支付和交易的程序通过虚拟化打散在百万级的服务器上,任何一次硬件故障都可能影响到重要的业务。 面对如此庞大的基础设施:百种机型、万种应用、百万服务器、千万部件,再加上不同业务对故障的敏感程度不一致,传统的运维方法受到了极大地挑战,海量告警无法及时处理、脏数据影响定位、批量问题如何提炼。本专题主要分享在无高质量样本的情况下,通过关联分析和异常检测算法,构建算法闭环。自动迭代,让批量问题的预测精度不断提高。打通故障定位和装机系统,提供从发现->定位->跟踪->修复的一站式解决方案。产品上线以来,在数据能覆盖的场景下,实现了100%的发现率。

×

打开微信扫一扫,分享到朋友圈