crash 率是客户端质量红线。作为移动客户端质量最核心的指标,如何快速暴露、发现、定位、修复对解决线上 crash 尤为关键。 最初我们的 crash 监控系统比较落后,数据更新不及时,日志没有符号化,定位问题不准确,客户端灰度发布的崩溃率需要到第二天才看得到等等,无法满足我们对客户端质量把控的要求,所以我们根据自身的情况,打造了一个更好的系统。 我们通过实时数据处理,及时发现问题并报警;对 crash 将崩溃信息符号化,结合机器学习,更智能准确的将长尾 crash 聚类定位,将聚类结果通过系统分配到相应 BU 及开发者;与内部任务系统、hotfix 系统联动,快速修复上线后实时跟踪修复效果,大大提高了线上 crash 修复率。美团将此系统和机制将原来线上 crash 率由千分位降低至万分位,质量处于行业领先的水平。 本 topic 主要分享的就是我们在开发这个系统时的探索与实践。
浏览4726次
浏览11628次
浏览3068次
浏览1447次
浏览882次
浏览1753次
2025-09-04 广州
2025-09-12 上海
2025-07-09 南京
2025-08-22 深圳
打开微信扫一扫,分享到朋友圈
Text