数据流水线上需要运行各种任务,包括执行Hive SQL、MR程序、Python数据处理脚本、导出数据、邮件发送数据等。如何保证这些任务按照依赖关系执行是很大的一个挑战。我们用Python开发的任务调度系统能够自动解决依赖,并且能够按设置优先级来执行任务。同时还能解决了数据恢复及由于上游数据问题需要部分执行的问题。
浏览3060次
浏览1440次
浏览5478次
浏览4280次
浏览7028次
浏览1786次
2025-09-04 广州
2025-09-12 上海
2025-07-09 南京
2025-08-22 深圳
打开微信扫一扫,分享到朋友圈
Text