

























数据流水线上需要运行各种任务,包括执行Hive SQL、MR程序、Python数据处理脚本、导出数据、邮件发送数据等。如何保证这些任务按照依赖关系执行是很大的一个挑战。我们用Python开发的任务调度系统能够自动解决依赖,并且能够按设置优先级来执行任务。同时还能解决了数据恢复及由于上游数据问题需要部分执行的问题。
浏览3140次
浏览1556次
浏览5765次
浏览4364次
浏览7128次
浏览1905次
2026-01-16 上海
2026-01-09 深圳
2025-12-17 北京
2025-12-13 上海
打开微信扫一扫,分享到朋友圈