香港浸会大学褚晓文 - 基于GPU的性能建模与分布式深度学习框架评价

2017中国大数据技术大会（BDTC）所有文档
中科院研究员刘康 - Event Extraction from Texts
3260次
中国移动（苏州）杨希 - 研究垃圾短信大数据自动识别的新方法
2893次
微软亚洲研究院刘铁岩 - 机器学习的大数据思辨
11941次
微软亚洲研究院谢幸 - 结合跨平台异构数据的推荐系统
4679次
新加坡国立大学 Michael Franklin - Big Data Software：Whats Next
4697次
宜信公司张京磊 - 小微企业的大数据风控模型和架构实践
2476次
云知声AI Labs 刘升平 - 知性会话：基于知识图谱的人机对话系统方法与实践
9228次
中国光大银行田江 - AI，距离我们还有多远？
10340次
中国科学院陈熙霖 - 三驾马车驱动人工智能
6332次
中国科学院刘翟 - 病原基因组学与进化_部分1
1620次
中国科学院刘翟 - 病原基因组学与进化_部分2
6474次
中国民生银行牛新庄 - 大数据在金融行业的应用
7674次
中科院王元卓 - 大数据教学与人才培养
6513次
中科院陈胜 - RepChain——轻量许可链的实现和应用实践
2926次
华东师范大学钱卫宁 - 大数据与人工智能——兴起与启示
9488次
华中科技大学金海 - 内存计算：挑战，现状，经验_部分1
2809次
华中科技大学金海 - 内存计算：挑战，现状，经验_部分2
8624次
巨杉郝大为 - 金融海量影像数据管理
2517次
巨杉彭旸 - 金融级分布式数据库发展
4370次
科大讯飞谭昶 - 用人工智能理解人、服务人_部分1
7316次
科大讯飞谭昶 - 用人工智能理解人、服务人_部分2
2366次
科大讯飞谭昶 - 用人工智能理解人、服务人_部分3
6333次
旷视科技(Face++) 张驰 - AI+大数据，为场景重新赋能
5906次
美国犹他大学李飞飞 - Towards Building Interactive and Online Analytical
7649次
南京天数倪岭 - SkyIntelligent——工业大数据科学云平台实践
5134次
青云QingCloud 凌辉 - 金融企业双核心架构转型
8855次
清华大学舒继武 - 大数据时代存储系统若干变化的思考_部分1
10817次
清华大学舒继武 - 大数据时代存储系统若干变化的思考_部分2
1631次
趣链邱炜伟 - 自主可控联盟区块链 ——技术、系统及应用
4826次
实验宝盒张广军 - 便携式实验宝盒助力大数据教学
10485次
涛思数据陶建辉 - 工业大数据的基础：时序数据库的现状与未来
6468次
腾讯罗韩梅 - 腾讯Docker云平台GaiaStack
2230次
微博彭冬 - 微博广告生态体系及核心架构
7965次
AdMaster 刘喆 - 互联网数字营销广告数据管理平台应用
1362次
CCF大数据专家委员会潘柱廷 - 本年度TOP 10大数据应用最佳案例获奖名单
7724次
ThoughtWorks中国区智能服务业务总经理史凯 - Deeplearning Scala——开源深度学习框架思考与实践_部分1
3781次
ThoughtWorks 史凯 - Deeplearning Scala——开源深度学习框架思考与实践_部分2
11036次
ThoughtWorks 史凯 - Deeplearning Scala——开源深度学习框架思考与实践_部分3
3883次
UCloud 王冬冬 - “CBA”（Cloud，Bigdata,AI）探索和实践
1127次
阿里巴巴徐冬 - 复杂数据分布的查询优化
3408次
阿里云曹龙 - 阿里云大规模结构化云存储HBase架构特性解析
8053次
澳大利亚昆士兰大学周晓方 - Panel：大数据是否还是人工智能的基础？
3239次
百度沈健 - AI时代的数据解决方案
9471次
百度程敏 - 人工智能领域数据处理解决方案
1634次
北京大学邹磊 - 基于图的海量知识图谱数据管理
9285次
滴滴罗李 - 滴滴实时计算平台在运营监控方面的应用
3181次
对外经济贸易大学曹淑艳 - “数据科学与大数据技术”专业课程体系与教学环节探讨
6447次
高等教育出版社张龙 - 新工科联盟助力大数据人才培养_部分1
3195次
高等教育出版社张龙 - 新工科联盟助力大数据人才培养_部分2
10838次
公安部第三研究所黄道丽 - 从数据合规到网安法的全面遵从
8208次
华东师范大学钱卫宁 - 区块链的五张面孔：一种可信数据库的观点
10949次

香港浸会大学褚晓文 - 基于GPU的性能建模与分布式深度学习框架评价

所属会议：2017中国大数据技术大会（BDTC）会议地点：北京


下载


手机看

扫二维码下载
或点击下载 Android iOS

   

12336次
浏览次数

2017中国大数据技术大会（BDTC）所有文档中科院研究员刘康 - Event Extraction from Texts 中国移动（苏州）杨希 - 研究垃圾短信大数据自动识别的新方法微软亚洲研究院刘铁岩 - 机器学习的大数据思辨微软亚洲研究院谢幸 - 结合跨平台异构数据的推荐系统新加坡国立大学 Michael Franklin - Big Data Software：Whats Next 宜信公司张京磊 - 小微企业的大数据风控模型和架构实践云知声AI Labs 刘升平 - 知性会话：基于知识图谱的人机对话系统方法与实践中国光大银行田江 - AI，距离我们还有多远？中国科学院陈熙霖 - 三驾马车驱动人工智能中国科学院刘翟 - 病原基因组学与进化_部分1 中国科学院刘翟 - 病原基因组学与进化_部分2 中国民生银行牛新庄 - 大数据在金融行业的应用中科院王元卓 - 大数据教学与人才培养中科院陈胜 - RepChain——轻量许可链的实现和应用实践华东师范大学钱卫宁 - 大数据与人工智能——兴起与启示华中科技大学金海 - 内存计算：挑战，现状，经验_部分1 华中科技大学金海 - 内存计算：挑战，现状，经验_部分2 巨杉郝大为 - 金融海量影像数据管理巨杉彭旸 - 金融级分布式数据库发展科大讯飞谭昶 - 用人工智能理解人、服务人_部分1 科大讯飞谭昶 - 用人工智能理解人、服务人_部分2 科大讯飞谭昶 - 用人工智能理解人、服务人_部分3 旷视科技(Face++) 张驰 - AI+大数据，为场景重新赋能美国犹他大学李飞飞 - Towards Building Interactive and Online Analytical 南京天数倪岭 - SkyIntelligent——工业大数据科学云平台实践青云QingCloud 凌辉 - 金融企业双核心架构转型清华大学舒继武 - 大数据时代存储系统若干变化的思考_部分1 清华大学舒继武 - 大数据时代存储系统若干变化的思考_部分2 趣链邱炜伟 - 自主可控联盟区块链 ——技术、系统及应用实验宝盒张广军 - 便携式实验宝盒助力大数据教学涛思数据陶建辉 - 工业大数据的基础：时序数据库的现状与未来腾讯罗韩梅 - 腾讯Docker云平台GaiaStack 微博彭冬 - 微博广告生态体系及核心架构 AdMaster 刘喆 - 互联网数字营销广告数据管理平台应用 CCF大数据专家委员会潘柱廷 - 本年度TOP 10大数据应用最佳案例获奖名单 ThoughtWorks中国区智能服务业务总经理史凯 - Deeplearning Scala——开源深度学习框架思考与实践_部分1 ThoughtWorks 史凯 - Deeplearning Scala——开源深度学习框架思考与实践_部分2 ThoughtWorks 史凯 - Deeplearning Scala——开源深度学习框架思考与实践_部分3 UCloud 王冬冬 - “CBA”（Cloud，Bigdata,AI）探索和实践阿里巴巴徐冬 - 复杂数据分布的查询优化阿里云曹龙 - 阿里云大规模结构化云存储HBase架构特性解析澳大利亚昆士兰大学周晓方 - Panel：大数据是否还是人工智能的基础？百度沈健 - AI时代的数据解决方案百度程敏 - 人工智能领域数据处理解决方案北京大学邹磊 - 基于图的海量知识图谱数据管理滴滴罗李 - 滴滴实时计算平台在运营监控方面的应用对外经济贸易大学曹淑艳 - “数据科学与大数据技术”专业课程体系与教学环节探讨高等教育出版社张龙 - 新工科联盟助力大数据人才培养_部分1 高等教育出版社张龙 - 新工科联盟助力大数据人才培养_部分2 公安部第三研究所黄道丽 - 从数据合规到网安法的全面遵从华东师范大学钱卫宁 - 区块链的五张面孔：一种可信数据库的观点

文档介绍



香港浸会大学计算机科学系副教授褚晓文第二个演讲，他带来了题为《基于GPU的性能建模与分布式深度学习框架评价》的演讲，褚晓文表示深度学习框架已广泛部署在计算能力强大但价格昂贵的GPU服务器和集群上，这是因为目前GPU的算力可以满足深度学习对于计算的越来越高的要求，而计算是深度学习的关键。但GPU虽然计算能力很强，但内存的延迟和带宽瓶颈大大拖慢了计算的效率。因此在设计计算框架时，通常采用多线程、内存Hierarchy、HBM等方式。褚晓文介绍了一个分析性能的Roofline Model，并介绍了如何通过算法提升计算框架性能的方法，然后，褚晓文介绍了如何选择深度学习的硬件和软件平台以及如何优化这些深度学习的框架，并比较了目前最先进的几个分布式深度学习框架，即Caffe、CNTK，MXNet、Torch和TensorFlow在不同的硬件平台，包括单GPU，多GPU和GPU集群的表现。然后介绍了三个流行的卷积神经算法：即矩阵计算、基于傅立叶变换的算法和Winograd-base Convolution。最后，褚晓文介绍了他们的深度学习计算框架性能评价研究。并认为，在GPU的性能飞速发展的情况下，IO的优化、通讯时间的缩短对提升计算框架的性能非常关键。

Michael Franklin

University of Chicago ACM Fellow

了解更多 >

香港浸会大学 褚晓文 - 基于GPU的性能建模与分布式深度学习框架评价

香港浸会大学 褚晓文 - 基于GPU的性能建模与分布式深度学习框架评价

文档介绍

相关会议文档推荐

Michael Franklin

相关会议

Title

香港浸会大学褚晓文 - 基于GPU的性能建模与分布式深度学习框架评价

香港浸会大学褚晓文 - 基于GPU的性能建模与分布式深度学习框架评价