PerfXLab澎峰科技联合创始人张先轶发表《ARM嵌入式系统的DNN性能优化》主题演讲。张先轶介绍,目前主要从事三个方面的工作,首先是深度学习,包括服务器+嵌入式终端,框架:PerfNet(基于mxnet)和性能库:PerfDNN;其次是PerfCV,基于CV类功能(cvt_color,resize);最后是对OpenBLAS的介绍。张先轶首先为我们介绍了什么是BLAS,即Basic Linear Algebra Subprograms,基本线性代数子程序,包括BLAS3级:矩阵-矩阵,BLAS2级:矩阵-向量,BLAS1级:向量-向量。OpenBLAS几乎支持所有主流的CPU处理器和常见的操作系统,兼容性很高。BLAS性能优化流派支持自动调优和手工核心汇编。
浏览3075次
浏览4110次
浏览6219次
浏览7401次
浏览11235次
浏览4325次
2025-01-08 昆明
2025-04-19 南京
2024-12-27 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈