PerfXLab澎峰科技联合创始人张先轶发表《ARM嵌入式系统的DNN性能优化》主题演讲。张先轶介绍,目前主要从事三个方面的工作,首先是深度学习,包括服务器+嵌入式终端,框架:PerfNet(基于mxnet)和性能库:PerfDNN;其次是PerfCV,基于CV类功能(cvt_color,resize);最后是对OpenBLAS的介绍。张先轶首先为我们介绍了什么是BLAS,即Basic Linear Algebra Subprograms,基本线性代数子程序,包括BLAS3级:矩阵-矩阵,BLAS2级:矩阵-向量,BLAS1级:向量-向量。OpenBLAS几乎支持所有主流的CPU处理器和常见的操作系统,兼容性很高。BLAS性能优化流派支持自动调优和手工核心汇编。
浏览3102次
浏览4128次
浏览6260次
浏览7439次
浏览11267次
浏览4355次
2025-06-20 深圳
2025-04-19 南京
2025-08-15 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈