随着计算机视觉的技术不断进步,到2017年,深度学习在常见图片的物体识别上已超过人类的识别水平。今年的ImageNet 2017挑战赛也是最后一届了,这无疑标志着一个时代的结束,但也是新征程的开始。接下来计算机视觉会往哪里发展?首先是更加精细的感知,包括物体检测、物体分割、物体跟踪尤其是复杂物体检测,小型物体分割,实时物体跟踪等。更重要的是在认知层面,通过识别物体、动作、属性、环境以及他们之间的关系来进行图像理解。应用包括图像描述,深度场景理解和识别,视频理解等。我会主要讲智影(ZenVideo.cn)上相关的工作,包括视频理解。智影是中国第一个在线的智能视频制作平台,依托于NLP、视频理解和大规模云计算技术,智影云平台能够帮助快速生成短视频,用户只需要输入脚本文字,就可以直接通过云端生成相应的视频内容,自动配音,并且用户可以在线进行编辑和修改。自从7月上线后,智影现在已经被超过1000家自媒体使用,每日生产近600条视频。
浏览5217次
浏览9799次
浏览3262次
浏览4208次
浏览7642次
浏览1597次
2025-01-08 昆明
2025-04-19 南京
2024-12-27 上海
2025-10-23 上海
打开微信扫一扫,分享到朋友圈