腾讯科技讯 7月4日百度AI开发者大会上,百度高级副总裁王海峰上台,开始介绍百度大脑3.0,指出多模态深度语义理解是百度大脑3.0最大的变化。
百度大脑3.0 的多模态深度语义理解包含视觉、语音、自然语言、数据语义以及多元语义这些因素。
王海峰博士指出,基于百度大脑的视觉语义化技术,机器可以全面识别视频中内容。如今年世界杯期间,机器可以识别出比赛视频中的球员、裁判、球、以及球门、球场线等人、物和场景。那么机器如何看球?用一句话概括就是,多模态深度语义理解。不仅让机器听清、看清,更要深入理解其背后的含义,从而更好地支撑各种应用。
基于百度大脑的视觉语义化技术,机器可以全面识别视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件。进而提炼出结构化语义信息?;谡庋男畔ⅲ瓤梢酝瓿苫魅俗远馑?,还可以进行精彩片段集锦、以及各种数据统计分析等等。