腾讯科技讯 7月4日百度AI开大者大会上,百度高级副总裁王海峰上台,开始介绍百度大脑3.0,王海峰表示,百度大脑3.0 的多模态深度语义理解包含视觉、语音、自然语言、数据语义以及多元语义这些因素。
王海峰指出,基于百度大脑的视觉语义化技术,机器可以全面识别视频中内容。如今年世界杯期间,机器可以识别出比赛视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件。进而提炼出结构化语义信息?;谡庋男畔?,既可以完成机器人自动解说,还可以进行精彩片段集锦、以及各种数据统计分析等等。
百度大脑视觉语义化技术还能被运用到无人超市中去。王海峰博士指出,在无人超市等新零售场景中,视觉语义化技术可以准确识别顾客“拿起商品”、“放下商品”、“将商品从A处放到B处”等行为,从而判断用户购买了哪些商品,并在用户离店时通过人脸支付主动扣款。这预示着新的AI技术未来将爆发大规模应用落地场景的可能性。
王海峰开始介绍百度大脑中的语音语义一体化技术,配合WaveNet+拼接 情感语义合成技术,可以大大提高语音识别的流畅度以及自然度。
王海峰表示,百度大脑的深度学习训练,已经阅读了一千亿文章,相当于六万个国家图书馆的容量。同时百度深度学习平台paddlepaddle也迎来的3.0版本。
同时再次介绍了昆仑芯片,指出该芯片具有高性能、高性价比以及易用的特点。并且支持paddlepaddle平台,编程灵活度高并且能够灵活支持深度学习训练和预测。最后王海峰博士指出,当前百度大脑每天被调用的次数超过4090亿次,服务亿万用户。
“百度大脑3.0首次将芯片纳入技术体系,它使百度大脑具备了更完备的软硬一体化能力,带动百度大脑算力爆发式增长。AI芯片还将与百度自主研发的PaddlePaddle深度学习框架深度结合,推动AI行业生态快速发展“,王海峰讲到。
百度大脑每天调用次数超过4千亿次,调用的人中既有AI工程师,也有零“AI”基础的初入门者,还有来自各行各业希望用AI创新业务、为业务转型升级的企业。他们虽然身份不同、目标不同,但都从百度找到了最适合的AI接入方式。