最近几年来,百度在技术研发方面投入巨资,特别是在人工智能和深度学习技术上,并引入了包括吴恩达在内的大批硅谷精英。经过长期的研发,百度研究院正在将包括语音识别、人脸识别在内的人工智能和深度学习技术逐步运用到更多百度产品中。吴恩达表示,一个典型的学术项目需要采用2000小时的音频数据进行语音识别训练,而百度的数据宝藏则意味着他能使用100000个小时。很多人低估了95分和99分的准确率之间的差异,“这不仅仅是一个4%的提高,而是偶尔使用它与一直在使用它的区别”。
目前,百度在人工智能方面的研究已经位居全球一流水平,与Facebook、Google等顶尖公司并驾齐驱。在人工智能研发中,真实用户的行为数据是非常重要的素材。百度在加州桑尼韦尔的实验室已研发出具有模仿人类思维功能的软件,所需的训练数据从百度在线视频和音频输出“宝库”中获得。目前,百度的深度学习技术除了可以优化其广告和搜索已提高点击率,也可以对几乎所有带字幕的新闻片段的音频和视频进行识别,再将识别结果与百度视频和爱奇艺站内的所有视频内容进行比对,从而找到相对应的视频内容。“
在语音识别领域,百度目前的技术水平已经领先业界。由于汉语语音识别的进展出现了一个特别的挑战,即同音异义词的数量和上下文对特定词语理解的重要性,百度将很快推出深度语音应用,运用了百度的深度学习技术,其功能将类似于苹果Siri的语音识别软件。
2013年加盟百度的吴恩达之前在Google工作期间建立了深度学习项目谷歌大脑,。加入百度之后,吴恩达领导百度研究院及深度学习实验室对人工智能领域进行了大量研究。吴恩达表示,智能手机用户的单指输入的痛苦时代应该成为过去,所有这一切都将会被一个合理精确的、袖珍的电子版智能大脑所取代。
“整个世界都进入了移动时代,但没有人为其设备创造出一个易用的交互接口,很快你可以只是大声说出‘能在我回家之前把食物送到我家吗?来叫份外卖了。” 吴透露,百度已利用深度学习算法来预测其数据中心硬盘故障,已经为数据中心的运行节省了约270万美元(1700万人民币)。
尽管机器学习和人类学习的方式之间仍然存在着巨大的差距,但吴恩达并不畏惧。对于人工智能的商业化,吴恩达表示,“毫无疑问,人工智能将会创造出巨大的经济价值,还将继续创造巨大的进步。”