首页 > IT资讯 > 正文

“中国谷歌”挺进硅谷 成立人工智能实验室

它看上去毫不起眼。这幢砖砌小楼坐落于加州库柏蒂诺【注1】,离旧金山大约一小时的车程,边上都是一字排开的各式商铺。走进楼内,映入眼前的是一面加州州旗,一个用硬纸板刻出来的R2-D2【注2】,还有一大堆圣诞饰品——要知道,现在可是都已经四月出头了。

但这幢楼内,同样充满着壮志豪情雄心壮志。这里是百度公司——“中国版谷歌”——希望创造未来的所在。

一月底,坊间流出传闻,说中国的搜索霸主将要创立一所实验室,专攻“深度学习”——这是个新兴的计算机科学领域,其目标是利用计算机软硬件来模仿人脑的行为。几个月后人们发现,百度并不只是在中国大陆建立了一家新研究所而已——它同时也将在硅谷、离苹果公司总部几步之遥的地方,设立一个研究分所。事实上,百度刚刚在库柏蒂诺签下了分所的第一位研究员,并计划在年底前招入更多的人手。

百度将实验室命名为“深度学习研究所”,缩写为IDL。抱着跟谷歌和苹果这样的巨头相似的目的,百度也在探索、开发着能像人类一样学习的计算机系统。“我们有一个非常宏大的梦想,就是希望能够利用深度学习,来模拟人脑的功能,人脑的魔力,还有人脑的智慧”,余凯表示。作为百度公司“基于语音和图像形识别的搜索”的负责人,他刚在不久前来到库柏蒂诺,招入了研究所的那第一位成员。“我们每天都在进步”,他说道。

如果你真的打算跟谷歌真枪实弹地对着干的话,那你怎么着也得去谷歌的后院开家分店才行。“在硅谷,你随时都能凑到一大批最最顶尖的工程师与科学家;谷歌享有的就是这种优势”,余凯说道。百度公司的库柏蒂诺办公室早在一年前就已经悄然开张了;在公司决心攻关深度学习之前,这间办公室就已经在雇用各方面的员工了。

从九十年代到本世纪初的多数时间中,深度学习的相关的研究都发展得不太顺利。当时,人工智能界的发展趋势,是研发能够借助海量数据来求解问题的系统,而非寻求搭建“神经网络”来模仿人脑中更微妙的方面。谷歌采用的搜索引擎就是一个典型的例子——它通过一些各式各样的捷径和技巧取巧,回避了应用深度学习所要面对的挑战。与此同时,这位美国的网络搜索巨头,同样正在将类似的技术移植到它的无人驾驶车辆上。不过,到了今天,深度学习的强势回归,又让谷歌和其它几家科技巨头一样,全力推动着这一领域的研究深入。

谷歌最近招入了乔佛里·辛顿【注3】,深度学习界的教父级人物——而这正是斯坦福大学的吴恩达【注43】,同领域的另一位重量级人物对谷歌极力游说的结果。与此同时,许多公司也在相同的方向上努力探索着:IBM多年以来一直在致力于对人脑进行计算机建模;苹果公司也在iPhone手机的Siri语音识别系统里应用了深度学习的技术;而谷歌则把类似的概念运用到了自家的语音识别系统和谷歌街景之中。


余凯在展示百度的移动终端。(图片来源:阿历克斯·沃什本,《连线》杂志)


尽管如此,百度为了专攻深度学习而筹建一整个实验室的决定,在纽约大学的雅恩·勒昆眼中,还是种“略为大胆的尝试”。作为该领域的先驱之一,勒昆指出该技术的发展尚有很长一段路要走。但就“深度学习研究所”而言,他认为这也是百度的一种手段,用以吸引顶尖人才,让那些富有创造力的工程师们尽情去探索各种“不求产出”的研发创意——这跟谷歌在其神秘的X实验室里孕育出谷歌眼镜之类产品的套路,其实是如出一辙的。

事实上,余凯手下就有一个研究员在参与“百度眼”的开发——而很多人称这款产品为“山寨版”的谷歌眼镜。不过,就目前而言,余凯表示,该实验室的首要任务,还是对深度学习算法的探索。“我们需要专注于一个方向”,他表示。

去年十一月,百度推出了其第一款基于深度学习的语音搜索引擎,并宣称该技术能使误差减少将近30%。对此百度和谷歌、苹果有着相同的看法:类似的改进,将有可能改变人与科技互动的模式与频繁程度。当语音与图像的搜索技术能够像人们期待的那样好用时,我们就不需要再在移动终端那窄小的键盘和屏幕上来回折腾了。

时至今日,当你我在网上搜索产品或者服务的时候,得到的也不过是一串罗列在一起的链接,“然后你就得自己去一页页地浏览那些页面,才能判断它们到底对自己有用没用”,余凯说道。而他想要的,是另一种与此完全不同的体验。

余凯解释道,“我们得从根本上改变整个系统的结构”。这意味着人们需要开发出全新的算法:它们要能够鉴别图像、理解人类的自然语言,并在此基础上解析网络上各种事物间的复杂关系,从而准确地的挑出你所要搜寻的内容。换句话来说就是,我们要开发出能够像人类一样工作的算法。两者唯一的区别是,我们的算法,将比我们自己更为高效


上一篇:LinkedIn利润井喷背后的软件开发模式革命
下一篇:亚马逊云端吞食微软数据

PythonTab微信公众号:

Python技术交流互助群 ( 请勿加多个群 ):

群1: 87464755

群2: 333646237

群3: 318130924

群4: 385100854