
當(dāng)前位置 > 首頁(yè) > 新聞動(dòng)態(tài)
谷歌虛擬腦技術(shù)計(jì)算:人工智能的新突破
這一看似高深的技術(shù)以大數(shù)據(jù)處理和海量計(jì)算為基礎(chǔ),為人工智能提供計(jì)算服務(wù),使得越來(lái)越計(jì)算成為可能。在今年夏天該技術(shù)因谷歌的貓臉設(shè)別而廣為了解,近日《麻生理工創(chuàng)業(yè)技術(shù)》上刊登了一篇文章,詳細(xì)介紹了該技術(shù)的進(jìn)展,以下是文章全文。
今年夏天,谷歌在人工智能領(lǐng)域獲得突破。谷歌發(fā)明了一個(gè)軟件,只需要看一下YouTube上的視頻,就能學(xué)會(huì)識(shí)別貓和人,還有其他東西。這項(xiàng)技術(shù)根據(jù)腦細(xì)胞的運(yùn)作方式建立,并已開(kāi)始讓谷歌的產(chǎn)品變得更聰明。而語(yǔ)音識(shí)別也成了這一軟件的首個(gè)盈利服務(wù)。
谷歌的學(xué)習(xí)軟件基于對(duì)一組相互連接的腦細(xì)胞的模擬。這些腦細(xì)胞可以彼此溝通,互相施加影響。當(dāng)把這樣一個(gè)神經(jīng)網(wǎng)絡(luò)暴露在數(shù)據(jù)面前,不同神經(jīng)元之間的關(guān)系會(huì)發(fā)生改變。這樣,網(wǎng)絡(luò)就會(huì)發(fā)育出對(duì)某個(gè)類別的輸入數(shù)據(jù)作出特定反應(yīng)的能力。通過(guò)這種方式,網(wǎng)絡(luò)“學(xué)”到了一些東西。
在過(guò)去的幾十年里,神經(jīng)網(wǎng)絡(luò)已被使用在機(jī)器學(xué)習(xí)的領(lǐng)域,例如國(guó)際象棋軟件或臉部識(shí)別。谷歌的工程師找到了可以利用更多計(jì)算力量的方法,這是之前做不到的。他們制造出的神經(jīng)網(wǎng)絡(luò)可以不需要人的幫助,而且還很穩(wěn)定,可以走出實(shí)驗(yàn)室展示階段,進(jìn)入商業(yè)化過(guò)程。
谷歌的神經(jīng)網(wǎng)絡(luò)可以自己決定什么類型的數(shù)據(jù)需要特別注意,什么模式特別重要。例如,哪些顏色和特別的形狀是軟件正在識(shí)別的物體的重點(diǎn)?所以它無(wú)需人類使用者來(lái)做決定。
谷歌現(xiàn)在正使用神經(jīng)網(wǎng)絡(luò)來(lái)更準(zhǔn)確地識(shí)別語(yǔ)音,對(duì)于谷歌的智能手機(jī)操作系統(tǒng)安卓來(lái)說(shuō),這一功能變得越來(lái)越重要,對(duì)谷歌在蘋果上的搜索應(yīng)用來(lái)說(shuō)也是如此。我們?cè)谛拚e(cuò)誤單詞方面改進(jìn)了20%到25%,”谷歌的語(yǔ)音識(shí)別領(lǐng)導(dǎo)文森特•凡豪克(Vincent Vanhoucke)說(shuō),“這意味著更多的人會(huì)得到無(wú)錯(cuò)的完美體驗(yàn)。”目前,神經(jīng)網(wǎng)絡(luò)只對(duì)美式英語(yǔ)有效,不過(guò)凡豪克表示谷歌正在其他方言和語(yǔ)言上作出相似的嘗試。
其他一些谷歌的產(chǎn)品也會(huì)從新型學(xué)習(xí)軟件中受益。例如,谷歌的圖片搜索工具可以更好地理解圖片的內(nèi)容,而不依賴周圍的環(huán)境。而谷歌的無(wú)人駕駛汽車和嵌入移動(dòng)計(jì)算機(jī)的眼鏡也能依靠軟件來(lái)更好的理解現(xiàn)實(shí)世界數(shù)據(jù)。這項(xiàng)新技術(shù)在今年6月登上了很多媒體的頭條。那時(shí),谷歌的工程師發(fā)表了實(shí)驗(yàn)結(jié)果。他們從YouTube的視頻中獲得了1000萬(wàn)張圖片,并把這些圖片扔到了模擬腦細(xì)胞中,為了完成這一工作,幾千臺(tái)計(jì)算機(jī)的1萬(wàn)6千個(gè)處理器連續(xù)不斷地工作了10天。
“大部分人只用一臺(tái)機(jī)器來(lái)建模,但我們希望用一個(gè)很大的神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行實(shí)驗(yàn),”杰夫•迪安(Jeff Dean)說(shuō),他是谷歌幫助領(lǐng)導(dǎo)研究的工程師。“如果你能擴(kuò)大模型和模型處理數(shù)據(jù)的規(guī)模,你就能理解更細(xì)微的差別和更復(fù)雜的特征。”
通過(guò)這種方式產(chǎn)生的神經(jīng)網(wǎng)絡(luò)更加靈活。“這些模型可以更好地理解環(huán)境,”迪安說(shuō),他給出了一個(gè)語(yǔ)音識(shí)別世界的例子。例如,如果谷歌系統(tǒng)認(rèn)為它聽(tīng)到一個(gè)人說(shuō)“我要吃一個(gè)荔枝,”但是“荔枝”這個(gè)詞卻沒(méi)聽(tīng)清楚,它會(huì)從過(guò)去的經(jīng)歷中進(jìn)行猜測(cè)。因?yàn)椤袄笾Α笔且环N水果,會(huì)在和“蘋果”或“橙子”相同的語(yǔ)境下使用。
迪安介紹說(shuō),他的研究團(tuán)隊(duì)還在測(cè)試可以同時(shí)理解圖片和文字的模型。“如果你輸入‘鼠海豚’這幾個(gè)字,它就會(huì)給你鼠海豚的照片,如果你提供一張鼠海豚的照片,它就會(huì)給你‘鼠海豚’這幾個(gè)字。”
下一步,研究人員會(huì)讓同一個(gè)模型學(xué)習(xí)詞匯的聲音,可以把不同的數(shù)據(jù)關(guān)聯(lián)起來(lái)。這些數(shù)據(jù)可以讓語(yǔ)音識(shí)別從視頻中收集到額外的線索,也可以讓谷歌的無(wú)人駕駛汽車提升性能,因?yàn)樗蓭椭@些汽車結(jié)合不同來(lái)源的數(shù)據(jù)(例如對(duì)附近障礙的激光掃描和汽車引擎的數(shù)據(jù)),更好地理解周圍環(huán)境。
蒙特利爾大學(xué)(University of Montreal)的教授喬舒亞•本希奧(Yoshua Bengio)表示,谷歌在神經(jīng)網(wǎng)絡(luò)上的工作讓我們朝著人工智能的終極目標(biāo)邁進(jìn)了一小步:匹配動(dòng)物甚至人類的智慧。本希奧研究的也是類似的機(jī)器學(xué)習(xí)技術(shù)。“這條路會(huì)通向更加廣義的人工智能,如果你不能把大量關(guān)于這個(gè)世界的知識(shí)放到機(jī)器里,你就不可能得到一個(gè)智能的機(jī)器,”他說(shuō)。
本希奧還表示,谷歌的神經(jīng)網(wǎng)絡(luò)事實(shí)上和哺乳動(dòng)物的視覺(jué)皮層運(yùn)作方式相似。視覺(jué)皮層屬于腦部的一部分,負(fù)責(zé)處理視覺(jué)信息。“結(jié)果是,[谷歌的]學(xué)習(xí)網(wǎng)絡(luò)的特性和腦部用來(lái)發(fā)現(xiàn)物體是否存在的方法相似。”
不過(guò),他很快補(bǔ)充說(shuō),即使是谷歌的神經(jīng)網(wǎng)絡(luò)也比腦部要小得多,而且也不能進(jìn)行很多對(duì)智能來(lái)說(shuō)必要的活動(dòng),例如根據(jù)外部世界收集來(lái)的信息進(jìn)行推理。
迪安同樣也很謹(jǐn)慎地不把他構(gòu)建的有限的只能同任何生物腦相比。但是他還是忍不住指出,在某些競(jìng)賽中,谷歌的神經(jīng)網(wǎng)絡(luò)卻能擊敗人類。
他說(shuō),“在一些視覺(jué)任務(wù)中,它比人類的表現(xiàn)更好。”迪安舉了一個(gè)分類標(biāo)記的例子。在這個(gè)任務(wù)中,門牌號(hào)碼會(huì)出現(xiàn)在谷歌街景汽車拍攝的照片中,這一過(guò)程一般來(lái)說(shuō)都會(huì)交給很多人來(lái)干。
“它們開(kāi)始使用神經(jīng)網(wǎng)來(lái)決定[圖片中的]某一塊區(qū)域是否是門牌號(hào)碼,”迪安說(shuō),它們表現(xiàn)得比人還好。這只是一個(gè)小勝利,但卻凸顯了人工神經(jīng)網(wǎng)絡(luò)和你腦袋里的神經(jīng)網(wǎng)差距是多么的巨大。“很可能這并不那么讓人激動(dòng),不過(guò)計(jì)算機(jī)卻永遠(yuǎn)不會(huì)厭倦,”迪安說(shuō)。真實(shí)的智慧卻會(huì)厭倦。