IBM公司和美國麻省理工學(xué)院(MIT)宣布,將聯(lián)合創(chuàng)建“激發(fā)大腦多媒體機器理解實驗室(BM3C)”,旨在使人工智能可以像人一樣看和聽。
人們在觀看棒球賽時,很容易就能將投手和投球區(qū)土墩區(qū)別開,甚至能預(yù)測下個投球是弧線球還是快球,但目前仍沒有機器能領(lǐng)會這些對人類來說非常簡單的任務(wù),IBM和MIT的科學(xué)家希望改變這一現(xiàn)狀。
據(jù)美國《基督教科學(xué)箴言報》20日報道,他們將聯(lián)合創(chuàng)建BM3C開展相關(guān)研究,讓機器能像人一樣看、聽和解讀所看到的事物,而且這一項目會持續(xù)多年。
該實驗室是IBM大力推進人工智能發(fā)展的多個合作計劃中的最新一項。目前,有很多科研團隊正在從事讓機器“像人一樣思考,甚至在某些方面超過人類”的研究。
此前,MIT的其他研究團隊已在計算機預(yù)測和理解方面取得了進步。比如,今年6月,計算機科學(xué)和人工智能實驗室(CSAIL)的科學(xué)家宣布,他們通過向機器展示600個小時來自YouTube的視頻和電視節(jié)目片段,教會了它預(yù)測人如何打招呼——通過握手還是擁抱,準確率為43%;而人類實驗者的準確率為71%。2015年有報道稱,MIT的另外兩名研究人員制造出了“數(shù)據(jù)科學(xué)機器(DSM)”,能在無人幫助的情況下發(fā)現(xiàn)數(shù)據(jù)模式并挑選出相關(guān)的數(shù)據(jù)點。
盡管如此,教機器像人一樣看和聽目前還無人做到??萍疾┛蚑echCrunch的德溫·寇德威解釋說,問題在于人類的視線和聲音命令跨越多個認知規(guī)則:人類首先需要發(fā)現(xiàn)物體,然后建立它們之間的關(guān)系,并憑直覺獲得物理規(guī)則,諸如此類,而這些事情我們的大腦尤其擅長。
由于人類思維已掌握了這些技能,研究人員計劃基于真實的事情,在虛擬的神經(jīng)網(wǎng)絡(luò)上對機器視覺建模。他們預(yù)計,機器視覺系統(tǒng)可能會對教育、娛樂、健康等產(chǎn)業(yè)產(chǎn)生巨大影響。