如果你見過一個孩子玩拼圖,見過他使勁兒想把某一塊拼圖放到合適的位置,那么以下視頻會給你似曾相識的感覺。視頻中的機(jī)器人也在玩拼圖,在經(jīng)歷了若干次失敗后,最終順利完成了——全靠自己的摸索,并無特定的程序幫忙。
之前的深度學(xué)習(xí)能力已成功提升了(機(jī)器人的)語言、圖像識別能力;加州大學(xué)伯克利分校的研究者們研發(fā)了一種新算法,使機(jī)器人通過練習(xí)和試錯,自己學(xué)會完成任務(wù);這兩種深度學(xué)習(xí)技術(shù)頗為相似。研究者們說它們這種方式與人類學(xué)習(xí)方式更為接近。
在這個視頻中,我們看到機(jī)器人Willow Garage PR2學(xué)習(xí)怎樣玩樂高玩具、學(xué)會完成各種不同的簡單任務(wù),包括開瓶蓋、組裝玩具飛機(jī)、插入鞋楦等。
當(dāng)機(jī)器人離開工廠,進(jìn)入更為嘈雜、充滿未知數(shù)的環(huán)境之中,如家庭、辦公室時,這些能力對他們至關(guān)重要。當(dāng)然這也是“Rosie”和“杰森” (電影《摩登家庭》人物)一直以來的夢想;要實現(xiàn)這一夢想,機(jī)器人首先要學(xué)會觀察環(huán)境、學(xué)會適應(yīng)變化、掌握許多技能;最理想的是:每一種新環(huán)境機(jī)器人都能 適應(yīng),不用重寫程序。
“重點是,機(jī)器人面對一種新事物時,我們不用為它重新編程?!痹擁椖款I(lǐng)導(dǎo)者之一,加州大學(xué)伯克利分校教授Pieter Abbeel 說,“寫入一個程序,告訴機(jī)器人怎樣學(xué)習(xí),機(jī)器人使用同一個程序?qū)W習(xí)完成我們交給它的所有新任務(wù)。”
另一個關(guān)鍵是:機(jī)器人能閱讀分析海量數(shù)據(jù)。
BRETT,全稱叫做“消滅枯燥工作的伯克利機(jī)器人”,能通過攝像頭記錄其周邊環(huán)境,每次嘗試(任務(wù))后給自己的表現(xiàn)打分;嘗試某個任務(wù)時,它的神經(jīng)網(wǎng)絡(luò)(92000個神經(jīng)元)會判斷任務(wù)完成與否——神經(jīng)系統(tǒng)不停地計算、工作,直至機(jī)器人找到解決辦法。
雖然這一技術(shù)與語言認(rèn)知能力的技術(shù)類似,但實現(xiàn)前者的難度更大。
“在一個事先沒有預(yù)設(shè)好的3D環(huán)境中行動,(對機(jī)器人)是一個全新的挑戰(zhàn),”博士研究生Chelsea Finn說?!皼]有明確的方向指引、沒有案例告知怎樣解決問題,沒有類似于語言和圖像識別程序那樣的解決方案?!?/p>
BRETT像大多數(shù)機(jī)器人一樣,行動緩慢;但如果給它一點提示(如任務(wù)開始、結(jié)束階段的協(xié)助),10分鐘之內(nèi)它就能學(xué)會完成一項新工作;如果沒有任何幫助,它完成任務(wù)的時間則會延長到3個小時左右。
研究團(tuán)隊希望未來幾年內(nèi)使機(jī)器人的表現(xiàn)更出色。隨著計算機(jī)程序處理大數(shù)據(jù)的能力加強(qiáng),而且數(shù)據(jù)庫容量擴(kuò)大,(機(jī)器人)完成復(fù)雜任務(wù)指日可待。
“讓我們的機(jī)器人學(xué)會打掃房間、洗熨衣服,我們還有很長的路要走。”Abbeel說。“但初步結(jié)果顯示,掌握了深度學(xué)習(xí)能力,對于機(jī)器人從零開始到學(xué)會完成復(fù)雜任務(wù),有革命性的作用。未來5到10年內(nèi),我們也許將親眼見證機(jī)器人學(xué)習(xí)能力的驚人變化?!?/p>