應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

更接近人類對世界的理解:研究人員讓AI擁有“想象力”

2021-07-19 14:54 cnBeta.COM

導(dǎo)讀:假設(shè)你想創(chuàng)建一個生成汽車圖像的AI系統(tǒng)。理想情況下,你可以為算法提供一些汽車的圖像,這樣它就可以從多個角度生成各種顏色的汽車。

據(jù)外媒報道,先想象一只橙色的貓,現(xiàn)在想象一下這只貓只長了黑色的皮毛,然后再想象一只貓在中國的長城上昂首闊步。這一系列的想想會讓你大腦中神經(jīng)元的快速激活根據(jù)你之前對世界的認(rèn)識想出各種各樣的圖片。換言之,作為人類,很容易想象一個具有不同屬性的物體。

然而盡管深度神經(jīng)網(wǎng)絡(luò)在某些任務(wù)上取得了跟人類相當(dāng)或超過人類的表現(xiàn),但計算機在人類特有的“想象力”技能方面仍在做著苦苦的掙扎。

現(xiàn)在,南加州大學(xué)(USC)一個由計算機科學(xué)教授Laurent Itti、博士生Yunhao Ge、Sami Abu-El-Haija和Gan Xin組成的研究團隊開發(fā)出了一種人工智能,這種AI能夠通過使用類似人類的能力來想象出一個具有不同屬性的從未見過的物體。

“我們受到人類視覺泛化能力的啟發(fā),試圖在機器上模擬人類的想象力,”該研究的論文首席作者Ge說道,“人類可以通過屬性(如形狀、姿勢、位置、顏色)來分離他們所學(xué)到的知識,然后將它們重新組合以想象一個新的物體。我們的論文試圖用神經(jīng)網(wǎng)絡(luò)來模擬這一過程。”

AI的泛化問題

假設(shè)你想創(chuàng)建一個生成汽車圖像的AI系統(tǒng)。理想情況下,你可以為算法提供一些汽車的圖像,這樣它就可以從多個角度生成各種顏色的汽車。

這是AI長期追求的目標(biāo)之一:創(chuàng)造出能進(jìn)行外推的模型。這意味著,只要給出幾個例子模型就應(yīng)該能夠提取出基本的規(guī)則并將它們應(yīng)用到它以前沒有見過的大量新例子中。但機器通常是在樣本特征上訓(xùn)練的,如像素,而不會去考慮對象的屬性。

想象力的科學(xué)

在這項新研究中,研究人員試圖用一種叫做消糾纏(disentanglement)的概念來克服這個限制。消糾纏可以用來產(chǎn)生深度偽造。Ge指出,通過這樣做,“人們可以合成新的圖像和視頻來用另一個人的身份代替原來的人,但卻能保持原來的運動?!?/p>

類似地,新方法采用一組樣本圖像--而不是像傳統(tǒng)算法那樣一次采集一個樣本--并挖掘它們之間的相似性以實現(xiàn)所謂的“可控解消糾纏表征學(xué)習(xí)”。

然后,它重新組合這些知識以實現(xiàn)“可控的新圖像合成”或可以稱之為想象力的東西?!边@類似于我們?nèi)祟惖耐茢啵寒?dāng)一個人從一個物體看到一種顏色時我們可以很容易地把它應(yīng)用到其他物體上,通過用新的顏色替換原來的顏色。研究小組通過利用他們的技術(shù)生成了一個包含156萬張圖像的新數(shù)據(jù)集,這可能有助于該領(lǐng)域未來的研究。

理解這個世界

雖然“消糾纏”并不是一個新概念,但研究人員表示,他們的框架可以跟幾乎任何類型的數(shù)據(jù)或知識兼容。這擴大了應(yīng)用的機會。如將種族和性別相關(guān)知識從等式中移除敏感屬性從而創(chuàng)造出更公平的AI。

在醫(yī)學(xué)領(lǐng)域,它可以幫助醫(yī)生和生物學(xué)家發(fā)現(xiàn)更多有用的藥物以將藥物的功能從其他屬性中分離出來,然后重新組合從而合成新的藥物。賦予機器想象力還可以幫助創(chuàng)造更安全的AI,如讓自動駕駛汽車想象并避免在訓(xùn)練中看不到的危險場景。

Itti說道:“深度學(xué)習(xí)已經(jīng)在許多領(lǐng)域展示了卓越的性能和前景,但這往往是通過淺層模仿發(fā)生的,它沒有對使每個對象獨特的單獨屬性擁有更深入的了解。這種新的分離方法,第一次真正釋放了AI系統(tǒng)的新想象力從而讓它們更接近人類對世界的理解。”