技術(shù)
導(dǎo)讀:AI是如何打開(kāi)這位年輕獨(dú)立游戲開(kāi)發(fā)者的新世界,他又給AI帶來(lái)了什么?
接通微信語(yǔ)音后,手機(jī)里傳來(lái)年輕雀躍的聲音——“嗨您好,我是大谷”。就這樣,我們與這位旅居紐約的90后AI修復(fù)師、獨(dú)立游戲開(kāi)發(fā)者、獨(dú)立藝術(shù)家,進(jìn)行了一場(chǎng)越洋對(duì)話。
相隔12個(gè)小時(shí)的時(shí)差,北京時(shí)間的早上10點(diǎn),紐約城已結(jié)束一天喧囂、正邁進(jìn)萬(wàn)籟俱寂的夜晚。盡管如此,電話那頭大谷的聲音依然十分有活力,并且不吝嗇分享每一件作品的整個(gè)制作過(guò)程?!捌鋵?shí)我可以講一下這個(gè)是怎么做的……”讓人感覺(jué)他可以充滿精力地講幾個(gè)小時(shí)。
最近幾個(gè)月,這個(gè)28歲的北京小伙憑借一個(gè)“AI修復(fù)百年前老北京”的視頻“火出圈”,B站217萬(wàn)的播放量、沖上微博熱搜都還在其次。從5月份發(fā)布的那條視頻起,大谷的B站、微博粉絲數(shù)目日漸增多,有涌來(lái)的熱情關(guān)注者在評(píng)論里稱(chēng)贊他——“給大佬跪了”。
▲百年前的北京城AI修復(fù)前后效果對(duì)比(作者-大谷)
這位留有一撮小胡子的年輕人就此成為許多人眼中的“寶藏男孩”。
而對(duì)這一切,他也不無(wú)意外,“(AI修復(fù)北京城視頻發(fā)布前)我只是覺(jué)得可能一些老北京人會(huì)有共鳴,但我沒(méi)想到大家都這么有共鳴。”他說(shuō)。
在今年5月8日的視頻爆火之前,他已經(jīng)在B站發(fā)布了92支視頻。我們不禁好奇,這支爆火的“AI修復(fù)老北京的視頻”創(chuàng)意來(lái)自哪里?背后有什么特別的故事?AI是如何打開(kāi)這位年輕獨(dú)立游戲開(kāi)發(fā)者的新世界,他又給AI帶來(lái)了什么?
記者有幸獲得與大谷對(duì)話的機(jī)會(huì),并帶著這些疑問(wèn),走近這位旅居紐約的北京小伙。
▲大谷(全名:胡文谷)
一、央視點(diǎn)贊的90后AI修復(fù)師
瀏覽大谷在他的B站頻道“大谷的游戲創(chuàng)作小屋”發(fā)布的92支視頻可以發(fā)現(xiàn),過(guò)去七八年間,這位北京小伙分享的內(nèi)容大多為繪畫(huà)教程、作曲教程等。大谷介紹,他開(kāi)始接觸AI修復(fù)的時(shí)間是2019年年底,“AI修復(fù)百年前的北京城”是他的首個(gè)老片修復(fù)作品。
“AI修復(fù)老北京”原片是經(jīng)過(guò)加速處理的黑白默片,由一位加拿大人拍攝。一天,大谷在瀏覽YouTube時(shí),偶然發(fā)現(xiàn)了人民日?qǐng)?bào)上傳的這支視頻。
當(dāng)視頻中百年前的人物與鏡頭發(fā)生對(duì)視,大谷頗有感觸,“百年前這些人確實(shí)在這片華夏大地上生活過(guò),讓我有一種穿越時(shí)空的感覺(jué)”。于是,大谷忍不住技癢,想要嘗試用AI技術(shù)“還原”一個(gè)更加真實(shí)的北京城。經(jīng)過(guò)約7天的修復(fù),就有了視頻中的效果。
▲“AI修復(fù)百年前北京城 ”視頻片段
所謂“百聞不如一見(jiàn)”,長(zhǎng)袍馬褂、胡同門(mén)樓……10分鐘的視頻呈現(xiàn)出的是老北京最原汁原味的風(fēng)光,也勾起許多人的歷史情懷。目前,這支視頻的B站播放量保持在217萬(wàn)之多。
另外,當(dāng)大谷把視頻時(shí)間軸拉到正常的時(shí)間流速后,更多細(xì)節(jié)浮現(xiàn)了出來(lái)。大谷說(shuō):“比如你能看到有躲在柱子后頭偷看鏡頭的人,或者有的人手里抱著個(gè)啥之類(lèi)的,特別有意思?!?/p>
以這支視頻作為起點(diǎn),大谷完成了一系列AI修復(fù)老片作品,均引起人們的喜愛(ài)。
比如,通過(guò)B站對(duì)接,大谷與央視新聞進(jìn)行接洽,聯(lián)合投稿了“AI修復(fù)百年前北京城2.0”,著重展現(xiàn)民俗禮樂(lè)、地?cái)偨匈u(mài)等老北京的街頭風(fēng)貌。大谷還用AI技術(shù)為1958年北京電視臺(tái)(即中央電視臺(tái)前身)首次開(kāi)播的畫(huà)面成功上色,獲得央視主持人稱(chēng)贊“這是生命的色彩”。
▲“AI修復(fù)百年前北京城2.0”視頻片段
再比如,大谷修復(fù)了一段約百年前上海時(shí)裝秀的視頻,有博學(xué)的關(guān)注者在評(píng)論里指出,視頻的主人公之一很有可能是宋美齡的同學(xué)施惠珍。
▲“AI修復(fù)約百年前上海時(shí)裝秀”視頻片段,視頻主人公或?yàn)槭┗菡?/p>
在B站,大谷將他的AI修復(fù)系列作品收納在名為“歷史的彼岸”的專(zhuān)輯里。每段視頻,都呈現(xiàn)著一段曾真實(shí)發(fā)生過(guò)的歷史,有人在評(píng)論中感慨:“黑白的看著像另一個(gè)世界,彩色看著才覺(jué)得他們活生生地存在著?!?/p>
這些像變魔術(shù)一般的修復(fù)效果,大谷是怎么實(shí)現(xiàn)的?大谷向智東西分享了他的整個(gè)制作過(guò)程:
大谷制作的“AI修復(fù)百年前北京北京城”視頻主要使用了DAIN、DeOldify和ESRGAN三個(gè)開(kāi)源項(xiàng)目,幫助他分別完成視頻的補(bǔ)幀、上色、擴(kuò)增分辨率。整體框架的流程則主要參考了波蘭AI博主Denis Shiryaev在社交媒體上分享的修復(fù)歐美老片經(jīng)驗(yàn)貼。
1、補(bǔ)幀算法-DAIN
大谷介紹,DAIN算法運(yùn)行的原理是,先獲取視頻深度信息、檢測(cè)出物體遮擋情況。然后,從相鄰像素收集上下文信息,來(lái)完成層次特征學(xué)習(xí)。最后,基于上述信息生成視頻幀。
2、上色算法-DeOldify
DeOldify基于GAN(生成對(duì)抗網(wǎng)絡(luò))訓(xùn)練,后者也是DeepFake技術(shù)常用的神經(jīng)網(wǎng)絡(luò)模型。
GAN由一個(gè)生成網(wǎng)絡(luò)和一個(gè)判別網(wǎng)絡(luò)組成,學(xué)習(xí)過(guò)程中,生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)通過(guò)相互博弈,生成逼真的圖像,即生成網(wǎng)絡(luò)隨機(jī)為一幀圖像上色,讓判別網(wǎng)絡(luò)判斷這張圖片的逼真程度,繼而根據(jù)判別網(wǎng)絡(luò)給出的反饋不斷提高“上色”能力,最終生成顏色逼真的圖像。
3、擴(kuò)分辨率算法-ESRGAN
ESRGAN算法同樣基于GAN模型,利用生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)的相互博弈,實(shí)現(xiàn)畫(huà)面的超分辨率重建。
除了對(duì)AI技術(shù)“出神入化”的應(yīng)用,我們也不禁開(kāi)始好奇,為這些老片“賦予生命”的大谷身上,還有哪些驚喜?
二、不想做AI的游戲開(kāi)發(fā)者不是好作曲家
“用AI修復(fù)打開(kāi)一道歷史的大門(mén)。”
大谷本名胡文谷,1991年北京生人,翻開(kāi)大谷的職業(yè)履歷會(huì)發(fā)現(xiàn),他開(kāi)發(fā)過(guò)游戲、制作過(guò)動(dòng)畫(huà)、給藝術(shù)裝置編過(guò)曲、參與過(guò)紀(jì)錄片的AI修復(fù)……有趣的是,在B站和微博的簡(jiǎn)介欄中,他對(duì)自己的介紹則分別有“音樂(lè)人大谷Spitzer”、“程序員里最會(huì)畫(huà)畫(huà)的作曲家”、“游戲開(kāi)發(fā)者”……
▲大谷作品集
提起這些定義,他笑出了聲:“那些(簡(jiǎn)介)都是(在中國(guó)人民大學(xué)就讀藝術(shù)管理學(xué)專(zhuān)業(yè))大一大二時(shí)寫(xiě)的,現(xiàn)在我的主業(yè)還是游戲開(kāi)發(fā)、作曲和跟朋友合作一些藝術(shù)項(xiàng)目?!倍?strong>AI方面的嘗試,“更多是出于興趣和想要跟大家分享”。
其實(shí),大谷最開(kāi)始接觸AI,也是出于游戲開(kāi)發(fā)的需求?!?strong>我想看看(AI)能不能給游戲開(kāi)發(fā)節(jié)省時(shí)間。”他說(shuō)。
大谷用形象的語(yǔ)言介紹了用AI制作游戲的過(guò)程,“就比如做一個(gè)足球游戲,傳統(tǒng)的游戲開(kāi)發(fā)就是寫(xiě)代碼,敵人靠近玩家時(shí)會(huì)怎樣攻擊、玩家怎樣移動(dòng)躲避,這些需要我們一行行代碼來(lái)寫(xiě)。
但訓(xùn)練足球人工智能是我在場(chǎng)景中放幾個(gè)角色,最開(kāi)始只告訴它幾個(gè)簡(jiǎn)單的左右、上下、前后移動(dòng)的動(dòng)作,以及球在哪里、對(duì)手在哪里的基本信息。兩隊(duì)球員最開(kāi)始只會(huì)亂動(dòng),根本不知道自己要干嘛,但當(dāng)其中某一個(gè)角色偶然發(fā)現(xiàn)球進(jìn)對(duì)方球門(mén)能得分,這時(shí)候得分的球員會(huì)優(yōu)生優(yōu)育繁衍下去、輸?shù)膭t會(huì)被淘汰掉。
最后,球員慢慢明白有守門(mén)員可以防止丟球、有前鋒后衛(wèi)傳球可以防止自己輸球,經(jīng)過(guò)幾百萬(wàn)場(chǎng)球賽訓(xùn)練,會(huì)出現(xiàn)一個(gè)特別高智能的AI對(duì)手,這時(shí)候我自己作為玩家加入游戲,(可能)會(huì)發(fā)現(xiàn)我已經(jīng)打不過(guò)它了?!?/p>
就這樣,大谷開(kāi)始學(xué)習(xí)AI方面的知識(shí),但很快,他就不滿足于只把AI當(dāng)作開(kāi)發(fā)游戲的“工具”。他說(shuō):“了解AI之后我發(fā)現(xiàn)它其實(shí)可以做更多好玩的內(nèi)容,門(mén)檻也并沒(méi)有很夸張。(AI修復(fù)歷史影片)可以給大家打開(kāi)一道了解歷史的大門(mén),也許這些觀眾當(dāng)中有些朋友看完這些影片,利用這5分鐘,他對(duì)歷史產(chǎn)生了興趣,然后進(jìn)一步去了解影片背后的各種事情,我覺(jué)得這樣算是一個(gè)比較好的目的?!?/p>
平時(shí),大谷會(huì)瀏覽各大新聞網(wǎng)站的科技板塊,選擇有趣的AI研究做成作品和大家分享。大谷B站頻道最新發(fā)布的用簡(jiǎn)筆畫(huà)就能生成人臉的“AI涂鴉技術(shù)”,也是這樣在茫茫新聞中被大谷“慧眼識(shí)珠”。
三、從“小谷”說(shuō)起:資深編程發(fā)燒友養(yǎng)成之路
大谷分享了一個(gè)名為“小谷游戲”的壓縮包,其中“年齡最大”的一款游戲,開(kāi)發(fā)于2004年。
在“AI修復(fù)百年前北京城”視頻爆火后,大谷獲得了參與更專(zhuān)業(yè)的AI修復(fù)工作的邀約。目前,大谷參與修復(fù)的紀(jì)錄片《他們與天地永存》等作品已經(jīng)上線。同時(shí),大谷的B站頻道“大谷的游戲創(chuàng)作小屋”不僅沒(méi)有斷更,八月份還保持著發(fā)布7只AI研究分享視頻的“高產(chǎn)”狀態(tài)。
▲大谷朋友圈:參與修復(fù)紀(jì)錄片
對(duì)許多關(guān)注者來(lái)說(shuō),大谷正以“AI修復(fù)新秀”的身份,愈來(lái)愈為人熟知。但實(shí)際上,在編程這條路上,大谷儼然已經(jīng)是一位“老炮兒”。而這個(gè)故事,還要追溯到“小谷”時(shí)期。
2004年,“小谷”正就讀小學(xué)六年級(jí)。一天,老師宣布,感興趣的同學(xué)可以自學(xué)Flash制作動(dòng)畫(huà),參加一個(gè)名為“全國(guó)中小學(xué)電腦制作活動(dòng)”的比賽。當(dāng)年的“小谷”,回家勤學(xué)苦練一個(gè)暑假,學(xué)會(huì)了用Flash制作小游戲,還倒騰出一個(gè)“方頭人”的動(dòng)畫(huà)形象。
這個(gè)小小的經(jīng)歷,為大谷日后的游戲開(kāi)發(fā)、AI修復(fù)生涯,埋下一個(gè)伏筆。至今,這個(gè)“方頭人”的形象還被胡文谷用做微博頭像。而從那年起,小谷參加了2005~2009年的每一屆“全國(guó)中小學(xué)電腦制作活動(dòng)”,直到2010年參加高考。
▲大谷及其微博頭像
此外,初中時(shí)期的“小谷”還曾獨(dú)自開(kāi)發(fā)過(guò)許多找不同、猜數(shù)字的小游戲?!澳菚r(shí)候每到午休的時(shí)間,我就把這些游戲拷到班里的電腦,和同學(xué)一起玩。”聊到興起處,大谷慷慨地選取了幾款小游戲分享給智東西。
智東西發(fā)現(xiàn),在這個(gè)名為“小谷游戲”的壓縮包里,最早的一款游戲開(kāi)發(fā)時(shí)間是2004年的9月1日。那一年,還是“小谷”的胡文谷,只有12歲。
▲大谷向智東西分享了幾款他開(kāi)發(fā)的小游戲
四、AI:獨(dú)立游戲開(kāi)發(fā)者的生活調(diào)味品
“我經(jīng)常說(shuō)自己是‘master of none’,啥都沒(méi)有特別專(zhuān)業(yè)了。”
高考結(jié)束后,大谷開(kāi)始開(kāi)發(fā)一款名為《Eddy紫》的游戲,與初高中時(shí)期的“小打小鬧”相比,這款游戲更加“重工”。胡文谷說(shuō):“(當(dāng)時(shí))我想把高中那些點(diǎn)子實(shí)現(xiàn)一下。(《Eddy紫》)算是我走上獨(dú)立游戲開(kāi)發(fā)者之路的一個(gè)正式的起點(diǎn)。”
▲胡文谷高考后開(kāi)始設(shè)計(jì)的游戲–《Eddy紫》
那一年是2010年,獨(dú)立游戲的概念甚至還沒(méi)在國(guó)內(nèi)火起來(lái)。要等到2015年底,全球最大的電子游戲發(fā)行平臺(tái)Steam解鎖了中國(guó)地區(qū)的登入與人民幣購(gòu)買(mǎi),才進(jìn)而把2016年引爆為中國(guó)的“獨(dú)立游戲元年”。
2014年大學(xué)畢業(yè)后,大谷來(lái)到紐約視覺(jué)藝術(shù)學(xué)院,攻讀計(jì)算機(jī)藝術(shù)專(zhuān)業(yè)的碩士學(xué)位,進(jìn)一步提升游戲方面的創(chuàng)作能力。
后來(lái),胡文谷也曾嘗試過(guò)在傳統(tǒng)的游戲公司工作。2016~2017年左右,大谷曾加入一家名為Mokuni的游戲公司,負(fù)責(zé)《貓小盒》游戲的背景、3D建模、關(guān)卡設(shè)計(jì)工作。
而對(duì)于分別體驗(yàn)過(guò)獨(dú)立游戲開(kāi)發(fā)者和傳統(tǒng)游戲開(kāi)發(fā)者生活的大谷說(shuō),還是前者更有吸引力。他說(shuō):“我更喜歡靈活一點(diǎn)兒?!睆墓倦x職后,大谷就開(kāi)啟了自己的獨(dú)立游戲開(kāi)發(fā)者生涯。
大谷介紹,與我們所熟知的商業(yè)游戲不同,獨(dú)立游戲一般指的是不以商業(yè)為首要目的的游戲開(kāi)發(fā)形式。換句話說(shuō),獨(dú)立游戲開(kāi)發(fā)者需要獨(dú)自完成游戲的策劃、程序、美術(shù)、音樂(lè)等工作,在程序員、畫(huà)手、配樂(lè)師等角色中切換身份。而身為獨(dú)立游戲開(kāi)發(fā)者的大谷,笑稱(chēng)自己是“master of none”,“每一項(xiàng)都沒(méi)有特別專(zhuān)業(yè)了,但綜合起來(lái)可能最適合做游戲。”他說(shuō)。
同時(shí),與傳統(tǒng)游戲開(kāi)發(fā)者相比,獨(dú)立開(kāi)發(fā)者在保持對(duì)游戲高度自主權(quán)的同時(shí),也承擔(dān)著以倍數(shù)計(jì)的壓力。
而在大谷的分享中,對(duì)這份壓力,他甘之如飴。“對(duì)于游戲,程序是它的骨架、美術(shù)決定它的皮肉、音樂(lè)營(yíng)造它的氛圍、游戲策劃賦予它靈魂,每一個(gè)步驟都必不可少。
開(kāi)發(fā)游戲可以比作是拼手辦,我可以先做程序、可以先做音樂(lè)、也可以先做美術(shù)。我掌握了一套工作習(xí)慣,保證一直有興趣把游戲推動(dòng)下去,比如做美術(shù)遇到瓶頸,那我就轉(zhuǎn)而去做音樂(lè),音樂(lè)差不多了再做程序。這樣就是每做一項(xiàng)都保留一定的熱情。”
而AI修復(fù)的工作,未嘗不是大谷讓自己保持創(chuàng)作熱情的一種調(diào)劑。與獨(dú)立開(kāi)發(fā)游戲一樣,大谷的AI作品也是由自己獨(dú)立制作。
目前,大谷獨(dú)立開(kāi)發(fā)的《Eddy紫》、《漫展模擬器》已經(jīng)在Steam平臺(tái)上線。在AI方面,大谷的最新視頻分享了一個(gè)用簡(jiǎn)筆畫(huà)就能生成人臉的“AI涂鴉技術(shù)”。
▲“AI涂鴉技術(shù)”視頻片段
他還表示用AI模仿口型、用AI還原失傳的跳舞、用AI基于2D照片摳出3D角色等都在他的計(jì)劃之內(nèi)。他說(shuō):“能不能實(shí)現(xiàn)還不好說(shuō),但我有好多想法,這件事我會(huì)一直做下去?!?/p>
另外,大谷表示,如果遇到修復(fù)紀(jì)錄片、老影像等方面的工作機(jī)會(huì),也愿意進(jìn)行更多嘗試。
五、大谷:分享是AI問(wèn)題的解藥
大谷,這位年輕的獨(dú)立游戲開(kāi)發(fā)者、獨(dú)立藝術(shù)家正更進(jìn)一步突破自己的邊界,對(duì)于在游戲開(kāi)發(fā)、動(dòng)畫(huà)配樂(lè)、藝術(shù)項(xiàng)目創(chuàng)作等方面均有過(guò)嘗試的他來(lái)說(shuō),這一點(diǎn)并不稀奇。
就像當(dāng)我問(wèn)到“不斷地去接觸和掌握新的AI技能會(huì)不會(huì)帶來(lái)壓力”這個(gè)問(wèn)題時(shí),他在語(yǔ)音另一端毫不猶豫地回答道:“不會(huì),我做的全是我感興趣的?!?/p>
而從結(jié)果來(lái)看,AI正從一種出于興趣的嘗試,轉(zhuǎn)變?yōu)樗钪性絹?lái)越重要的一部分。僅從大谷B站頻道分享的視頻內(nèi)容來(lái)看,從今年起,AI相關(guān)的內(nèi)容正占據(jù)越來(lái)越大的權(quán)重。
跳出修復(fù)老片的應(yīng)用范疇,在全世界范圍內(nèi),AI技術(shù)還面臨著許多質(zhì)疑。DeepFake帶來(lái)的隱私安全問(wèn)題、假新聞問(wèn)題,AI訓(xùn)練數(shù)據(jù)庫(kù)存在的種族歧視問(wèn)題……每一項(xiàng)都牽掛著普通用戶的神經(jīng)。
作為一名AI應(yīng)用玩家,大谷則認(rèn)為AI在帶來(lái)了隱患之外,其實(shí)也提供了“解題思路”。他說(shuō):“現(xiàn)在既有用于換臉的DeepFake技術(shù),也有能識(shí)別換臉的人工智能;還有一些反謠言的人工智能,能判斷出言論的煽動(dòng)性、偏向性指數(shù),所以我個(gè)人對(duì)AI技術(shù)還是比較樂(lè)觀的?!?/p>
另外,大谷認(rèn)為數(shù)據(jù)庫(kù)的傾向問(wèn)題,需要用“全球的知識(shí)共享、信息共享”來(lái)解決,“不僅歐美的數(shù)據(jù)庫(kù)存在對(duì)白人的偏向性,之前香港某個(gè)大學(xué)訓(xùn)練出一個(gè)網(wǎng)紅評(píng)價(jià)人工智能,用于判斷哪張Instagram照片會(huì)火,結(jié)果模型識(shí)別出來(lái)容易火的全是亞洲人的照片,所以解決這個(gè)問(wèn)題的關(guān)鍵是需要世界各地的朋友們一起去把數(shù)據(jù)集共通”。
繼續(xù)分享有趣的AI研究也是大谷的目標(biāo),他說(shuō):“以后我的AI作品也會(huì)在微博和B站都放出來(lái)?!?/p>
結(jié)語(yǔ):AI正從想象照進(jìn)現(xiàn)實(shí)
目前,大谷在AI方面的嘗試日趨深入。在今年9月11日舉行的騰訊全球數(shù)字生態(tài)大會(huì)上,大谷還作為嘉賓出席,分享了他在用AI產(chǎn)出數(shù)字內(nèi)容方面的經(jīng)驗(yàn)。
在與大谷幾個(gè)小時(shí)的溝通中,最讓我驚訝的是他強(qiáng)調(diào)的:AI技術(shù)應(yīng)用的門(mén)檻并沒(méi)有很夸張。
這位28歲北京小伙的經(jīng)歷告訴我們,或許在那些我們未曾意識(shí)到的時(shí)刻,AI正憑借其不同于傳統(tǒng)互聯(lián)網(wǎng)的創(chuàng)造力,日漸走進(jìn)和改變我們生活?;蛟S除了大谷以外,還會(huì)涌現(xiàn)出更多利用AI技術(shù)實(shí)現(xiàn)人生價(jià)值的嘗試者。
同時(shí),期待下一次,大谷能為我們帶來(lái)更多的驚喜。