免费爱碰视频在线观看,九九精品国产屋,欧美亚洲尤物久久精品,1024在线观看视频亚洲

      人腦90%都是自監(jiān)督學(xué)習(xí),AI大模型離模擬大腦還有多遠(yuǎn)?

      人腦90%都是自監(jiān)督學(xué)習(xí),AI大模型離模擬大腦還有多遠(yuǎn)?

      編輯:David Joey

      【新智元導(dǎo)讀】人的大腦和自監(jiān)督學(xué)習(xí)模型的相似度有多高?

      我們都知道,人類(lèi)的大腦90%都是自監(jiān)督學(xué)習(xí)的,生物會(huì)不斷對(duì)下一步發(fā)生的事情做出預(yù)測(cè)。

      自監(jiān)督學(xué)習(xí),就是不需要外部干預(yù)也能做出決策。

      只有少數(shù)情況我們會(huì)接受外部反饋,比如老師說(shuō):「你搞錯(cuò)了」。

      而現(xiàn)在有學(xué)者發(fā)現(xiàn),大型語(yǔ)言模型的自監(jiān)督學(xué)習(xí)機(jī)制,像極了我們的大腦。

      知名科普媒體Quanta Magazine近日?qǐng)?bào)道,越來(lái)越多的研究發(fā)現(xiàn),自監(jiān)督學(xué)習(xí)模型,尤其是大型語(yǔ)言模型的自學(xué)方式,與我們的大腦的學(xué)習(xí)模式非常類(lèi)似。

      過(guò)去常見(jiàn)的AI系統(tǒng)都是使用大量標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練的。

      例如,圖像可能被標(biāo)記為「虎斑貓」或「虎貓」,用以訓(xùn)練人工神經(jīng)網(wǎng)絡(luò)來(lái)正確區(qū)分虎斑和虎。

      這種「自監(jiān)督」訓(xùn)練需要人工費(fèi)力地標(biāo)記數(shù)據(jù),而神經(jīng)網(wǎng)絡(luò)通常會(huì)走捷徑,學(xué)習(xí)將標(biāo)簽與最少、有時(shí)甚至是膚淺的信息聯(lián)系起來(lái)。

      例如,神經(jīng)網(wǎng)絡(luò)可能會(huì)使用草的存在來(lái)識(shí)別奶牛的照片,因?yàn)槟膛MǔJ窃谔镆爸信臄z的。

      加州大學(xué)伯克利分校的計(jì)算機(jī)科學(xué)家阿列克謝·埃弗羅斯 (Alexei Efros) 說(shuō):

      我們正在培養(yǎng)的算法,就像是一整個(gè)學(xué)期都沒(méi)來(lái)上課的本科生,雖然他們并沒(méi)有系統(tǒng)學(xué)習(xí)這些材料,但他們?cè)诳荚囍斜憩F(xiàn)出色。

      此外,對(duì)于對(duì)動(dòng)物智能和機(jī)器智能的交叉感興趣的研究人員來(lái)說(shuō),這種「監(jiān)督學(xué)習(xí)」可能僅限于它對(duì)生物大腦的揭示。

      許多動(dòng)物,包括人類(lèi)不使用標(biāo)記數(shù)據(jù)集來(lái)學(xué)習(xí)。在大多數(shù)情況下,他們自己探索環(huán)境,并且通過(guò)這樣做,他們對(duì)世界獲得了豐富而深刻的理解。

      現(xiàn)在,一些計(jì)算神經(jīng)科學(xué)家已經(jīng)開(kāi)始探索使用很少或沒(méi)有人工標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練的神經(jīng)網(wǎng)絡(luò)。

      最近的研究結(jié)果表明,使用自我監(jiān)督學(xué)習(xí)模型構(gòu)建的動(dòng)物視覺(jué)和聽(tīng)覺(jué)系統(tǒng)的計(jì)算模型比監(jiān)督學(xué)習(xí)模型更接近大腦功能。

      對(duì)一些神經(jīng)科學(xué)家來(lái)說(shuō),人工神經(jīng)網(wǎng)絡(luò)似乎開(kāi)始揭示用大腦來(lái)類(lèi)比機(jī)器學(xué)習(xí)的途徑。

      有缺陷的監(jiān)督

      大約10年前,受人工神經(jīng)網(wǎng)絡(luò)啟發(fā)的大腦模型開(kāi)始出現(xiàn),同時(shí)一個(gè)名為AlexNet的神經(jīng)網(wǎng)絡(luò)徹底改變了對(duì)未知圖像進(jìn)行分類(lèi)的任務(wù)。

      這項(xiàng)成果在Alex Krizhevsky、Ilya Sutskever和Geoffrey E. Hinton 的論文「ImageNet Classification with Deep Convolutional Neural Networks」中發(fā)表。

      論文地址:https://dl.acm.org/doi/10.1145/3065386

      與所有神經(jīng)網(wǎng)絡(luò)一樣,該網(wǎng)絡(luò)由多層人工神經(jīng)元組成,其中不同神經(jīng)元之間連接的權(quán)重不同。

      如果神經(jīng)網(wǎng)絡(luò)未能正確分類(lèi)圖像,學(xué)習(xí)算法會(huì)更新神經(jīng)元之間連接的權(quán)重,以降低在下一輪訓(xùn)練中錯(cuò)誤分類(lèi)的可能性。

      該算法重復(fù)此過(guò)程多次,調(diào)整權(quán)重,直到網(wǎng)絡(luò)的錯(cuò)誤率低到可以接受的程度。

      之后,神經(jīng)科學(xué)家使用AlexNet開(kāi)發(fā)了第一個(gè)靈長(zhǎng)類(lèi)視覺(jué)系統(tǒng)(Primate Visual System)的計(jì)算模型。

      當(dāng)猴子和人工神經(jīng)網(wǎng)絡(luò)顯示相同的圖像時(shí),真實(shí)神經(jīng)元和人工神經(jīng)元的活動(dòng)顯示出類(lèi)似的反應(yīng)。

      在聽(tīng)覺(jué)和氣味檢測(cè)的人工模型上也取得了相似的結(jié)果。

      但隨著該領(lǐng)域的發(fā)展,研究人員意識(shí)到自監(jiān)督訓(xùn)練的局限性。

      2017年,德國(guó)蒂賓根大學(xué)的計(jì)算機(jī)科學(xué)家Leon Gatys和他的同事拍攝了一張福特T型車(chē)的照片,然后在照片上覆蓋了豹皮圖案。

      人工智能神經(jīng)網(wǎng)絡(luò)將原始圖像正確分類(lèi)為Model T,但將修改后的圖像視為豹子。

      原因是它只專(zhuān)注于圖像紋理,不了解汽車(chē)(或豹子)的形狀。

      自監(jiān)督學(xué)習(xí)模型旨在避免此類(lèi)問(wèn)題。

      瑞士巴塞爾弗里德里?!っ仔獱柹镝t(yī)學(xué)研究所的計(jì)算神經(jīng)科學(xué)家弗里德曼·岑克 (Friedemann Zenke) 說(shuō),

      在這種方法中,人類(lèi)不會(huì)標(biāo)記數(shù)據(jù),相反,標(biāo)簽來(lái)自數(shù)據(jù)本身。自監(jiān)督算法本質(zhì)上是在數(shù)據(jù)中創(chuàng)建空白,并要求神經(jīng)網(wǎng)絡(luò)填補(bǔ)空白。

      例如,在所謂的大型語(yǔ)言模型中,訓(xùn)練算法將向神經(jīng)網(wǎng)絡(luò)顯示句子的前幾個(gè)單詞,并要求它預(yù)測(cè)下一個(gè)單詞。

      當(dāng)使用從互聯(lián)網(wǎng)收集的大量文本進(jìn)行訓(xùn)練時(shí),該模型似乎可以學(xué)習(xí)語(yǔ)言的句法結(jié)構(gòu),展示出令人印象深刻的語(yǔ)言能力——所有這些都沒(méi)有外部標(biāo)簽或監(jiān)督。

      計(jì)算機(jī)視覺(jué)方面也正在進(jìn)行類(lèi)似的努力。

      2021年底,何愷明及其同事展示了著名的掩碼自動(dòng)編碼器研究「Masked Auto-Encoder」(MAE)。

      論文地址:https://arxiv.org/abs/2111.06377

      MAE將未掩碼部分轉(zhuǎn)換為潛在表示——壓縮的數(shù)學(xué)描述,其中包含有關(guān)對(duì)象的重要信息。

      在圖像的情況下,潛在表示可能是一種數(shù)學(xué)描述,其中包括圖像中對(duì)象的形狀。然后解碼器將這些表示轉(zhuǎn)換回完整的圖像。

      大腦也是「自監(jiān)督」的

      在這樣的系統(tǒng)中,一些神經(jīng)科學(xué)家認(rèn)為,我們的大腦實(shí)際上也是自監(jiān)督學(xué)習(xí)的。

      麥吉爾大學(xué)和魁北克人工智能研究所(Mila)的計(jì)算神經(jīng)科學(xué)家布萊克-理查茲(Blake Richards)說(shuō):「我認(rèn)為毫無(wú)疑問(wèn),大腦所做的90%都是自監(jiān)督學(xué)習(xí)?!?/p>

      生物大腦被認(rèn)為是在不斷地預(yù)測(cè),例如,一個(gè)物體在移動(dòng)時(shí)的未來(lái)位置,或一句話(huà)中的下一個(gè)詞,就像自我監(jiān)督學(xué)習(xí)算法試圖預(yù)測(cè)圖像或一段文字的間隙一樣。

      計(jì)算神經(jīng)科學(xué)家布萊克-理查茲(Blake Richards)創(chuàng)建了一個(gè)AI系統(tǒng),模仿活體大腦中的視覺(jué)網(wǎng)絡(luò)

      理查茲和他的團(tuán)隊(duì)創(chuàng)建了一個(gè)自監(jiān)督模型,暗示了一個(gè)答案。他們訓(xùn)練了一個(gè)結(jié)合兩種不同神經(jīng)網(wǎng)絡(luò)的人工智能。

      第一個(gè),稱(chēng)為ResNet架構(gòu),是為處理圖像而設(shè)計(jì)的;第二個(gè),稱(chēng)為遞歸網(wǎng)絡(luò),可以跟蹤先前的輸入序列,對(duì)下一個(gè)預(yù)期輸入進(jìn)行預(yù)測(cè)。

      為了訓(xùn)練聯(lián)合AI,該團(tuán)隊(duì)從一連串的視頻開(kāi)始,比如說(shuō)10幀,讓ResNet逐一處理。

      然后,遞歸網(wǎng)絡(luò)預(yù)測(cè)了第11幀的潛在表示,而不是簡(jiǎn)單地匹配前10幀。自監(jiān)督學(xué)習(xí)算法將預(yù)測(cè)值與實(shí)際值進(jìn)行比較,并指示神經(jīng)網(wǎng)絡(luò)更新其權(quán)重,以使預(yù)測(cè)效果更好。

      為了進(jìn)一步測(cè)試,研究人員向AI展示了一組視頻,西雅圖艾倫腦科學(xué)研究所的研究人員以前曾向小鼠展示過(guò)這些視頻。與靈長(zhǎng)類(lèi)動(dòng)物一樣,小鼠的大腦區(qū)域?qū)iT(mén)用于靜態(tài)圖像和運(yùn)動(dòng)。艾倫研究人員在小鼠觀看視頻時(shí)記錄了小鼠視覺(jué)皮層的神經(jīng)活動(dòng)。

      理查茲的團(tuán)隊(duì)發(fā)現(xiàn)了AI和活體大腦對(duì)視頻的反應(yīng)方式的相似之處。在訓(xùn)練過(guò)程中,人工神經(jīng)網(wǎng)絡(luò)中的一條途徑變得與小鼠大腦的腹側(cè)、物體探測(cè)區(qū)域更加相似,而另一條途徑則變得與注重運(yùn)動(dòng)的背側(cè)區(qū)域相似。

      這些結(jié)果表明,我們的視覺(jué)系統(tǒng)有兩條專(zhuān)門(mén)的通路,因?yàn)樗鼈冇兄陬A(yù)測(cè)視覺(jué)的未來(lái);單一的通路是不夠好的。

      人類(lèi)聽(tīng)覺(jué)系統(tǒng)的模型講述了一個(gè)類(lèi)似的故事。

      6月,由Meta AI的研究科學(xué)家Jean-Rémi King領(lǐng)導(dǎo)的團(tuán)隊(duì)訓(xùn)練了一個(gè)名為Wav2Vec 2.0的人工智能,它使用一個(gè)神經(jīng)網(wǎng)絡(luò)將音頻轉(zhuǎn)化為潛在的表征。研究人員對(duì)這些表征中的一些進(jìn)行了屏蔽,然后將其送入另一個(gè)稱(chēng)為轉(zhuǎn)化器的組件神經(jīng)網(wǎng)絡(luò)。

      在訓(xùn)練過(guò)程中,轉(zhuǎn)化器預(yù)測(cè)被屏蔽的信息。在這個(gè)過(guò)程中,整個(gè)人工智能學(xué)會(huì)了將聲音轉(zhuǎn)化為潛在的表征,同樣,不需要標(biāo)簽。

      該團(tuán)隊(duì)使用了大約600小時(shí)的語(yǔ)音數(shù)據(jù)來(lái)訓(xùn)練網(wǎng)絡(luò)?!高@大約是一個(gè)孩子在前兩年的經(jīng)驗(yàn)中得到的東西?!菇鹫f(shuō)。

      Meta AI的讓-雷米-金幫助訓(xùn)練了一種人工智能,它以模仿大腦的方式處理音頻–部分是通過(guò)預(yù)測(cè)下一步應(yīng)該發(fā)生什么

      一旦該系統(tǒng)被訓(xùn)練出來(lái),研究人員給它播放英語(yǔ)、法語(yǔ)和普通話(huà)的有聲讀物部分,然后將AI的表現(xiàn)與412人的數(shù)據(jù)進(jìn)行了比較(這些人都是以這三種語(yǔ)言為母語(yǔ)的人),他們?cè)诤舜殴舱駫呙鑼?duì)自己的大腦進(jìn)行成像時(shí),聽(tīng)了同樣長(zhǎng)的一段音頻。

      結(jié)果顯示,盡管fMRI圖像有噪音且分辨率不高,但AI神經(jīng)網(wǎng)絡(luò)和人類(lèi)的大腦「不僅相互關(guān)聯(lián),而且還以系統(tǒng)的方式關(guān)聯(lián)」。

      AI早期層的活動(dòng)與初級(jí)聽(tīng)覺(jué)皮層的活動(dòng)一致,而AI最深層的活動(dòng)則與大腦中較高層的活動(dòng)相一致,比如前額葉皮層。

      「這是非常漂亮的數(shù)據(jù),雖然算不上是決定性的,但算得上是令人信服的證據(jù),表明我們學(xué)習(xí)語(yǔ)言的方式在很大程度上是在預(yù)測(cè)接下來(lái)會(huì)說(shuō)的話(huà)?!?/p>

      有人不同意:模擬大腦?模型、算法都差的遠(yuǎn)

      當(dāng)然,也并非所有人都認(rèn)同這種說(shuō)法。

      MIT的計(jì)算神經(jīng)科學(xué)家喬希-麥克德莫特(Josh McDermott)曾使用監(jiān)督和自監(jiān)督學(xué)習(xí)研究視覺(jué)和聽(tīng)覺(jué)的模型。他的實(shí)驗(yàn)室設(shè)計(jì)了一些人工合成的音頻和視覺(jué)信號(hào),對(duì)于人類(lèi)來(lái)說(shuō),這些信號(hào)只是難以捉摸的噪音。

      然而,對(duì)于人工神經(jīng)網(wǎng)絡(luò)來(lái)說(shuō),這些信號(hào)似乎與真實(shí)語(yǔ)言和圖像沒(méi)有區(qū)別。這表明,在神經(jīng)網(wǎng)絡(luò)的深層形成的表征,即使是自監(jiān)督學(xué)習(xí),也與我們大腦中的表征不一樣。

      麥克德莫特說(shuō):「這些自我監(jiān)督的學(xué)習(xí)方法是一種進(jìn)步,因?yàn)槟隳軌驅(qū)W習(xí)能夠支持很多識(shí)別行為的表征,而不需要所有標(biāo)簽。但仍然有很多監(jiān)督模型的特征?!?/p>

      算法本身也需要更多改進(jìn)。比如在Meta AI的Wav2Vec 2.0模型中,AI只預(yù)測(cè)了幾十毫秒的聲音的潛在表征,比人發(fā)出一個(gè)噪音音節(jié)的時(shí)間還要短,更不用說(shuō)預(yù)測(cè)一個(gè)詞了。

      要真正實(shí)現(xiàn)讓AI模型和人類(lèi)大腦相類(lèi)似,我們還有很多事情要做,金說(shuō)。

      如果目前發(fā)現(xiàn)的大腦和自我監(jiān)督學(xué)習(xí)模型之間的相似性在其他感官任務(wù)中也成立,將更有力地表明,無(wú)論我們的大腦有什么神奇的能力,都需要以某種形式進(jìn)行自監(jiān)督學(xué)習(xí)。

      參考資料:

      Self-Taught AI Shows Similarities to How the Brain Works

      鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場(chǎng),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。
      用戶(hù)投稿
      上一篇 2022年8月20日 18:18
      下一篇 2022年8月20日 18:18

      相關(guān)推薦

      聯(lián)系我們

      聯(lián)系郵箱:admin#wlmqw.com
      工作時(shí)間:周一至周五,10:30-18:30,節(jié)假日休息