免费爱碰视频在线观看,九九精品国产屋,欧美亚洲尤物久久精品,1024在线观看视频亚洲

      微博為何讓人上癮?幕后推薦算法解密

      微博為何讓人上癮?幕后推薦算法解密

      編輯:Aeneas 好困

      【新智元導(dǎo)讀】大事件時(shí)常引「爆」熱搜,微博服務(wù)器為啥挺得???微博到處都是我的「互聯(lián)網(wǎng)嘴替」,為何推薦內(nèi)容如此深得我心?

      2021年7月13日,勞累了一天的年輕人們,正準(zhǔn)備躺平拿出手機(jī),打開那熟悉的小破站App,一鍵三連自己最喜愛的up主的最新視頻。

      結(jié)果突然發(fā)現(xiàn),自己的眼前一黑:

      時(shí)隔一年,B站終于揭曉了這其中的奧秘:一個(gè)「詭計(jì)多端的0」。

      不過,你有沒有想過,即便是經(jīng)歷著用戶的瘋狂涌入,為啥這個(gè)微博,它沒崩呢?

      AI和微博有啥關(guān)系?

      在揭開這個(gè)謎底之前,還需要從人工智能的發(fā)展說起。

      7月27日,由中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)指導(dǎo)、微博和新浪新聞主辦的「融合生態(tài) 價(jià)值共創(chuàng)」2022新智者大會(huì)順利召開。

      在「智驅(qū)萬物:AI推動(dòng)萬物互聯(lián)的加速到來」議題中,微博COO、新浪移動(dòng)CEO、新浪AI媒體研究院院長(zhǎng)王巍發(fā)表了題為《云為數(shù)智 技術(shù)融合應(yīng)用 賦能微博復(fù)雜業(yè)務(wù)場(chǎng)景》的主題演講。

      王巍表示,如果我們回顧機(jī)器學(xué)習(xí)的發(fā)展歷程,可以看出AI的總體發(fā)展趨勢(shì)是:訓(xùn)練數(shù)據(jù)的海量化及多樣化,AI模型的復(fù)雜化及通用化,算力的高效化及規(guī)模化。

      第一,是多模態(tài)數(shù)據(jù)融合。

      隨著5G的快速發(fā)展,圖片、視頻類型模態(tài)內(nèi)容在網(wǎng)絡(luò)內(nèi)容中占比越來越高,所以進(jìn)行模態(tài)融合非常必要。

      對(duì)于微博來說,如果能同時(shí)對(duì)文本、圖片、視頻進(jìn)行多模態(tài)融合,也就可以更好理解這條微博所講的內(nèi)容了。

      第二,是超大規(guī)模圖計(jì)算。

      相對(duì)其他機(jī)器學(xué)習(xí)模型,超大規(guī)模圖計(jì)算有個(gè)特殊的優(yōu)勢(shì):通過信息在網(wǎng)絡(luò)中的傳遞,促進(jìn)信息的流動(dòng)、匯聚與集成。

      比如對(duì)于行為少的冷啟動(dòng)用戶,我們可以通過他關(guān)注列表中的人,以及這些人發(fā)布的內(nèi)容,通過信息傳播來推導(dǎo)這個(gè)用戶的興趣。

      第三,是AI研發(fā)的啞鈴模式。

      目前的AI研發(fā)重點(diǎn),一個(gè)是越來越大的超級(jí)大模型,一個(gè)是模型小型化技術(shù)。

      我們都知道,目前隨著模型參數(shù)規(guī)模越來越大,模型效果越來越好,高精度模型仍然在持續(xù)增大,比如2018年Google的Bert剛出來的時(shí)候,模型參數(shù)規(guī)模是3億,不算太大,但是之后這個(gè)數(shù)字一直在飛速增長(zhǎng)。

      OpenAI研發(fā)的GPT-2模型,參數(shù)規(guī)模15億,GPT-3模型,參數(shù)規(guī)模1750億,而到了2021年Google發(fā)布的Switch Transformer,參數(shù)規(guī)模已經(jīng)達(dá)到了1.6萬億。

      另一方面,雖然說模型越大效果越好,但是因?yàn)槟P瓦^大,有時(shí)會(huì)導(dǎo)致無法讓實(shí)際應(yīng)用落地。所以研發(fā)的另外一個(gè)重點(diǎn),是將這些大模型小型化、輕量化,比如模型蒸餾、模型剪枝等技術(shù)。

      第四,是AI模型從專用模型走向通用模型。

      谷歌在2021年下半年公開了Pathways模型框架,首先提出了這一構(gòu)想,希望通過構(gòu)造一個(gè)通用的大模型,達(dá)到「一個(gè)模型做千萬件事」的目標(biāo)。

      具體的思路是,不同任務(wù)數(shù)據(jù)輸入后,通過路由算法,選擇神經(jīng)網(wǎng)絡(luò)的部分路徑,到達(dá)模型輸出層。不同任務(wù)既有參數(shù)共享,也有任務(wù)獨(dú)有的模型參數(shù)。

      10億節(jié)點(diǎn)+100億邊的超大規(guī)模圖

      為何講了這么半天機(jī)器學(xué)習(xí)?因?yàn)榻酉聛硪菆?chǎng)的,就是「微博特色推薦系統(tǒng)」了。

      眾所周知,作為國(guó)內(nèi)最大的社交媒體網(wǎng)絡(luò),微博目前的月活用戶已經(jīng)達(dá)到5.82億了!這樣大的用戶規(guī)模,必然會(huì)讓微博上的網(wǎng)絡(luò)環(huán)境十分復(fù)雜。

      再加上內(nèi)容時(shí)效性強(qiáng)、多樣性高,現(xiàn)在的網(wǎng)絡(luò)大事都會(huì)第一時(shí)間在微博上引爆。

      另外,微博面臨的場(chǎng)景還很多元化,需要在關(guān)系流、熱點(diǎn)流、視頻流等眾多場(chǎng)景中給用戶分發(fā)他們感興趣的「千人千面」的內(nèi)容。

      我可以沒有手指,但不能沒有手機(jī)

      面對(duì)復(fù)雜的業(yè)務(wù)場(chǎng)景,微博是怎樣通過AI和大數(shù)據(jù),做出能隨機(jī)應(yīng)變的推薦系統(tǒng)的呢?

      王巍向我們介紹說,微博推薦系統(tǒng)整體由三部分構(gòu)成:內(nèi)容理解、用戶理解,以及推薦系統(tǒng)。

      首先,是內(nèi)容理解。

      如果要想搞明白一個(gè)微博到底在說什么,僅僅理解文本內(nèi)容是不夠的,必須采用多模態(tài)理解技術(shù),融合博文、圖片、視頻等多種媒體信息。

      為此,微博訓(xùn)練了自己的微博多模態(tài)預(yù)訓(xùn)練模型,通過「對(duì)比學(xué)習(xí)」,用這種自監(jiān)督學(xué)習(xí)方法,來進(jìn)行多模態(tài)預(yù)訓(xùn)練。

      下圖的這例子就展示了微博是怎樣利用自帶的「話題」來自動(dòng)構(gòu)造訓(xùn)練數(shù)據(jù)的。

      比如,我們把兩個(gè)都寫著「訓(xùn)練中的拉什福德」的微博當(dāng)作正例,隨機(jī)選擇一些不同話題的微博作為負(fù)例,這樣就能自動(dòng)構(gòu)造訓(xùn)練數(shù)據(jù)。

      對(duì)于某條微博,其中的文本內(nèi)容通過Bert編碼,圖像和視頻內(nèi)容通過ViT編碼,然后通過fusion子網(wǎng)絡(luò)進(jìn)行信息融合,形成微博的embedding編碼。這就是一種預(yù)訓(xùn)練過程。

      經(jīng)過預(yù)訓(xùn)練,學(xué)好的微博編碼器可以拿來對(duì)新的微博內(nèi)容進(jìn)行多模態(tài)編碼,形成embedding,應(yīng)用在推薦等下游任務(wù)中。

      其次,在用戶理解方面,微博采取了超大規(guī)模圖計(jì)算,來更好地理解用戶的閱讀興趣。畢竟微博自帶社交媒體屬性,天然地就和大規(guī)模圖計(jì)算非常匹配。

      利用用戶和博文作為圖中的節(jié)點(diǎn),以用戶間的關(guān)注關(guān)系、用戶和博文的閱讀及轉(zhuǎn)評(píng)贊等互動(dòng)行為構(gòu)造圖中的邊,微博建立起了包含10億規(guī)模節(jié)點(diǎn)、100億規(guī)模邊的超大規(guī)模圖。

      通過大規(guī)模圖計(jì)算中的信息傳播、匯聚和集成,形成表征用戶興趣的embedding向量,可以更好地理解用戶興趣。

      如此一來,也就可以同時(shí)搞定用戶之間的關(guān)注關(guān)系、用戶和博文的轉(zhuǎn)評(píng)贊等等的互動(dòng)行為了。

      在理解了用戶在講什么、理解了微博用戶的興趣之后,微博推薦系統(tǒng)就會(huì)將高質(zhì)量的微博,個(gè)性化地分發(fā)給感興趣的用戶。

      那么,如何在這種復(fù)雜場(chǎng)景下構(gòu)造高效率的推薦系統(tǒng)呢?

      微博采取的是采取了多場(chǎng)景建模的方式。最理想的情況是,只構(gòu)建一個(gè)推薦模型,用它來服務(wù)多個(gè)場(chǎng)景。

      那么如何表示場(chǎng)景間的共性和個(gè)性呢?可以通過網(wǎng)絡(luò)參數(shù)在場(chǎng)景間共享,或者場(chǎng)景自己獨(dú)享私有網(wǎng)絡(luò)參數(shù),來體現(xiàn)場(chǎng)景的共性與個(gè)性。

      比如這張模型圖,在模型的底層特征輸入層,以及網(wǎng)絡(luò)中間的一部分「專家子網(wǎng)絡(luò)」,這些網(wǎng)絡(luò)參數(shù)是各個(gè)場(chǎng)景共享的;而其他子網(wǎng)絡(luò)參數(shù)則是某個(gè)場(chǎng)景所獨(dú)有的

      通過這種方式,就能夠通過一個(gè)模型服務(wù)多個(gè)場(chǎng)景,節(jié)省模型資源。

      唐山事件:流量暴漲一倍怎么辦?

      現(xiàn)在,說回到最初的那個(gè)「懸念」上來。

      對(duì)于微博來說,這個(gè)保不齊什么時(shí)候就會(huì)「炸」的熱點(diǎn),一直以來都是非常大的挑戰(zhàn)。

      比如,最近全民關(guān)注的「唐山事件」,事件當(dāng)天的熱點(diǎn)流量,比日常流量峰值翻了整整一倍。

      對(duì)此王巍表示,微博在很早就應(yīng)用了微服務(wù)+Docker容器化技術(shù),不僅提升服務(wù)運(yùn)維的效率,而且還實(shí)現(xiàn)了服務(wù)動(dòng)態(tài)擴(kuò)縮容能力。當(dāng)前,微博已經(jīng)具備了10分鐘調(diào)度超過一萬臺(tái)的擴(kuò)容能力,可以有足夠的服務(wù)器來應(yīng)對(duì)熱點(diǎn)流量。

      此外,微博還建立了熱點(diǎn)監(jiān)測(cè)機(jī)制和熱點(diǎn)聯(lián)動(dòng)體系,并通過微博自研的Weibo Mesh技術(shù),實(shí)現(xiàn)不同服務(wù)間跨語言的高效調(diào)用,提升整體服務(wù)的性能,和聯(lián)動(dòng)擴(kuò)容效率。

      最后,微博采用了在離線實(shí)時(shí)混合部署技術(shù)。利用CPU實(shí)時(shí)搶占式調(diào)度技術(shù)與容器化技術(shù)相結(jié)合,實(shí)現(xiàn)微博服務(wù)在離線實(shí)時(shí)混合部署能力。

      綜合了上面這些操作之后,在有熱點(diǎn)流量來襲時(shí),就可以秒級(jí)承接核心服務(wù)的熱點(diǎn)流量了。

      最后,讓我們?cè)賮砘仡櫹禄ヂ?lián)網(wǎng)的發(fā)展歷程。

      如果說PC互聯(lián)網(wǎng)是網(wǎng)絡(luò)世界的開端,那么移動(dòng)互聯(lián)網(wǎng)的興起則讓我們將這無形的信息空間裝進(jìn)了口袋。隨著大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)與移動(dòng)互聯(lián)網(wǎng)的疊加融合,我們進(jìn)入了智能信息時(shí)代。

      而現(xiàn)在,最火的話題就要數(shù)元宇宙了。從去年開始,元宇宙就引發(fā)了廣泛的討論,比如數(shù)字孿生、數(shù)字人、XR、區(qū)塊鏈技術(shù)等。

      王巍認(rèn)為,目前基于AI、區(qū)塊鏈、XR等前沿技術(shù)的應(yīng)用場(chǎng)景,已經(jīng)體現(xiàn)了一些元宇宙的雛形。諸如游戲、社交等領(lǐng)域,都是元宇宙非常好的應(yīng)用場(chǎng)景,會(huì)引爆大家參與元宇宙的熱情。

      「新智者Talk」來襲!

      就在今天下午,我們即將迎來「新智者Talk」圓桌論壇!

      元宇宙時(shí)代,我們?cè)撊绾闻c數(shù)量龐大的虛擬人相處?在論壇上,新智元楊靜、騰訊云蔡弋戈、商湯科技欒青、英偉達(dá)何展、奧丁科技張玥,與你一起暢聊元宇宙未來與數(shù)字新人類。

      「2022新智者大會(huì)」開啟,微博、新浪新聞聯(lián)合主辦,新智元戰(zhàn)略合作:2022年7月27日本周三已上線,快來預(yù)約直播啦!

      鄭重聲明:本文內(nèi)容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場(chǎng),版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系管理員(admin#wlmqw.com)刪除。
      (0)
      用戶投稿
      上一篇 2022年7月29日 12:10
      下一篇 2022年7月29日 12:11

      相關(guān)推薦

      • 上半年家用智能投影逆勢(shì)增長(zhǎng)30%,全年有望突破600萬臺(tái)

        家電行業(yè)2022年上半年的數(shù)據(jù)已經(jīng)陸續(xù)出臺(tái),在家用顯示領(lǐng)域,根據(jù)奧維云網(wǎng)全渠道推總數(shù)據(jù)顯示,2022年上半年彩電市場(chǎng)渠道零售規(guī)模為1672萬臺(tái),同比下滑6.2%,零售額規(guī)模531億…

        2022年8月3日
      • 每日一股,第一股:金發(fā)科技

        主營(yíng)業(yè)務(wù):化工新材料的研發(fā)、生產(chǎn)和銷售。 擁有降解塑料、新材料、碳釬維等熱點(diǎn)題材 根據(jù)國(guó)家發(fā)展改革委、生態(tài)環(huán)境部發(fā)布的新“限塑令”要求,2020年、2022年、2025年三個(gè)時(shí)間段…

        2022年8月9日
      • 為什么不建議你用 MongoDB 這類產(chǎn)品替代時(shí)序數(shù)據(jù)庫(kù)?

        小 T 導(dǎo)讀:此前有人在某問答網(wǎng)站上發(fā)布了這樣一個(gè)問題:既然部分時(shí)序數(shù)據(jù)庫(kù)如 InfluxDB、TimescaleDB 是基于關(guān)系型、非時(shí)序數(shù)據(jù)庫(kù) PostgreSQL 開發(fā)而來,…

        2022年6月19日
      • 新技術(shù)賦能,帶你體驗(yàn)5G新閱讀

        7月22-26日,第五屆數(shù)字中國(guó)建設(shè)峰會(huì)在福州舉行。海峽出版發(fā)行集團(tuán)與戰(zhàn)略合作企業(yè)中國(guó)圖書進(jìn)出口(集團(tuán))有限公司聯(lián)手參展,以“5G新閱讀、新體驗(yàn)”為主題,展示新技術(shù)賦能下的數(shù)字出版…

        2022年8月1日
      • 滿足Z世代用戶需求 三星Galaxy S22系列重塑高端市場(chǎng)規(guī)則

        如今Z世代群體已然躍升為消費(fèi)市場(chǎng)的“主宰者”。然而,Z世代追求的差異化產(chǎn)品體驗(yàn)卻與智能手機(jī)行業(yè)同質(zhì)化趨勢(shì)之間的矛盾日趨明顯,這也使得如何贏取Z世代群體的“芳心”,成為了各大手機(jī)品牌…

        2022年6月17日
      • 吸塵器哪個(gè)牌子好,家用無線吸塵器什么牌子好介紹

        冰尊吸塵器是世界吸塵器十大排名龍頭品牌。近年來,智能家用電器產(chǎn)品越來越受人們的認(rèn)可,尤其是家用無線吸塵器這一類的家居清潔電器,被公認(rèn)為是高效打掃房間、快速提升居家幸福感的清潔神器?!?/p>

        2022年7月23日
      • 韋伯接下來會(huì)干嘛

        既然 NASA 的詹姆斯韋伯太空望遠(yuǎn)鏡的第一批圖像和數(shù)據(jù)已經(jīng)發(fā)布,您可能想知道:接下來會(huì)發(fā)生什么? 天文臺(tái)有一系列科學(xué)項(xiàng)目,研究各種宇宙現(xiàn)象,如行星、恒星、星系、黑洞等。韋伯將徹底…

        2022年8月16日
      • 黑洞的形成

        在宇宙中我們講話,聲音是無法傳播的,這是因?yàn)橛钪嬷袥]有大氣。即宇宙中的粒子是稀疏的,它們各自的距離比較遠(yuǎn)。 太陽的溫度能傳到地球,那么為什么處在傳播路徑的宇宙中的區(qū)域,溫度依舊是冷…

        2022年8月18日
      • OPPO Reno7 5G 開放 ColorOS 12 × Android 12 正式版升級(jí)

        IT之家 6 月 14 日消息,今日,OPPO 官方宣布,OPPO Reno7 5G 開放 ColorOS 12 Android 12 正式版升級(jí)(正式版版本號(hào)為 C.05 及以上…

        2022年6月16日
      • 小程序開發(fā)的優(yōu)勢(shì)

        小程序開發(fā)的優(yōu)勢(shì) 從微信小程序近期開放的功能明顯看出,小程序的發(fā)展前景十分看好,并且隨著時(shí)間的流逝,相信將會(huì)開放更多功能,實(shí)現(xiàn)更多的需求。未來小程序和微信將實(shí)現(xiàn)更佳的鏈接,用戶搜索…

        2022年8月18日

      聯(lián)系我們

      聯(lián)系郵箱:admin#wlmqw.com
      工作時(shí)間:周一至周五,10:30-18:30,節(jié)假日休息