來源:獵云精選;文/邵延港
當(dāng)大家還在討論“AI孫燕姿”時,在云知聲闊別多年的發(fā)布會現(xiàn)場,AI模仿網(wǎng)絡(luò)電臺主播程一的聲音讀了一段AI生成的文案,語氣深情浪漫,音色富有磁性,塑造了一個讓程一本人都驚訝的“AI程一”。毋庸置疑,這又是出自大模型的“作品”。
去年12月,入行十年的中國AI廠商云知聲創(chuàng)始人黃偉第一次見到ChatGPT時,在震撼之余感受到的卻是沮喪,一瞬間覺得自己創(chuàng)業(yè)十年來,所積累的技能以及自己安身立命的東西,似乎變得毫無價值。
黃偉和程一的感受類似,都覺得職業(yè)生涯將遭受沖擊。黃偉在之后用了一周的時間去研究“ChatGPT到底是什么”,后來發(fā)現(xiàn)“好像也沒什么”,ChatGPT只是把模型做得更大而已,以云知聲團隊的技術(shù)實力和工程化經(jīng)驗也可以做出來。
于是,云知聲公司內(nèi)部在去年12月中下旬組建團隊,在今年2月底就拿出來屬于自己的第一版大模型,并將其取名“山?!?。歷經(jīng)優(yōu)化和打磨后,5月24日,云知聲正式對外發(fā)布山海大模型,便出現(xiàn)了文章開頭那一幕。
云知聲創(chuàng)始人、CEO 黃偉
云知聲不是第一家發(fā)布大模型的人工智能廠商,當(dāng)然也不會是最后一個。ChatGPT帶來的大模型競賽的背后,其實是人工智能產(chǎn)業(yè)多年來飽受爭議和不理解后的爆發(fā)。市場從未像今天一樣對人工智能如此充滿期待,大模型開辟了通往AGI(通用人工智能)時代的新范式,云知聲在十余年后站上了AI 2.0時代的新起點。
山海大模型——云知聲奔向AGI時代的“光”
對于時常因商業(yè)化不及預(yù)期而被詬病的AI產(chǎn)業(yè)來說,大模型的出現(xiàn)仿佛就是光。
所謂大模型,是新技術(shù)范式,而非新發(fā)明。深度學(xué)習(xí)算法經(jīng)過十多年的積累,在Open AI的整合下,調(diào)校出轟動世界的ChatGPT。這種新的技術(shù)范式,讓人類看到AGI時代到來的愿景。山海大模型,正是云知聲基于已有算法和知識做的一次工程革命。
在曾經(jīng)“AI產(chǎn)品跟著客戶需求走”的時代里,云知聲等人工智能廠商提供專用系統(tǒng)+智能模塊的方式,為客戶提供鑒別式的人工智能,即運用已有的數(shù)據(jù)訓(xùn)練模型,完成特定任務(wù),回答是或否來提高決策效率。大模型出現(xiàn)后,其深度理解能力能夠生成高質(zhì)量、創(chuàng)造性的結(jié)果,人機交互模式和質(zhì)量也產(chǎn)生了質(zhì)變。
云知聲在作出研發(fā)大模型的決定后,隨即組建了一支靈活的團隊,用時兩個半月后便拿出來第一版,并將其命名為“山?!?。據(jù)介紹,“山”是高山仰止,是大智知止;“?!笔呛<{百川,有容乃大;“山海”還代表著云知聲的堅持,所愛隔山海,山海皆可平,“山?!钡拿闳∽云渲小?/p>
有GPT珠玉在前,云知聲為山海大模型賦予的使命是以通用人工智能,創(chuàng)造一個互聯(lián)、直觀的世界。有了山海大模型,云知聲將不再是5個月前的云知聲。
在發(fā)布會現(xiàn)場,云知聲現(xiàn)場展示了山海大模型的十項核心能力,其中包括語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)能力七項通用能力及插件擴展、領(lǐng)域增強、企業(yè)定制三項行業(yè)落地能力,云知聲通過語音輸入、實時互動的方式進行講解演示,在展示過程中也看到山海大模型在某些行業(yè)的表現(xiàn)要明顯優(yōu)于GPT4。
山海大模型語言理解能力現(xiàn)場演示
作為云知聲5個多月的作品,山海大模型并非只有這十項技能,云知聲也不會滿足只有十項能力。云知聲需要山海大模型具備更多能力來適應(yīng)客戶需求,以打造奔向AGI時代路上的基礎(chǔ)實力。
五個月就發(fā)布的大模型,云知聲籌備了十年
盡管有人認為大模型是巨頭的專利,但云知聲沒有放棄。從2012年入局深度學(xué)習(xí),到后來搭建AI全棧能力,再到大模型角力,過去十年里,云知聲經(jīng)歷了一輪輪市場洗禮與自我變革。云知聲能夠成為第一批發(fā)布大模型的人工智能公司之一,離不開其在十余年中的每一個堅定步伐。
在過去十年里,云知聲有過三次技術(shù)躍遷,被稱作云知聲的AI三級跳:
第一次是云知聲創(chuàng)立時,深度學(xué)習(xí)之父辛頓帶領(lǐng)團隊拿下2012年的ImageNet視覺識別挑戰(zhàn)賽冠軍,云知聲緊跟深度學(xué)習(xí)興起的浪潮;
第二次是在2016年,谷歌阿爾法狗擊敗人類圍棋冠軍李世石,云知聲開始重視算力;
第三次即眼下大模型的爆發(fā),云知聲迅速跟進,拿到一張通往AGI時代的船票。
縱觀云知聲的發(fā)展歷程:2012年,云知聲成立時以深度學(xué)習(xí)切入,構(gòu)建了深度學(xué)習(xí)、大數(shù)據(jù)、超算為核心的AI三駕馬車的發(fā)展戰(zhàn)略;2016年布局了Atlas超算平臺及全棧AI技術(shù),發(fā)布語用計算平臺,2017 年布局行業(yè)知識圖譜,構(gòu)建認知技術(shù)體系,2018年提出U+X 戰(zhàn)略,即以 U(AI 架構(gòu)及全棧技術(shù)),深度結(jié)合 X(行業(yè)應(yīng)用場景),解決行業(yè)深層問題,向規(guī)?;疉I進發(fā)。
大模型是從小模型、中模型基于算力、算法和數(shù)據(jù)開始鍛造出來。云知聲通過可彈性擴容的算力工程Atlas、自研大模型訓(xùn)練和推理一體化框架的算法工程Uniscale、以及歷經(jīng)十年積累到600T行業(yè)數(shù)據(jù)的數(shù)據(jù)工程UniDataOps,三者結(jié)合大力出奇跡,打造了山海之功。
在云知聲一直深耕的醫(yī)療領(lǐng)域,山海大模型已經(jīng)調(diào)校出極高的行業(yè)水準。據(jù)云知聲介紹,在MedQA測評中,山海大模型、GPT4、Med-PalM、GPT3.5的水平分別達到81.56%、71.07%、67.6%、40.31%;在臨床執(zhí)業(yè)醫(yī)師資格考試中,山海大模型、SOTA分別達到511分、456分,遠超365分的平均分和360分的及格線。在醫(yī)療領(lǐng)域,山海大模型的表現(xiàn)甚至優(yōu)于GPT-4中文水平。
在過去的十年里,云知聲從數(shù)據(jù)算法算力的建設(shè)、工程化落地能力以及商業(yè)化場景能力均有規(guī)劃,這才有了云知聲發(fā)布山海大模型的“底蘊”,以及黃偉發(fā)出對“云知聲過去的十年仿佛都是為山海而生”的感慨。
商業(yè)化思路更明晰,云知聲U+X戰(zhàn)略提速
當(dāng)被問及:是不是有了大模型,人工智能廠商的場景落地和商業(yè)化就會變得容易了?黃偉稱,這個問題到今天應(yīng)該有個明確的答案了。有了大模型,AI廠商具備了更強大的能力,能夠更好得滿足客戶需求,也能更容易地去商業(yè)化落地。
在AI 1.0時代,雖然基于深度學(xué)習(xí),每家都有強大的技術(shù),但整體上并沒有本質(zhì)改變AI用于分類的任務(wù),分類種類的增加仍然處在量變階段,限制了AI創(chuàng)造價值的上限。到了AI 2.0時代,大模型為人工智能帶來了更多的能力,可以打造更多新的產(chǎn)品,滿足客戶更多的需求。
山海大模型能做什么?黃偉表示,云知聲將以山海大模型為基礎(chǔ),打造MaaS 模式的AI 2.0解決方案,在通用能力基礎(chǔ)上,增強物聯(lián)、醫(yī)療等行業(yè)能力,為客戶提供更智能、更靈活的解決方案,打開更大的AI技術(shù)產(chǎn)業(yè)化商業(yè)空間。
AI只有落地應(yīng)用才能實現(xiàn)價值,這句話至今依然適用。云知聲將大模型視為人工智能2.0時代的發(fā)電廠,可以更充分地利用數(shù)據(jù)的價值。黃偉認為,誰掌握了大模型,也就會具備更大的商業(yè)價值。
在發(fā)布會現(xiàn)場,云知聲圍繞著十大核心能力,與具體場景做融合。作為云知聲的核心業(yè)務(wù)場景,山海大模型在MedQA和臨床執(zhí)業(yè)醫(yī)師資格考試中強于GRT4的結(jié)果,振奮了山海大模型的研發(fā)團隊。在智慧醫(yī)療領(lǐng)域,有了山海大模型加持,原產(chǎn)品最新融入了手術(shù)病歷撰寫助手、門診病歷生成系統(tǒng)、商保智能理賠系統(tǒng)三大醫(yī)療產(chǎn)品應(yīng)用。
如手術(shù)病歷撰寫助手,在外科醫(yī)生手術(shù)過程的語音已經(jīng)錄入的情況下,山海大模型通過理解和分析能力,過濾掉無關(guān)內(nèi)容,將醫(yī)生在整個手術(shù)過程中零散的口頭化的語音信息進行理解標化成信息摘要,形成手術(shù)記錄所需要的關(guān)鍵信息。人工審核完成后,最終幫助醫(yī)生撰寫一篇五百到一千字的手術(shù)記錄,解決醫(yī)生費時費心撰寫手術(shù)記錄的痛點。
山海大模型 門診病歷撰寫助手應(yīng)用
在云知聲重點布局的智慧物聯(lián)場景中,山海大模型也將會進行場景融合,塑造出一個真正的隨身管家,使其在方方面面從只能進行指令交互升級為類人對話,真正聯(lián)動IoT生態(tài)和服務(wù)。
此外,在銷售、知識管理和教育場景中,云知聲也會基于山海大模型,對產(chǎn)品進行升級,讓信息反饋更精準,以滿足用戶更深層次的需求。
但山海大模型的意義不只是未來升級現(xiàn)有的場景應(yīng)用能力,不斷拓展其作為AGI的邊界才是真正使命。
山海大模型目前仍在升級中,5月24日發(fā)布的版本已經(jīng)在模型參數(shù)和量化方面,進行了很多工程優(yōu)化,相比二月底的版本,在推理速度方面提升了五倍。云知聲的目標是在2023年內(nèi)將山海大模型的通用能力比肩ChatGPT,并在醫(yī)療、物聯(lián)、教育等多個垂直領(lǐng)域能力超越GPT4。
在商業(yè)化拓展的規(guī)劃上,云知聲稱會繼續(xù)施行U+X戰(zhàn)略,構(gòu)建AGI+Industry生態(tài),繼續(xù)賦能百業(yè)。在發(fā)布會上,云知聲與中建電子、京東科技、360簽署戰(zhàn)略合作協(xié)議,深度合作形成生態(tài),推動山海大模型在各領(lǐng)域的落地應(yīng)用。
黃偉說:“我相信,山海將成為連接世界、拓寬人類認知邊界的橋梁。在未來的探索與發(fā)展中,云知聲將一如既往地秉持創(chuàng)新、開放、合作的精神,與合作伙伴共同努力,推動人工智能技術(shù)的發(fā)展,為人類的未來注入無限活力?!?/p>
在AGI時代里,暫時無法去定義大模型的邊界在哪里,對于AI從業(yè)者來說,當(dāng)前的確是到了AI落地應(yīng)用得更好的時代。山海大模型的能力在增強,未來也將在一次次的未知中探索更精妙的答案。