參考消息網(wǎng)4月10日報道據(jù)法國《回聲報》網(wǎng)站4月8日報道,金融界可能不久就會迎來自己的ChatGPT(聊天生成預(yù)訓(xùn)練轉(zhuǎn)換器)。經(jīng)濟和金融信息服務(wù)企業(yè)彭博社,正在開發(fā)一款基于其幾十年來收集數(shù)據(jù)的人工智能(AI)生成系統(tǒng)。自1981年就開始向金融市場職業(yè)人士提供服務(wù)的彭博社,上周宣布正在致力于這一名叫“彭博GPT”的項目。
彭博社和約翰·霍普金斯大學的研究人員在介紹項目時寫道,該算法有“500億個參數(shù),是從廣泛的金融數(shù)據(jù)中整理出來的”。第一版本的該系統(tǒng)目前還沒有對公眾開放。
彭博社給金融行業(yè)帶來了一場革命,讓市場參與者可以接觸到海量的經(jīng)濟和金融信息,也讓自己成為全球投資者的一個參考平臺。該企業(yè)宣稱,已經(jīng)“針對一個從未有過的領(lǐng)域,建立了最全面專業(yè)數(shù)據(jù)集合”。它明確表示,其AI生成系統(tǒng)“超過了金融界現(xiàn)存的所有模型”。
彭博新模型的運行十分接近于ChatGPT,基于的是大型語言模型(LLM),能夠?qū)τ猛ㄓ谜Z言提出的問題生成答案。這一AI模型可以幫助彭博社“分析情感屬性”,例如可以確定一則消息對市場上的某家企業(yè)是正面的還是負面的。模型還可以便于在終端上查找數(shù)據(jù),或者根據(jù)信息內(nèi)容自動生成文章標題。
“彭博GPT”最主要的王牌,是其建立在一個十分專業(yè)的金融數(shù)據(jù)集基礎(chǔ)之上。其他的AI系統(tǒng)涵蓋的范圍可能要廣泛得多,但是并不一定總能接觸到高質(zhì)量的內(nèi)容,因此在答案方面可能就沒那么確切。
“彭博GPT”的訓(xùn)練建立在包括7000億個標記的大型訓(xùn)練語料庫之上。在這7000億個標記中,有3630億個來自彭博社自己的金融數(shù)據(jù)或者由公司專門甄選。這是一個龐大的金融資料集合,“包括新聞、公告、網(wǎng)絡(luò)抓取的資料、從彭博檔案中提取的社交網(wǎng)絡(luò)信息等”。其他的標記則來自公開數(shù)據(jù)。相比較之下,2020年推出的ChatGPT-3版本,其訓(xùn)練語料庫的標記是5000億個。(編譯/蘆龍軍)