記者 | 李京亞
編輯 |
根據(jù)福布斯調(diào)研報告,企業(yè)成為數(shù)據(jù)驅(qū)動型公司后,收入會增加20%,同時成本會減少30%。
2021年是國內(nèi)企業(yè)數(shù)智化意識全面升級的一年。根據(jù)中國軟件網(wǎng)及海比研究院發(fā)布的《2022中國企業(yè)數(shù)智服務(wù)市場趨勢洞察報告》,國內(nèi)企業(yè)級服務(wù)市場正處在高速增長狀態(tài),截止2021年底,總體市場規(guī)模達(dá)到3.6萬億,今年年底預(yù)期突破4萬億,且預(yù)計2020-2025年期間年均復(fù)合增長率將達(dá)到20%。
數(shù)智化是數(shù)字化基礎(chǔ)上的更高訴求。企業(yè)數(shù)字化轉(zhuǎn)型主要是為了提升經(jīng)營效率,而企業(yè)數(shù)智化轉(zhuǎn)型則是尋找創(chuàng)新選代的支撐點,幫助自身完成從數(shù)據(jù)到?jīng)Q策到執(zhí)行的完整閉環(huán)。
現(xiàn)實的生產(chǎn)環(huán)境里,數(shù)據(jù)源并不是單一的。如果說,Spark是目前價值最高的大數(shù)據(jù)處理框架,Tensorflow、PyTorch是機器學(xué)習(xí)訓(xùn)練中最好的計算框架,涉及到端到端完成一個智能項目,就需要用到不同類型的大數(shù)據(jù)與機器學(xué)習(xí)工具,無法找到一種最佳工具實現(xiàn)。多項調(diào)查顯示,數(shù)據(jù)治理和機器學(xué)習(xí)的割裂其實是影響企業(yè)數(shù)智化轉(zhuǎn)型的一大隱秘痛點。
亞馬遜云科技大中華區(qū)產(chǎn)品部總經(jīng)理陳曉建認(rèn)為,在企業(yè)數(shù)智化轉(zhuǎn)型中,大數(shù)據(jù)和機器學(xué)習(xí)部門大多分治,由三個原因造成:第一,在很多企業(yè),這兩個功能分屬完全不同的團隊,數(shù)據(jù)也放在不同的倉庫,機器學(xué)習(xí)團隊獲取數(shù)據(jù)需要跨業(yè)務(wù)部門,還要花很多時間理解背后含義;第二,很多機器學(xué)習(xí)團隊并不具備處理海量數(shù)據(jù)規(guī)模的能力;第三,數(shù)據(jù)分析人員在算法迭代中參與程度較低。
亞馬遜云科技對此提出了一個解決方案:建立一個統(tǒng)一融合的數(shù)據(jù)底座,為機器學(xué)習(xí)提供生產(chǎn)級的數(shù)據(jù)處理能力,將研發(fā)和業(yè)務(wù)統(tǒng)一起來發(fā)揮價值。
智能湖倉是這一解法的具像。智能湖倉并非一個產(chǎn)品,而是一套架構(gòu),如果同等替換為亞馬遜云科技現(xiàn)有產(chǎn)品體系,以中間部分基于Amazon S3構(gòu)建的數(shù)據(jù)湖為中心,外圍有六大數(shù)據(jù)服務(wù),包括:關(guān)系型數(shù)據(jù)庫Amazon Aurora,非關(guān)系型數(shù)據(jù)庫Amazon DynamoDB,機器學(xué)習(xí)服務(wù)Amazon SageMaker,數(shù)據(jù)倉庫Amazon Redshift,日志服務(wù)Amazon Opensearch Service,大數(shù)據(jù)服務(wù)Amazon EMR。
在2020年的亞馬遜云科技re:Invent大會上,亞馬遜云科技正式發(fā)布了智能湖倉。在一年之后的2021re:Invent大會上,亞馬遜云科技發(fā)布了Serverless能力,代表著智能湖倉架構(gòu)的一次大型技術(shù)演進(jìn)。Serverless給幾大數(shù)據(jù)產(chǎn)品帶來了更多靈活的擴展能力,可以實現(xiàn)數(shù)據(jù)的自由流動與統(tǒng)一治理。
硅谷銀行是智能湖倉架構(gòu)在海外客戶的代表,這家銀行業(yè)務(wù)場景聚焦在信用卡欺詐和產(chǎn)品收益領(lǐng)域,為超過三萬家初創(chuàng)企業(yè)提供種子基金,智能湖倉架構(gòu)所實現(xiàn)的整個數(shù)據(jù)平臺的互融互通,切中了硅谷銀行的痛點。
硅谷銀行采用了Amazon SageMaker替代傳統(tǒng)的IDC實現(xiàn)機器學(xué)習(xí)的方式,在背后的數(shù)據(jù)處理上采用了全套結(jié)合了Amazon Lake Formation的治理能力,實現(xiàn)了在數(shù)據(jù)量并不確定的創(chuàng)新項目上,敏捷地完成業(yè)務(wù)迭代。與亞馬遜云科技合作第一年后,硅谷銀行就實現(xiàn)了4300萬美元的成本節(jié)省。
從現(xiàn)實情況看,智能湖倉所代表的新型開放架構(gòu)尚處于發(fā)展早期,相比于對產(chǎn)品力期待更高的海外客戶,國內(nèi)客戶往往對解決方案深入場景的能力更有要求。
以企業(yè)數(shù)字化營銷領(lǐng)域為例,國內(nèi)企業(yè)現(xiàn)在的數(shù)字化營銷面臨流量獲取方面的巨大挑戰(zhàn)。Convertlab是一家數(shù)據(jù)分析營銷服務(wù)商,創(chuàng)始團隊來自SAP,主要業(yè)務(wù)是幫助零售客戶提高用戶轉(zhuǎn)化率,其聯(lián)合創(chuàng)始人兼CTO李征發(fā)現(xiàn),在企業(yè)運營中,數(shù)據(jù)處理和分析占據(jù)了大量精力,而且數(shù)據(jù)治理和機器學(xué)習(xí)的割裂影響著業(yè)務(wù)閉環(huán)的形成。在執(zhí)行機器學(xué)習(xí)中,團隊65%以上的時間花費在數(shù)據(jù)本身質(zhì)量提升和處理上,而不是真正執(zhí)行機器學(xué)習(xí)訓(xùn)練、算法選擇、參數(shù)優(yōu)化、特征分析。
2021年開始,Convertlab跟亞馬遜云科技展開了全面合作,基于亞馬遜云科技統(tǒng)一的數(shù)據(jù)基礎(chǔ)底座, Convertlab構(gòu)建了一體化數(shù)據(jù)智能湖倉架構(gòu)和高效機器學(xué)習(xí)平臺,可以快速把異構(gòu)數(shù)據(jù)源轉(zhuǎn)化成同一個,進(jìn)而實施精細(xì)化的數(shù)據(jù)驅(qū)動策略。李征發(fā)現(xiàn),這個基礎(chǔ)底座使Convertlab的數(shù)據(jù)流轉(zhuǎn)時效性提升32%,整個電子渠道GMV提升比例上升到6.34%,同時,Convertlab各類場景模型上線效率提升30%,得以為客戶的數(shù)字化營銷做出更充裕準(zhǔn)備。
界面新聞了解到,目前,在亞馬遜云科技全球幾百萬客戶當(dāng)中,使用大數(shù)據(jù)和機器學(xué)習(xí)的客戶在十萬數(shù)量級,其中包括寶馬集團、F1、西門子、Coinbase這樣的深度客戶。