◎文 《法人》雜志全媒體記者 李遼
當(dāng)下,作為大模型企業(yè)的從業(yè)者,北京瑞泊控股(集團(tuán))有限公司(下稱“瑞泊”)董事長(zhǎng)乙壤月正忙于接待各方來客及出席各種高端論壇和行業(yè)峰會(huì),隨時(shí)分享自己最新的觀點(diǎn)和見解,應(yīng)對(duì)日益增長(zhǎng)的公眾期待。短短一年多時(shí)間,伴隨著大模型的突然走紅,瑞泊從無人關(guān)注到成為媒體追逐的焦點(diǎn),承受著與之前截然不同的壓力和挑戰(zhàn)。
▲乙壤月 宋逗/攝
同樣忙碌的,還有北京網(wǎng)智天元科技股份有限公司(下稱“網(wǎng)智天元”)創(chuàng)始人莫倩。盡管網(wǎng)智天元已經(jīng)是國(guó)家級(jí)專精特新“小巨人”企業(yè),但隨著技術(shù)的飛速演進(jìn),他和公司正在進(jìn)行著從大數(shù)據(jù)分析到大模型的全面轉(zhuǎn)型。如今,他的壓力似乎比之前更大,因?yàn)榇竽P捅澈蟮臐摿εc可能性無窮無盡。
▲莫倩 宋逗/攝
等待拐點(diǎn)
莫倩的北京網(wǎng)智天元科技股份有限公司(下稱“網(wǎng)智天元”)2007年便已成立,一直在垂直行業(yè)提供大數(shù)據(jù)分析處理的產(chǎn)品和服務(wù)。
2017年6月12日,谷歌大腦團(tuán)隊(duì)發(fā)布了一篇論文,宣告transformer架構(gòu)的橫空出世。這是人工智能圈子里的爆炸性新聞,也是計(jì)算機(jī)專業(yè)出身的莫倩認(rèn)為最振奮人心的時(shí)刻。
彼時(shí),“一帶一路”國(guó)際合作高峰論壇首次舉辦后不久,國(guó)家急需構(gòu)建一個(gè)具備多元處理能力的大數(shù)據(jù)平臺(tái),對(duì)國(guó)際輿論進(jìn)行深入梳理與分析。面對(duì)全球26種不同語(yǔ)言的挑戰(zhàn),這個(gè)大數(shù)據(jù)平臺(tái)必須具備卓越的翻譯能力?!爱?dāng)時(shí),傳統(tǒng)機(jī)器翻譯還依賴于統(tǒng)計(jì)學(xué)方法,但transformer的出現(xiàn),讓我們得以構(gòu)建一個(gè)接近人類認(rèn)知能力的翻譯大模型。”莫倩回憶。
時(shí)間緊迫,任務(wù)艱巨,莫倩團(tuán)隊(duì)開始了緊鑼密鼓的項(xiàng)目籌備。競(jìng)標(biāo)時(shí),國(guó)內(nèi)幾乎所有從事機(jī)器翻譯和大數(shù)據(jù)處理的頭部公司都參與其中。網(wǎng)智天元憑借對(duì)transformer技術(shù)的深刻理解和掌握,實(shí)現(xiàn)了彎道超車,擊敗了包括知名互聯(lián)網(wǎng)大廠和專業(yè)機(jī)器翻譯企業(yè)在內(nèi)的強(qiáng)勁對(duì)手。
這一契機(jī),讓網(wǎng)智天元與大模型結(jié)下了深厚的緣分,并連續(xù)成為“一帶一路”國(guó)際合作高峰論壇第二屆、第三屆的服務(wù)提供商。回憶起來,莫倩不禁感慨:只有抓住技術(shù)拐點(diǎn),才能在競(jìng)爭(zhēng)中保持領(lǐng)先。
同樣在2017年,乙壤月離開了互聯(lián)網(wǎng)大廠,創(chuàng)立了瑞泊。憑借對(duì)金融資產(chǎn)配置經(jīng)驗(yàn)的積累,他帶領(lǐng)團(tuán)隊(duì)選擇切入金融行業(yè),專攻金融智能系統(tǒng)研發(fā)。由于涉及大量文本和非文本數(shù)據(jù),需要運(yùn)用自然語(yǔ)言處理模型?!坝谑?,我們順理成章地進(jìn)入了大模型領(lǐng)域。”乙壤月說,“當(dāng)時(shí)大模型的概念還不為大家關(guān)注,所以我們?cè)诮榻B時(shí)自稱金融行業(yè)的智能決策公司?!?/p>
在GPT-3.5發(fā)布前,大模型仍然是一條孤獨(dú)的賽道?!皼]有多少同行者,甚至沒有什么競(jìng)爭(zhēng)對(duì)手?!币胰涝禄貞洠?dāng)時(shí)大模型在全球范圍內(nèi)尚未迎來拐點(diǎn),你不知道這條技術(shù)路線何時(shí)能獲得突破?!爱吘梗芏嗉夹g(shù)即使等一輩子也沒能看到突破瓶頸?!?/p>
特別是新冠疫情三年,瑞泊陷入了前所未有的困境?!巴度肴康木唾Y源去打造一家前景莫測(cè)的技術(shù)公司,周圍人都說我們軸,親朋好友幾乎都勸我放棄?!?/p>
在摸索期,乙壤月經(jīng)常捫心自問:“如此巨大的投入,倘若不能成功,是否意味著之前所有的努力與付出都付諸東流?是否應(yīng)當(dāng)采用一些更成熟的技術(shù)路線去解決問題?畢竟,那些路看起來更平坦、更穩(wěn)妥。”
2022年11月,Open AI發(fā)布了GPT-3.5,業(yè)內(nèi)為之沸騰。當(dāng)乙壤月看到新聞時(shí),甚至有些喜極而泣:“這么多技術(shù)門派都在解決同一個(gè)問題,但現(xiàn)在只有大模型走出來了,我心里十分自豪?!彼芍杂X得,做一家技術(shù)公司是需要信仰的,而信仰就是,相信團(tuán)隊(duì)、相信內(nèi)心的判斷。
深耕垂類
通過深入分析,乙壤月認(rèn)為,在通用大模型的賽道上,中國(guó)在算力芯片供應(yīng)等多方面受到制約,算力與美國(guó)相比存在差距,但在垂類大模型的發(fā)展上,主要國(guó)家?guī)缀醵荚?023年上半年開始密集布局?!皬臅r(shí)間維度看,中國(guó)并沒有落后,同時(shí),中國(guó)產(chǎn)業(yè)多樣、配套完善,擁有極為豐富的應(yīng)用場(chǎng)景,這些都是發(fā)展垂類大模型的顯著優(yōu)勢(shì)。只要我們能夠洞察并充分利用這些優(yōu)勢(shì),就不會(huì)弱于美國(guó)。”
此外,雖然通用大模型吸引了眾多目光,但它更多面向普通民眾,并不能解決企業(yè)和行業(yè)面臨的具體問題。“如果我們深耕垂類大模型,不僅能為國(guó)家和社會(huì)創(chuàng)造更大價(jià)值,同時(shí)自身的機(jī)會(huì)也會(huì)更多?!?/p>
乙壤月舉例,如果讓通用大模型撰寫一篇醫(yī)療或金融領(lǐng)域的專業(yè)文章,它所依賴的往往是書本或互聯(lián)網(wǎng)上的公開資料,而這些資料在實(shí)際工作中缺乏足夠的專業(yè)性。在行業(yè)和企業(yè)中應(yīng)用的大模型,需要經(jīng)過特定的訓(xùn)練和優(yōu)化?!巴ㄓ么竽P秃帽仁峭ú?,而垂類大模型則相當(dāng)于專業(yè)領(lǐng)域的專家。”他說。
莫倩也做了同樣的選擇。在選擇長(zhǎng)期深耕的方向時(shí),他認(rèn)為通用大模型的競(jìng)爭(zhēng)非常激烈,算力投入巨大,雖然自己的公司已具備一定規(guī)模,但長(zhǎng)期承受如此巨大的資金壓力很不現(xiàn)實(shí)?!按竽P桶l(fā)展一日千里?!彼f,“往往投入巨資,耗時(shí)數(shù)月甚至數(shù)年研發(fā)出一個(gè)滿意的模型,但可能不出一個(gè)月,別人就訓(xùn)練出了一個(gè)更好的模型?!?/p>
因此,他選擇與行業(yè)巨頭合作,專注于開發(fā)細(xì)分場(chǎng)景的垂類大模型。憑借過去10年在金融大數(shù)據(jù)服務(wù)領(lǐng)域積累的豐富數(shù)據(jù),網(wǎng)智天元成為了華為、阿里、移動(dòng)和電信等企業(yè)開發(fā)金融風(fēng)險(xiǎn)大模型的唯一合作伙伴。
瑞泊同樣在金融領(lǐng)域發(fā)力?!捌┤纾瑸楦邇糁等巳哼M(jìn)行資產(chǎn)配置時(shí),需要考慮股票、私募、公募、債券等多種投資工具。通用大模型和垂類大模型的差別,在這種情況下就非常明顯。后者可以根據(jù)每個(gè)人的具體需求,量身定制資產(chǎn)配置方案?!?/p>
如今,瑞泊還切入了航運(yùn)行業(yè),就拿很簡(jiǎn)單的翻譯來講:“如果使用互聯(lián)網(wǎng)大廠的通用大模型翻譯一篇普通文章,效果尚可以保證,而一旦涉及航運(yùn)這樣的專業(yè)領(lǐng)域,通用大模型在處理許多專有名詞和術(shù)語(yǔ)時(shí)就顯得力不從心。”
未來暢想
大模型火了,乙壤月的重負(fù)有所減輕,但壓力仍如影隨形?!拔覀儾粩嘁娮C重大的技術(shù)突破和發(fā)現(xiàn),同時(shí)迎來了各種重大的商業(yè)合作機(jī)遇。我們現(xiàn)在要承受的是任務(wù)交付的壓力和面對(duì)外界對(duì)我們的高期待?!睒I(yè)內(nèi)仍在不斷涌現(xiàn)新興技術(shù)路線,是否應(yīng)該跟進(jìn)?他坦言,這些決策的壓力并不比以前輕松。
大模型迭代迅速的同時(shí),瑞泊也處于快速的發(fā)展之中。今年,瑞泊對(duì)自己的定位進(jìn)行了升級(jí)?!叭ツ?,大家都說我們是大模型企業(yè),現(xiàn)在我們把自己定位為關(guān)鍵行業(yè)的超腦構(gòu)建者?!?/p>
乙壤月進(jìn)一步闡釋,所謂的超腦,即超級(jí)大腦?!半m然大模型功能強(qiáng)大,但仍有其局限性。例如,在數(shù)值計(jì)算上可能出錯(cuò),也會(huì)有模型幻覺問題。大模型只是超腦的一個(gè)組成部分,我們的建設(shè)目標(biāo)是如何規(guī)避大模型的短板,同時(shí)最大化其優(yōu)勢(shì)。”
他用一個(gè)更加形象的比喻來說明:“就像出去打仗,你需要的是一支完整的部隊(duì),而不是一位將軍。大模型就像這位將軍,雖然能力出眾,但無法代替整個(gè)部隊(duì)。超腦就像部隊(duì),用多種技術(shù)、多個(gè)核心部件的組合打造行業(yè)解決方案,能夠滿足企業(yè)多方面、多角度的需求?!?/p>
莫倩則提出了全域智能的概念。他認(rèn)為,人工智能發(fā)展到終極階段必將成為全域智能。“人工智能的第一層是信息智能,但其受限于網(wǎng)絡(luò)這個(gè)虛擬世界;第二層是認(rèn)知智能,它能夠與人互動(dòng),改變?nèi)说恼J(rèn)知和情感。如同網(wǎng)智天元正在研發(fā)一款能夠與兒童互動(dòng)的玩具,能模擬父母的聲音,長(zhǎng)時(shí)間陪伴兒童,正是認(rèn)知智能的體現(xiàn)?!彼f,第三層則是具身智能,即機(jī)器能夠與物理世界進(jìn)行交互,就像電影《非誠(chéng)勿擾3》中所描繪的場(chǎng)景。
他認(rèn)為,全域智能將為人工智能打開無限可能性,將重新洗牌所有賽道,消融你熟悉的一切,對(duì)現(xiàn)有的格局進(jìn)行徹底的顛覆,“那一天很快就會(huì)到來”。
編審|渠 洋
責(zé)編|白 馗
校對(duì)|張波 張雪慧