經(jīng)濟(jì)觀察網(wǎng) 記者 萬敏 11月11日下午,2023金融街論壇年會(huì)“金融科技創(chuàng)新與合規(guī)安全”平行論壇在北京舉辦。度小滿CTO許冬亮在主題發(fā)言中表示,大模型高度依賴數(shù)據(jù)、算力和人才,只有極少的企業(yè)能夠從頭到尾地完成產(chǎn)業(yè)級(jí)研發(fā),尤其是在金融領(lǐng)域,更需要多方共建生態(tài)。
許冬亮表示,從今年年初的大模型浪潮以來,行業(yè)內(nèi)為之感到的興奮遠(yuǎn)超區(qū)塊鏈、元宇宙等新概念。因?yàn)榇竽P涂吹玫健⒂玫玫剑藗兡軌蝮w會(huì)到它真實(shí)的魅力所在。
許冬亮表示,底層的模型發(fā)展趨勢(shì)上,從早期的ChatGPT和文心一言為代表的通用大模型是第一波浪潮。目前,通用大模型的這一波浪潮的參與者基本上已經(jīng)確定。然而,在此基礎(chǔ)上,更大的是分行業(yè)的浪潮。通用大模型在通識(shí)能力方面表現(xiàn)不錯(cuò),但由于專業(yè)數(shù)據(jù)等方面的原因,它無法在行業(yè)中達(dá)到深入的理解。
在許冬亮看來,第二波可以稱之為+AIGC,即在現(xiàn)有企業(yè)產(chǎn)品服務(wù)的基礎(chǔ)上,將生成式人工智能技術(shù)應(yīng)用其中,以提升更好的產(chǎn)品服務(wù)。然而,這一波應(yīng)用還處于淺層。它只是在原有基礎(chǔ)上對(duì)生成人工智能進(jìn)行簡(jiǎn)單的應(yīng)用,而沒有能夠?qū)φ麄€(gè)業(yè)務(wù)模式進(jìn)行重新再造。因此,在未來,下一波應(yīng)用層面的浪潮是使用AI的能力來原生地再造原有的產(chǎn)品服務(wù)形態(tài)以及B端運(yùn)行模式。這將推動(dòng)智能化時(shí)代進(jìn)入一個(gè)全新的階段。
“一方面,金融領(lǐng)域的數(shù)據(jù)分散在各個(gè)金融機(jī)構(gòu),通用大模型缺少金融數(shù)據(jù)進(jìn)行訓(xùn)練,金融專業(yè)知識(shí)不足;另一方面,如果從底層開始訓(xùn)練大模型,所需要投入的算力成本非常高,比如千億級(jí)別的通用大模型,訓(xùn)練一次需要付出幾千萬的成本”,許冬亮解釋道,“因此,金融大模型的產(chǎn)業(yè)應(yīng)用需要場(chǎng)景應(yīng)用方(金融機(jī)構(gòu))、模型提供方、訓(xùn)練工具提供方等多方共建,共同參與”。
許冬亮表示,在金融大模型場(chǎng)景端應(yīng)用落地時(shí),面臨著許多問題,其中最為重要的五大關(guān)鍵問題。第一是基礎(chǔ)模型的選擇。第二是場(chǎng)景數(shù)據(jù)的利用,因?yàn)閳?chǎng)景端存在大量數(shù)據(jù)如何融入模型中。第三是模型存在的缺陷,如幻覺問題、專業(yè)性問題,如何控制?四是在每個(gè)人未來都將使用大模型的情況下,如何構(gòu)建競(jìng)爭(zhēng)壁壘。最后是底層的安全合規(guī)保障。
許冬亮認(rèn)為,場(chǎng)景端問題需要根據(jù)場(chǎng)景自身的能力要求來確定基礎(chǔ)模型和對(duì)應(yīng)的訓(xùn)練策略。例如,如果只需要知識(shí)問答能力,10億級(jí)別的模型就足夠了。如果需要摘要提取抽象能力,百億級(jí)別模型就足夠了。如果需要很強(qiáng)的邏輯能力,則需要千億級(jí)別的模型。同時(shí),根據(jù)數(shù)據(jù)量和任務(wù)復(fù)雜度的不同,選擇不同的方式。如果數(shù)據(jù)量越大且復(fù)雜度越高,則需要從預(yù)訓(xùn)練開始。如果數(shù)據(jù)量不大或任務(wù)不高,則可以直接使用prompt(提示詞)工程解決。
關(guān)于場(chǎng)景端的數(shù)據(jù)利用問題,許冬亮表示,對(duì)于擁有大量用戶交互數(shù)據(jù)的機(jī)構(gòu),如度小滿累計(jì)了千萬小時(shí)的對(duì)話數(shù)據(jù),金融機(jī)構(gòu)手頭的數(shù)據(jù)量更多。如何利用好這些數(shù)據(jù)?需要做好幾個(gè)方面。首先是底層的標(biāo)注,因?yàn)閷?duì)話數(shù)據(jù)中存在許多低質(zhì)量和碎片化的問題。如果簡(jiǎn)單使用人工標(biāo)注,每個(gè)標(biāo)注需要40分鐘,成本較高。因此,使用人機(jī)結(jié)合協(xié)同標(biāo)注體系來構(gòu)建高質(zhì)量的數(shù)據(jù),并將數(shù)十萬的SFT數(shù)據(jù)納入場(chǎng)景中激發(fā)對(duì)話能力。頂層的強(qiáng)化學(xué)習(xí)是一個(gè)精密的系統(tǒng)工程,可以顯著提高最終的對(duì)話效果,其中包含許多專家經(jīng)驗(yàn)。
同時(shí),許冬亮也認(rèn)為,對(duì)于大模型的缺陷,如計(jì)算精度問題、幻覺問題、專業(yè)性問題、時(shí)效性問題,需要通過復(fù)雜系統(tǒng)工程的方法解決,如搜索增強(qiáng)、與知識(shí)庫結(jié)合、與上游業(yè)務(wù)引擎結(jié)合等。這需要一個(gè)完整的工具集在原有技術(shù)架構(gòu)的基礎(chǔ)上進(jìn)行升級(jí),以支持大模型的落地應(yīng)用。通過這種方法可以控制大模型本身原有的能力欠缺,而這些解決方案都是在經(jīng)過一段時(shí)間的積累后逐漸成熟。
隨著大模型技術(shù)在越來越多金融機(jī)構(gòu)落地應(yīng)用,如何防范大模型的潛在合規(guī)風(fēng)險(xiǎn)也備受關(guān)注。“金融是強(qiáng)監(jiān)管行業(yè),安全合規(guī)是大模型落地的前提條件和重要保障。金融大模型安全合規(guī)既需要監(jiān)管政策的約束,更需要大模型企業(yè)自身的主動(dòng)作為”,許冬亮認(rèn)為,“大模型需要學(xué)習(xí)人類的價(jià)值觀,保護(hù)好用戶的個(gè)人權(quán)益,確保輸出結(jié)果可信可控”。
京公網(wǎng)安備 11010802028547號(hào)