




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
目錄
一、概述.............................................................1
二、大模型技術與產(chǎn)品發(fā)展現(xiàn)狀........................................2
(一)工程化應用主要環(huán)節(jié)與技術..................................2
(二)國內(nèi)外主要產(chǎn)品情況.........................................9
三、大模型在金融業(yè)應用與探索實踐...................................10
(一)技術路線..................................................10
(二)使用方式..................................................14
(三)應用場景..................................................17
(四)應用趨勢..................................................29
四、大模型在金融業(yè)應用面臨的風險與挑戰(zhàn)............................30
(一)金融應用規(guī)范與指南亟需完善...............................30
(二)金融應用場景缺少范式......................................31
(三)高質(zhì)量金融訓練數(shù)據(jù)欠缺...................................32
(四)訓練算力支撐普遍不足......................................32
(五)算法可信度和安全性有待提升...............................33
五、多措并舉提升大模型金融業(yè)應用水平...............................34
(一)加強金融應用的指導與管理.................................34
(二)有序推動金融應用場景落地.................................34
(三)積極構(gòu)建高質(zhì)量金融數(shù)據(jù)集.................................35
(四)產(chǎn)用協(xié)同共筑AI算力基礎設施...............................35
(五)完善算法優(yōu)化與風險管控體系...............................36
附錄................................................................38
案例一:郵儲銀行基于大模型的智能知識問答........................38
案例二:某股份制銀行基于騰訊云TI-OCR大模型單據(jù)處理............41
案例三:某股份制銀行基于騰訊云金融大模型的智能客服.............45
案例四:某股份制銀行基于中科可控的金融大模型服務平臺...........48
案例五:北京銀行AIB金融智能應用平臺............................52
案例六:上海銀行基于開源大模型的智能辦公助手...................55
案例七:國信證券輔助運營人員服務客戶場景.......................57
案例八:螞蟻金融大模型應用-支小寶2.().....................................................59
一、概述
近年來,以人工智能為代表的新一代信息技術加速應用,特
別是基于大模型、大數(shù)據(jù)、大算力的ChatGPT的發(fā)布,標志著人
工智能技術取得里程碑式突破,推動科技創(chuàng)新進入新階段。隨著
大模型技術的迅猛發(fā)展和場景價值的不斷涌現(xiàn),該技術或?qū)⒅厮?/p>
多個行業(yè)的工作方式和格局。
為穩(wěn)步推動生成式人工智能在各行各業(yè)的有序應用,我國陸
續(xù)出臺一系列政策法規(guī)和管理辦法,《國務院2023年度立法工
作計劃》將人工智能法納入了國家立法計劃,《生成式人工智能
服務管理暫行辦法》提出了促進生成式人工智能技術發(fā)展的具體
措施,《網(wǎng)絡安全標準實踐指南——生成式人工智能服務內(nèi)容標
識方法》指導生成式人工智能服務提供者等有關單位做好內(nèi)容標
識工作,《生成式人工智能服務安全基本要求》(征求意見稿)
給出了生成式人工智能服務在語料安全、模型安全、安全措施、
安全評估等方面的基本要求,《全球人工智能治理倡議》主張建
立人工智能風險等級測試評估體系,不斷提升人工智能技術的安
全性、可靠性、可控性、公平性。
金融業(yè)是數(shù)字化、智能化的先行者,有望成為大模型技術落
地的最佳領域之一?!督鹑诳萍及l(fā)展規(guī)劃(2022-2025年)》明
確提出要抓住全球人工智能發(fā)展新機遇,以人為本全面推進智能
技術在金融領域深化應用,強化科技倫理治理,著力打造場景感
1
知、人機協(xié)同、跨界融合的智慧金融新業(yè)態(tài)。金融機構(gòu)正在積極
探索大模型在智能客服、智能辦公、智能研發(fā)等業(yè)務場景的應用,
提升智能技術的可獲得性,助力金融服務降本增效。
二、大模劈支術與產(chǎn)品發(fā)展現(xiàn)狀
(-)工程化應用主要環(huán)節(jié)與技術
大模型相較于中小模型,具有更好的表示能力、泛化能力、
學習能力和語義表達能力,但其參數(shù)量巨大、訓練所需數(shù)據(jù)量和
算力資源多、部署運營更為復雜,工程化落地涉及數(shù)據(jù)構(gòu)建、模
型算法、模型訓練、模型壓縮與加速、模型評測、模型運營和安
全可信等多個復雜環(huán)節(jié)。
1.數(shù)據(jù)構(gòu)建
訓練大模型需要海量數(shù)據(jù)做支撐,高質(zhì)量數(shù)據(jù)集的構(gòu)建和處
理對于大模型的性能表現(xiàn)至關重要。訓練數(shù)據(jù)集一般需要涵蓋多
種類型、多種領域的數(shù)據(jù)來源,并配以相應的數(shù)據(jù)預處理過程。
根據(jù)數(shù)據(jù)來源不同,大模型的訓練數(shù)據(jù)主要可分為公開數(shù)據(jù)、商
業(yè)數(shù)據(jù)和私有數(shù)據(jù)。大模型參數(shù)量需耍跟訓練數(shù)據(jù)集大小相匹配,
簡單堆砌參數(shù)量并不能無限度地提升其性能。通過提升訓練數(shù)據(jù)
集質(zhì)量和內(nèi)容豐富度、加入一些特定數(shù)據(jù)集、合理利用外掛知識
庫資源、合理配置各種類型數(shù)據(jù)配比等方式,可以有效提升大模
型的整體性能,減少模型幻覺,并加快模型的收斂速度。
高質(zhì)量的數(shù)據(jù)預處理是提升模型表現(xiàn)和安全可靠性的重要
2
編碼到解碼三大類,其主要特點和代表性模型如表1所示。
表1大模型結(jié)構(gòu)主要分類及特點
架構(gòu)編碼器解碼器編碼器-解碼器
模型具備“雙向”注意力,模型只具備“單向”注意力,模型同時使用編碼器和解
可使用上下文信息來進行預即基于前面的單詞來預測后碼器兩個部分,適用于圖
測,最適合理解類任務,如續(xù)單詞,最適合生成類任務,繞給定愉入產(chǎn)生對應輸出
特點文本分類、命名實體識別、如文本創(chuàng)作、對話問答等;的任務,如翻譯、摘要,
閱讀理解等;模型參數(shù)一般模型參數(shù)量相對較大,實用以及一些有很強序列特征
偏小,預訓練后需基于具體性高,計算高效、內(nèi)存占用的任務,如語音識別、圖
任務進行Fine-tuning?少、泛化能力強.像描述生成等.
微衣量BERT、RoBERTavDeBERTa等。GPT系列、PaLM.OPT.T5、ChatGLMxBART、
LLaMA等。ERNIE3.OxM6等.
當前,基于Transformer解碼器結(jié)構(gòu)訓練的大模型成為了自然
語言處理領域的主流方案。在此影響下,語音、視覺以及跨模態(tài)
等領域的大模型也嘗試應用類似模型架構(gòu),并取得了較好效果,
比如語音領域的OpenAlwhisper和DaLL-E等,圖像生成領域的
StableDiffusion開源模型等。
3.模型訓練
大模型訓練涉及預訓練和微調(diào)等重要環(huán)節(jié)。預訓練的主要目
的是利用大量無標簽的數(shù)據(jù),訓練出一個有能力捕捉到數(shù)據(jù)中隱
藏的底層結(jié)構(gòu)和模式的模型,這一階段的模型通常被稱為“基座
模型由于大模型的參數(shù)量和訓練數(shù)據(jù)量的急劇增長,單個計
算設備的算力已經(jīng)不足以支撐模型訓練。當前,一般通過分布式
訓練來解決預訓練過程中的海量計算任務和高內(nèi)存資源等問題,
但也面臨著計算墻、內(nèi)存墻和通信墻等挑戰(zhàn)。目前解決分布式訓
練的關鍵技術是并行化,將任務分割并分配到多個處理器或設備
4
上,以便同時完成計算,更有效地利用計算資源,減少訓練所需
時間。微調(diào)的主要目的是在預訓練模型的基礎上,通過有監(jiān)督微
調(diào)、強化學習等方式,進一步提升模型在下游任務中的表現(xiàn),使
得模型輸出更符合人類期望。有監(jiān)督微調(diào),又稱為指令微調(diào),通
過使用有標注的特定任務數(shù)據(jù)對預訓練模型進行微調(diào),從而使得
模型具備遵循指令的能力。早期的微調(diào)算法會涉及到預訓練模型
的全量參數(shù)更新,計算成本較高,目前已提出了多種參數(shù)高效微
調(diào)任務的方法以節(jié)約計算成本,如LoRA、Adapter>P-tuning等。
強化學習技術是基于人類反饋,進一步調(diào)整模型的行為。其數(shù)據(jù)
集一般由經(jīng)過人工評估的反饋數(shù)據(jù)構(gòu)建,這些數(shù)據(jù)反映了模型的
輸出與期望輸出之間的差異,基于Q-learning、深度Q網(wǎng)絡或
近端策略優(yōu)化等強化學習算法進行訓練。
大模型訓練場景對中高端AI芯片需求旺盛,需要統(tǒng)籌規(guī)劃
CPU芯片、GPU芯片、服務器、網(wǎng)絡、存儲、冷卻、算力運營
服務、AI應用服務平臺等多個方面。在金融機構(gòu)通用服務器
集群基礎上,構(gòu)建基于異構(gòu)芯片體系的AI算力資源池,實現(xiàn)對
金融
機構(gòu)現(xiàn)有AI算力資源的統(tǒng)一調(diào)度,保障大模型訓練的算力支撐。
4.模型壓縮與加速
模型壓縮是指通過各種技術手段來減小機器學習模型的大
小、復雜度和計算量,加速推理過程并減少內(nèi)存使用,以便在資
源受限的設備上部署和運行,如移動設備、邊緣設備等。目前,
模型壓縮技術主要包括知識蒸儲、剪枝和量化等解決方案。知識
5
蒸像是一種訓練小型模型以模仿大型模型行為的方法,保留了大
型模型主要功能的同時降低了計算和存儲需求,但通常需要一個
預先訓練好的大型模型,且性能上會有一定損失。剪枝是一種去
除模型中不重要或冗余參數(shù)的方法,一般可以在不顯著影響模型
性能的情況下減小模型的大小和計算需求,但需要確定哪些參數(shù)
是不重要或冗余的,以選擇合適的剪枝策略。量化是一種減少模
型參數(shù)和運算中數(shù)字精度以降低模型的存儲需求和計算復雜度
的技術,可適用于多種模型和任務,并顯著減少存儲和計算需求,
但可能會造成一定程度的精度損失,且有時需要特定的硬件支持。
模型加速主要研究加速模型的訓練和推理過程,伴隨模型參
數(shù)增長,正逐漸成為研究熱點。訓練環(huán)節(jié),針對計算量、通信、
內(nèi)存可以進行一系列優(yōu)化,例如使用梯度累積或梯度壓縮可以優(yōu)
化通信策略、使用半精度浮點數(shù)可以節(jié)省內(nèi)存等。推理環(huán)節(jié),優(yōu)
化手段包括使用GPU、TPU和ASIC等芯片的專用硬件加速器加
速計算過程、使用并行化和分布式推理提高推理吞吐量并減少
推理時間、使用緩存和預取策略降低內(nèi)存訪問延遲、在邊緣設
備上進行推理減少與服務器端的通信延遲、結(jié)合模型壓縮技術
加速推理過程等?,F(xiàn)階段AI應用中,大量的算法、模型、開發(fā)
框架、軟件等開發(fā)都基于通用加速卡架構(gòu),在考慮硬件算力的
基礎上,要
結(jié)合加速芯片軟件棧及開發(fā)工具鏈等配套的軟件生態(tài)能力。
5.模型評測
模型評測在機器學習和自然語言處理領域扮演著至關重要
6
的角色。大模型具有更強大的泛化能力,可以處理多種任務,但
大模型的輸出可能存在不真實、不準確、不專業(yè)等問題,因此在
大模型上線或升級時,有必要對其進行較為全面、充分的評測,
幫助模型迭代優(yōu)化。
大模型評測已成為行業(yè)發(fā)展熱點問題,目前國內(nèi)外相關評測
層出不窮。據(jù)初步統(tǒng)計,目前行業(yè)內(nèi)關于大模型基準測試或特定
任務的測試數(shù)據(jù)集已多達200余項,主要推出機構(gòu)可以大體分為
學術界、產(chǎn)業(yè)界、媒體、社區(qū)以及智庫等。其中一些代表性的評
估基準包括HELM、MMLU、C-EVAL、BigBench、HumanEval>
AGIEVal、SuperCLUE、OpenLLM等。總體來看,大模型評測
仍處于早期階段,如何構(gòu)建出全面、充分且能伴隨大模型能力
增長不斷迭代的
大模型評測基準,仍面臨較大挑戰(zhàn)。
6.模型運營
大模型運營包括工程化、部署、管理、調(diào)試、維護和監(jiān)控等
多個方面,旨在確保大模型在生產(chǎn)環(huán)境中穩(wěn)定運行,持續(xù)適應變
化,滿足用戶需求,保障數(shù)據(jù)安全。工程化方面,模塊化和面向
對象的編程可以都助組織代碼,使其更具可讀性和可重用性,如
將數(shù)據(jù)預處理、模型結(jié)構(gòu)、訓練循環(huán)和評估功能分為不同的模塊
或類,同時版本控制系統(tǒng)和自動化測試技術有助于及時跟蹤代碼
的修改歷史,確保每個功能模塊和整個系統(tǒng)穩(wěn)定運行。部署方面,
要將模型轉(zhuǎn)化為適用于實際環(huán)境的格式,包括序列化、壓縮、硬
件優(yōu)化以及容器化工具的使用,以確保模型在不同環(huán)境中的一致
性。管理方面,使用身份和訪問管理工具可以控制資源的訪問權
限,運用數(shù)據(jù)管理工具跟蹤數(shù)據(jù)集的變化。調(diào)試方面,使用可視
化工具和日志記錄有助于監(jiān)測模型運行時的詳細信息,這對于診
斷問題和優(yōu)化性能至關重要。維護方面,要制定明確的更新策略
以適應新數(shù)據(jù)和業(yè)務需求,同時要建立回退機制,確保出現(xiàn)問題
時能夠快速回退到穩(wěn)定版本。監(jiān)控方面,通常包括性能監(jiān)控和異
常檢測,基于實時跟蹤和警報設置,確保模型的可靠運行。
7.安全可信
一般而言,大模型的安全可信會從多個維度進行考量和評估,
包括但不限于:可靠性,即大模型的輸出內(nèi)容是真實的、一致的
等;內(nèi)容安全性,即大模型的輸出應避免涉黃、涉暴等非法內(nèi)容,
并能遵循當?shù)氐牡赖聹蕜t和法律規(guī)定等;公平無偏性,即大模型
輸出應避免偏見、刻板印象、不公平等情況;魯棒性,即大模型
在面對投毒攻擊、提示詞攻擊等惡意行為或者意外情況時,依然
能夠產(chǎn)生穩(wěn)定和可靠的輸出結(jié)果;可解釋性,即大模型能夠解釋
其推理過程并能透明展示其內(nèi)容生成方式等;數(shù)據(jù)安全和隱私保
護,即對訓練和推理大模型的數(shù)據(jù)中可能包含的敏感信息進行相
應的脫敏和保護處理等。
為有效提升大模型的安全可信水平,需要在大模型開發(fā)和運
營的全流程采取相應的安全措施,包括但不限于:數(shù)據(jù)處理環(huán)節(jié),
建立高質(zhì)量的訓練數(shù)據(jù)集,有效去除有毒或錯誤信息、注重訓練
數(shù)據(jù)的分布比例以避免產(chǎn)生偏見、對訓練數(shù)據(jù)中的敏感數(shù)據(jù)進行
8
脫敏等;模型開發(fā)階段,引入對齊技術等讓大模型的輸出更符合
人類價值觀;模型上線前,需對大模型的安全可靠水平進行充分
評測,如紅隊對抗測試等;大模型對客提供服務時,可以引入安
全圍欄技術,既能幫助大模型攔截外界的惡意提問,又能對生成
內(nèi)容進行風險過濾和攔截;此外,模型運營過程中,還需要建立
持續(xù)的監(jiān)控和定期審核機制,以及時發(fā)現(xiàn)異常情況并持續(xù)迭代優(yōu)
化模型。
(二)國內(nèi)外主要產(chǎn)品情況
自ChatGPT引起業(yè)界高度關注后,國內(nèi)外科技巨頭紛紛加大
了對大模型的研發(fā)和投入,以模型為核心,圍繞模型全生命周期
設計、生產(chǎn)并提供產(chǎn)品、技術和服務,推動“數(shù)據(jù)、模型、服務、
場景”的AI生產(chǎn)力閉環(huán)連接和迭代優(yōu)化,為大規(guī)模、標準化的人
工智能創(chuàng)新提供技術支撐。在此背景下,大模型相關產(chǎn)品和服務
迎來了爆發(fā)式增長。此外,許多大模型相關的開源項目涌現(xiàn),為
研究和創(chuàng)新提供了便利。這些開源項目主要朝著兩個方向發(fā)展:
一是相對ChatGPT更經(jīng)濟的、平民化的替代品,二是圍繞著大模
型建立的外圍應用工具。
9
I
新化,服聯(lián)三留
更能力融研用停
所能
究智金學采都
研和理動產(chǎn)般大
化推推、一,
G您型
息和步用構(gòu)品
信轉(zhuǎn)
化成一應機產(chǎn)
融線用
金字生進型融
間、商
:時數(shù)將模金
源踐習,大購
展構(gòu)型
來發(fā)實學力源大采
據(jù)品索機、未
數(shù)產(chǎn)能開。
探融解化括購尚
型金
模與理泛包采遍0
大用是的務線型普。1
型應直備任路模構(gòu)段
典一
外業(yè)具多型大機階
用y
內(nèi)型的選用融試e
融vr
國應u
1模越術商金測S
金的CM
圖大卓線技和小L
在O/x
術,和。路的制中Po
BI
型A
技域量級術型見研,和C
GooggU
模能領容升技選常型式報R/
m
大)術o
智心識化型模模匯c.
b
-u
、工核知能技模大的、h
(.ti
1g
三人的的智大新行研/
:s
級p
觀的創(chuàng)并調(diào)t
升可務合路在h
一是開源大模型應用。開源大模型是指通過開源方式發(fā)布和
共享的大模型,其源代碼和相關資料對公眾開放,適用于具備一
定技術能力的開發(fā)者、研究機構(gòu)以及對模型定制和二次開發(fā)有需
求的機構(gòu)。國內(nèi)外的大模型有近一半選擇了開源的方式,Bloom.
GLM、Llama是目前國內(nèi)外流行度較高的開源大模型。金融機構(gòu)
選擇開源大模型的前提是能夠依靠自身或者第三方公司進行大
模型應用研發(fā),且具備后期維護、迭代更新的能力。盡管開源大
模型已具備較好的實踐效果,但仍面臨數(shù)據(jù)安全合規(guī)風險、開源
協(xié)議風險等挑戰(zhàn)??傮w而言,金融機構(gòu)對于開源模型的采用普遍
持謹慎態(tài)度,但在前期探索階段通常會采用開源大模型進行測試、
研究,同時將其與商用大模型的應用效果進行比對。
二是產(chǎn)學研聯(lián)合創(chuàng)新大模型研制。金融機構(gòu)、科技企業(yè)、科
研院所、高等院校等通過合作,共享知識、技術或資源,發(fā)揮各
自優(yōu)勢,推動技術創(chuàng)新和產(chǎn)業(yè)發(fā)展。產(chǎn)學研聯(lián)合創(chuàng)新有助于金融
機構(gòu)在大模型創(chuàng)新應用初期推動特定試點場景快速落地。一方面,
可以在一定程度上助力金融機構(gòu)加速科技創(chuàng)新及數(shù)字化轉(zhuǎn)型,打
造更好的產(chǎn)品和服務,增強行業(yè)競爭力。另一方面,可以減少金
融業(yè)對國外技術和產(chǎn)品的依賴,加快國產(chǎn)化步伐,提升行業(yè)安仝
可控能力。
專欄一產(chǎn)學研聯(lián)合創(chuàng)新大模型研制
工商銀行與清華、鵬城實驗室、華為等高等院校、科研院所、
科技企業(yè)開展大模型聯(lián)合創(chuàng)新。
11
交通銀行與華為、科大訊飛共建了聯(lián)合創(chuàng)新實驗室,推進大模
型及算力集群技術、人工智能等先進技術在金融領域的落地應用。
北京銀行與火山引擎、華為、中科院自動化所、中科聞歌共建
聯(lián)合創(chuàng)新實驗室,圍繞金融大模型體系構(gòu)建、前沿金融科技應用等
領域開展合作創(chuàng)新,共同探索銀行智能化技術的最佳實踐。
三是商用大模型采購。眾多國內(nèi)外商用大模型正在逐步推廣
應用。相較于開源大模型,商用大模型可以為金融機構(gòu)提供更加
工程化、易用性強、服務有保障的解決方案。
金融機構(gòu)在大模型技術選型時需要綜合考慮大模型對業(yè)務
質(zhì)量和人員效率的提升效果、大模型持續(xù)創(chuàng)新能力、大模型運行
時的穩(wěn)定性和安全性等多個方面。同時,金融機構(gòu)還需結(jié)合自身
業(yè)務特點和實力情況,對資金、人員、配套工具產(chǎn)品完備性等因
素進行全面考量,以選擇合適的大模型解決方案。此外,要建設
并維護內(nèi)部統(tǒng)一的大模型資源庫,并在此基礎上建立大模型應用
開發(fā)平臺,更好地充分利用業(yè)界多種領先的通用大模型。
2.部署方式
為制定合適的部署方案,金融機構(gòu)首先需要確定需求和目標,
其次要根據(jù)業(yè)務場景和技術要求,選擇合適的硬件和軟件環(huán)境,
確保能夠支持大模型的運行和優(yōu)化。針對不同應用場景,金融機
構(gòu)探索采用不同部署方式以更合理地應用大模型。根據(jù)部署環(huán)境
的不同,可以將大模型部署方式分為私有化部署、行業(yè)云部署和
公有云部署等。
12
一是私有化部署。金融機構(gòu)將大模型部署于自有服務器,由
金融機構(gòu)負責維護和管理。私有化部署可以提供更好的數(shù)據(jù)安全
保障,大大減少信息安全隱患,且一般具有較好的應用效果,尤
其是對于需要運用內(nèi)部語料訓練的金融業(yè)務場景,可以根據(jù)金融
機構(gòu)的需求進行定制和優(yōu)化模型,并隨時增減資源。但是,這種
部署方式往往會產(chǎn)生高昂的成本,需要金融機構(gòu)投入大量的資金、
人力來建設和維護。
二是行業(yè)云部署。由行業(yè)內(nèi)起主導作用或掌握關鍵資源的組
織建立和維護,以公開或半公開的方式,在確保數(shù)據(jù)安全的前提
下,向行業(yè)內(nèi)部或相關組織提供云平臺服務。將大模型部署在金
融云,既能在一定程度上滿足數(shù)據(jù)安全可控的要求,又兼?zhèn)涑杀?/p>
低、擴展性強等優(yōu)勢。中小型金融機構(gòu)對行業(yè)云部署的需求更為
迫切。
三是公有云部署。金融機構(gòu)通過標準接口調(diào)用部署在公有云
上的大模型,由云服務提供商負責維護和管理,具備更低的成本、
更高的靈活性和可擴展性。然而,由于金融機構(gòu)無法完全掌控其
數(shù)據(jù)的存儲和管理,使用這種部署方式可能面臨數(shù)據(jù)安全風險,
因此該部署方式可能更適用于互聯(lián)網(wǎng)類的金融企業(yè)或非敏感類
業(yè)務場景。
鑒于個人隱私保護和數(shù)據(jù)不出域等相關要求,私有化部署仍
是金融機構(gòu)部署大模型的主要選擇方式。私有化部署使得金融機
構(gòu)得以保留對數(shù)據(jù)和系統(tǒng)的完全控制權,但由于大模型訓練和推
13
理對算力及配套基礎設施有較高要求,該部署方式更適用于大中
型金融機構(gòu),對于中小型金融機構(gòu)實現(xiàn)難度較大。對于不涉及數(shù)
據(jù)保密性的場景,比如證券公司基于公開數(shù)據(jù)生成投資策略及研
報撰寫,行業(yè)云或公有云部署具有一定優(yōu)勢。目前,國外已有
API市場化采購服務,且價格低廉。隨著私有化部署成本不斷提
高,中小銀行、證券公司、基金等中小金融機構(gòu),迫切需要通過
行業(yè)云或公有云來降低大模型金融應用的門檻。
(二)使用方式
大模型具備出色的自然語言理解能力,但因其在金融垂直領
域的知識儲備不足,回答的專業(yè)性難以滿足要求。金融機構(gòu)需要
將金融領域已有的數(shù)據(jù)庫、知識圖譜等專業(yè)知識系統(tǒng),與大模型
的意圖理解能力、語言生成能力和場景掌控能力進行對接,實現(xiàn)
大模型的行業(yè)個性化和機構(gòu)定制化。然而,大模型技術復雜度高、
參數(shù)規(guī)模大、研發(fā)投入高,特別是需要大量的數(shù)據(jù)標注和人工反
饋等工程化投入,從頭自研大模型的難度非常大。因此,金融機
構(gòu)目前主要采用API調(diào)用、提示工程、模型微調(diào)和二次訓練等應
用方式,以降低大模型的應用研發(fā)門檻,解決場景數(shù)據(jù)少、模型
精度低等問題,推動大模型快速落地測試。比如,農(nóng)業(yè)銀行利用
有監(jiān)督的模型微調(diào)和強化學習等技術,融入行內(nèi)知識庫數(shù)據(jù),訓
練、收斂出能理解行內(nèi)知識的基礎模型,目前已具備行業(yè)知識問
答能力。中信證券將特定問題及與其相關內(nèi)部文檔材料作為問答
輸入,既可獲得較好的應用效果,又避免了二次訓練的高昂成本。
14
1.API調(diào)用
API調(diào)用是指通過API接口調(diào)用大模型,實現(xiàn)圖像生成、文
本生成、語音合成等功能。公有云大模型大多采用以API接口的
方式提供服務。該方式使得金融機構(gòu)在大模型探索應用初期能夠
快速將大模型在項目中進行測試驗證,且成本低廉。然而,API
調(diào)用的方式不僅需要完成一系列的技術整合和接口開發(fā),也面臨
如何在不降低模型準確性的前提下保障數(shù)據(jù)安全和隱私性、如何
高效處理海量數(shù)據(jù)、生成內(nèi)容可控性和魯棒性較差等問題,適合
直接落地的金融業(yè)務場景很少。一般來說,金融機構(gòu)應用API調(diào)
用方式對大模型產(chǎn)品進行測試后,會根據(jù)測試結(jié)果結(jié)合該模型在
其他領域的表現(xiàn)進行綜合評價,判斷是否進一步選擇微調(diào)或二次
訓練的方式進行優(yōu)化。
2.提示工程
基礎預訓練大模型內(nèi)含知識豐富,但很多潛能尚未被激發(fā),
如何有效引導大模型來完成特定任務存在挑戰(zhàn)。提示工程通過優(yōu)
化提示語句激發(fā)大模型所具備的潛在能力,提示語通常是一段文
本,用于構(gòu)建問題或?qū)θ蝿者M行恰當表述,以便大模型基于內(nèi)在
知識生成合適答案,可通過少樣本、思維鏈路等方式實現(xiàn)。提示
工程并不改變模型參數(shù),對于可指令微調(diào)的大模型來說,構(gòu)造提
示語的成本相對較低,大部分成本轉(zhuǎn)嫁為標注成本,通過設計好
的提示語來調(diào)優(yōu)任務效果。
15
3.模型微調(diào)
基礎預訓練大模型具備較好的通用性知識,但實際應用中,
每個具體場景都有其獨特的需求和流程,仍需優(yōu)化模型以提升應
用效果和價值。模型微調(diào)是優(yōu)化模型效果和性能并提高準確性的
重要手段,也是當前金融機構(gòu)試用大模型的最常用手段。當大模
型缺乏垂直領域知識時,通過模型微調(diào)技術,以較低的成本即可
明顯提升針對特定任務的應用效果。一般來說,當測試結(jié)果良好
時,會優(yōu)先選擇模型微調(diào)技術提升應用效果。
4.二次訓練
二次訓練指在已有模型的基礎上,使用新的數(shù)據(jù)集對模型進
行重新訓練,從而提高模型的性能和應用效果。二次訓練通常需
要對模型參數(shù)進行修改,以適應新數(shù)據(jù)集的特點。相較于微調(diào),
二次訓練會產(chǎn)生高昂的數(shù)據(jù)、算力、人力以及時間成本,但也可
以實現(xiàn)更好的效果和更廣泛的場景化應用。一般來說,大型金融
機構(gòu)因具備海量垂直領域數(shù)據(jù)基礎,在微調(diào)技術難以實現(xiàn)期望達
到的應用效果時,可以選擇該方式高度定制化模型以提升模型的
泛化能力和場景化應用能力。
此外,金融機構(gòu)還采用大模型融合知識庫、知識圖譜等組件
的方式,通過引入領域向量庫檢索、數(shù)據(jù)增強等技術,結(jié)合大模
型關鍵超參優(yōu)化,形成不同模型針對不同行業(yè)和領域的參數(shù)體系,
精準匹配業(yè)務需求,使得大模型回答結(jié)果較為可信。
16
(三)應用場景
大模型在金融領域的應用前景廣闊,趨動AI從勞動密集向
腦力密集應用,金融機構(gòu)已經(jīng)將大模型試點應用于智能客服、智
能辦公、智能研發(fā)、智能投研等多個金融業(yè)務場景,但從能用到
好用、易用,再到規(guī)?;瘧眠€任重道遠。基于當前金融機構(gòu)主
要場景探索實踐來構(gòu)建金融行業(yè)大模型應用場景全景圖。
代科夕或
智與“全按口設計
能代5?謾
與注何
研
發(fā)
智
智
能
能
投
營
顧
銷
生成
數(shù)據(jù)來源:金融信息化研究所
圖2金融行業(yè)大模型應用場景全景圖
1.智能客服
傳統(tǒng)的智能客服的服務方式主要是先識別用戶意圖,再匹配
到特定的對話模板,是一個非常龐雜的配置過程,特別是要確保
所有渠道對于相似問題的回答保持一致。這種方式不僅維護成本
高,維護難度大,而且難以應對復雜多變的自然語言對話,用戶
體驗較差。金融機構(gòu)普遍認為大模型雖然仍不具備直接面客的能
力,但可以在通用大模型的基礎上,疊加金融客服領域的數(shù)據(jù)和
專業(yè)經(jīng)驗,經(jīng)過垂直領域定向訓練后,客服機器人可以綜合考慮
用戶提示語和用戶習慣,準確識別用戶意圖,作為客服助手協(xié)助
客服人員開展客戶的陪伴和關懷,升級真誠話術,提供24小時
的多語言支持,有效提升用戶對話體驗,提高服務質(zhì)量。
專欄二智能客服場景
工商銀行利用大模型的語義理解、生成能力,結(jié)合基于知識庫
的檢索提取能力,精準理解客戶意圖,生成符合其業(yè)務特性的結(jié)果,
為客戶提供更準確、更個性化的服務,提升應答效率和質(zhì)量,從而
提升客戶滿意度。2023年3月,工商銀行進行了大模型智能客服試
點測試,一定程度上提升了客戶情緒識別效果,縮減了約50%的人力
維護成本。
農(nóng)業(yè)銀行大模型ChatABC面向行內(nèi)客服員工提供遠程銀行AI輔
助客服問答助手服務。此助手基于遠程銀行問答數(shù)據(jù)完成訓練微調(diào),
支持模型在多輪問答中識別客戶的主要意圖,結(jié)合遠程銀行知識庫
和知識圖譜,生成擬人問答,輔助坐席人員在問答中獲取知識,有
效提升坐席人員的答復效率。
中國銀行正探索將大語言模型運用于客服場景,幫助業(yè)務人員
實現(xiàn)更自然靈活的智能問答功能,有效地應用到坐席問答輔助、員
工培訓、行內(nèi)員工辦公等多個場景。
交通銀行正探索使用大模型來準確識別客戶意圖和坐席人員的
知識檢索需求,進行相應客服知識的提煉和推薦,并在坐席通話結(jié)
束后,對服務內(nèi)容進行自動的標準化分類,生成通話小結(jié),以提升
坐席人員整體工作效率。
光大銀行探索大模型技術與現(xiàn)有智能客服相融合,基于大模型
18
意圖理解能力對客戶問題進一步理解,以提升客戶問答滿意度;基
于大模型技術探索坐席工單自動生成可能性,對客戶與坐席對話內(nèi)
容快速生成摘要工單,提升客戶服務效率。
民生銀行探索運用大模型技術輔助坐席完成問題回復和工單生
成等工作,實現(xiàn)工單流程自動化,提供內(nèi)容以支持顧問與客戶互動,
支持高度擬人化的客服機器人,優(yōu)化客戶體驗,提升客服質(zhì)量。
興業(yè)銀行基于大模型技術實現(xiàn)客服語料智能泛化,對當前語料
標注過程中存在的標注工作繁瑣、工作量大等痛點,通過大模型生
成符合業(yè)務需求的語料,以幫助客服運營人員提升標注效率,進而
提升智能客服回答準確率,減少客戶投訴。
上海銀行正探索在客戶服務領域運用大模型優(yōu)秀的語言理解能
力并結(jié)合行內(nèi)知識庫,在充分洞察客戶訴求的前提下,對復雜場景
進行分解,能夠從知識庫中自動完成有效知識的提取與采編,解決
知識庫運維完全依賴人力、多語義理解、語義纏繞等問題,為客戶
提供優(yōu)質(zhì)解答。
國信證券探索運用大模型技術自動化生成服務話術和客戶指標
數(shù)據(jù),包括:知識問答、行業(yè)分析、行情快報、客戶資產(chǎn)配置建議、
資訊推送摘要、投訴建議反饋等,提升運營人員的服務質(zhì)量和效率。
平安保險運用大模型技術解決傳統(tǒng)知識庫梳理成本高、培譏成
本高、推薦話術僵化等問題,在客服人員與客戶通話過程中,實時
根據(jù)客戶需求,生成個性化話術,從而提升客戶滿意度,大大降低
坐席人員學習成本。
19
2.智能辦公
大模型可以作為辦公助手,發(fā)揮其出色的文本生成能力,輔
助完成報告和運營文案生成、郵件起草、公文潤色、紀要撰寫、
內(nèi)容審核、輔助糾錯等工作,為員工提供更加便利、快捷的智能
辦公工具及個性化的智能辦公解決方案,大幅提升工作效率。此
外,大模型還可以實現(xiàn)不同語種的實時翻譯,提升金融機構(gòu)跨境
業(yè)務交流和管理水平。
專欄三智能辦公場景
工商銀行通過搜索技術與大模型結(jié)合,將知識庫檢索到的信息
作為大模型的生成依據(jù),實現(xiàn)自然語言的向量搜索,輔助業(yè)務人員
在業(yè)務辦理過程中快速查詢到客戶問題的準確應答,提升應答效率
和質(zhì)量,從而提升客戶滿意度。
農(nóng)業(yè)銀行大模型ChatABC面向行內(nèi)員工辦公場景推出智能問答
應用。此應用著眼于大模型在金融領域的知識理解能力、內(nèi)容生成
能力,并融合知識庫,具備研發(fā)服務領域級知識理解和問答能力,
可完成自由閑聊、行內(nèi)知識問答、內(nèi)容摘要等多類型任務,并以行
內(nèi)研發(fā)服務平臺的問答助手、工單自動化回復助手、行內(nèi)即時聊天
工具等多渠道形式進行試點。
交通銀行正探索在辦公軟件中嵌入基于大模型的智能問答助
手,為員工提供人資規(guī)章、授信、對公、零售業(yè)務場景的會話式咨
詢。同時,交通銀行利用大模型搭建會議紀要助手,從口語化的會
議記錄中提取關鍵信息,包括討論主題、觀點、結(jié)論等,組織成連
20
貫自然的語言,生成書面化的會議紀要和待辦事項。
郵儲銀行運用大模型技術搭建智能知識問答系統(tǒng)“靈犀”,系統(tǒng)
采用Langchain和向量數(shù)據(jù)庫技術,結(jié)合大模型對自然語言的理解
與生成能力,發(fā)揮了垂直領域內(nèi)知識理解能力,賦能業(yè)務實現(xiàn)專
業(yè)知識智能解答,提升業(yè)務辦理效率。同時,郵儲銀行運用大模型
技術搭建“小郵助手”智能機器人,提供在線業(yè)務知識問答、熱點問
題分類展示,實現(xiàn)業(yè)務難點、要點即時回復和精準提示,提升柜
員操作體驗及業(yè)務處理效率,釋放業(yè)務指導員工作。
光大銀行基于大模型技術構(gòu)建員工助手,應用于行內(nèi)通信軟件,
快速解答內(nèi)部員工日常辦公問題,構(gòu)建多項智能應用,可幫助行內(nèi)
員工實現(xiàn)消息智能摘要、日程會議智能提醒、郵件自動編寫、代碼
自動生成、系統(tǒng)助手等多項能力,提升辦公效率。同時,光大銀行
探索將現(xiàn)有知識庫與大模型相結(jié)合,打造企業(yè)內(nèi)搜場景應用,將現(xiàn)
有零散知識召回交給大模型,基于大模型理解及生成能力輔助業(yè)務
辦公人員快速定位核心問題并作出合理判斷,以提升業(yè)務效率。
民生銀行通過大模型的理解能力建立多場景文檔助手,對文檔
的主要內(nèi)容進行摘要匯總整理,全面提升員工工作效率,實現(xiàn)針對
文檔不同場景的個性化需求。
興業(yè)銀行探索通過大模型嵌入行內(nèi)WPS辦公套件,實現(xiàn)包括PPT
大綱生成,文章內(nèi)容生成,內(nèi)容擴寫與改寫,文章風格轉(zhuǎn)變等功能,
以減輕總分行一線員工的文字材料撰寫潤色的負擔。
北京銀行搭建“京智助手”大模型對話機器人,提供行內(nèi)知識
21
問答、數(shù)據(jù)分析、任務執(zhí)行等功能,應用于協(xié)同辦公、智能客服、
合規(guī)管理等場景。目前""京智助手''已向全行HXXX)多名員工開放,
并同步建設移動端和PAD端,已在合規(guī)管理、數(shù)據(jù)分析和流程
自動化場景,取得了一定的應用成效。
上海銀行利用大模型的理解和生成能力,搭建智能辦公助手,
一方面接入行內(nèi)知識庫,提升知識檢索能力,并由大模型對于長文
檔自動檢索生成知識條目等,另一方面接入行內(nèi)各類辦公系統(tǒng),提
供公文檢查、寫作、總結(jié)潤色等功能,在大幅提升辦公效率的基礎
上,極大地提升員工交互體驗。
中信證券正在積極探索利用大模型建立跨境實時通訊系統(tǒng),旨
在實現(xiàn)境內(nèi)外員工用母語進行無障礙交流,提高員工工作效率,加
強團隊協(xié)作力度,以及提升對國際化客戶的服務質(zhì)量,加強全球化
布局和業(yè)務發(fā)展。
國泰君安將大模型技術與OCR、語音識別等技術相結(jié)合,圍繞
智慧辦公場景開發(fā)智能辦公助手和基于大模型的知識庫問答應用,
提供會議紀要生成、郵件撰寫等常見辦公任務小工具,通過自然
語言問答的形式實現(xiàn)文檔問答,為員工提供一個智能、高效、便
捷的工
作伙伴,提升辦公效率和工作質(zhì)量。
3.智能研發(fā)
大模型在智能研發(fā)場景展示出很大的潛力。大模型具有處理
自然語言和生成多種編程語言高質(zhì)量代碼的能力,在系統(tǒng)設計、
代碼生成與補全、代碼翻譯與注釋、輔助測試等方面為科技人員
22
提供幫助和支持,提升開發(fā)效率和交付質(zhì)量。同時,大模型的閱
讀理解和SQL生成能力,可以實現(xiàn)指令文字到SQL代碼的直接相
互轉(zhuǎn)化,業(yè)務人員無需了解數(shù)據(jù)庫技術與編程知識也可輕松完成
數(shù)據(jù)查詢等工作。此外,通過大模型與BI等應用系統(tǒng)結(jié)合,可
以實現(xiàn)報表自動生成,可視化地展示數(shù)據(jù)查詢分析結(jié)果,使得非
技術人員更直觀且深入地理解、利用數(shù)據(jù),降低技術門檻。
專欄四智能研發(fā)場景
農(nóng)業(yè)銀行大模型ChatABC推出AI輔助編程應用,面向行內(nèi)研發(fā)
員工提供輔助編程服務。通過行內(nèi)多個系統(tǒng)的代碼和代碼規(guī)范進行
微調(diào),實現(xiàn)Java、Python>JavaScript^SQL等語言的代碼生成、代
碼補全、代碼解釋等能力,可在前端、后端、單元測試等多類研
發(fā)編碼場景提供輔助,提升研發(fā)人員的開發(fā)效率。
平安銀行在ChatBI項目中應用了BankGPT的金融理解能力,旨
在為業(yè)務人員和管理層提供即時的數(shù)據(jù)分析服務,當'業(yè)務人員面臨
數(shù)據(jù)相關的問題時,系統(tǒng)可以迅速給出精確答案,實現(xiàn)提問與回答
的無縫對接。
民生銀行探索運用大模型技術輔助用戶完成高質(zhì)量代碼編寫,
按需完成代碼生成、代碼補全等功能,促進分析平民化,提升代碼
效率,實現(xiàn)質(zhì)量和效率的雙提升。
興業(yè)銀行通過大模型嵌入行內(nèi)開發(fā)IDE的方式,探索基于大模
型技術實現(xiàn)代碼輔助生成,以提升科技研發(fā)單位的開發(fā)效率和代碼
質(zhì)量。
23
上海銀行通過在軟件開發(fā)過程中引入大模型進行代碼補全、注
釋生成、代碼糾錯等自動化輔助功能,極大地提升了開發(fā)人員的開
發(fā)效率和代碼質(zhì)量;在代碼測試方面,應用大模型生成能力,輔助自
動生成測試案例,有效提升測試效率及案例覆蓋度;在數(shù)據(jù)分析方
面,上海銀行正在探索大模型與行內(nèi)經(jīng)營管理工具-“掌上行”的有
效結(jié)合,通過自然語言交互方式,允許用戶就經(jīng)營指標自由提問,
進一步降低數(shù)據(jù)分析的門檻,提升數(shù)據(jù)驅(qū)動經(jīng)營管理的有效性。
中信證券探索運用大模型實現(xiàn)股價預測等模型構(gòu)建,根據(jù)用戶
輸入的自然語言,生成相應SQL語句,準確地完成用戶數(shù)據(jù)查詢需
求,以期適配不同數(shù)據(jù)庫、完成多表數(shù)據(jù)查詢。
國信證券通過大模型的輔助代碼生成能力,協(xié)助IT人員、業(yè)務
產(chǎn)品經(jīng)理、運營人員進行代碼編寫、數(shù)據(jù)分析、輔助代碼生成檢查
等工作,提升系統(tǒng)開發(fā)、數(shù)據(jù)分析等內(nèi)部工作效率。
4.智能投研
大模型技術可以幫助投研人員從海量、分散、龐雜的報告中
挖掘關鍵信息,自動抓取財經(jīng)、債市、信用等多個市場板塊的資
訊報告內(nèi)容,快速獲取報告的核心觀點、關鍵數(shù)據(jù)和市場趨勢,
分析預測市場交易情況,智能生成資訊報告和投研簡報,為投研
人員提供投資、風控等決策輔助。
專欄五智能投研場景
工商銀行綜合應用大模型的核心信息提取、智能文本生成等能
力,實現(xiàn)金融報告的自動生成,有效將投研簡報生成效率從1小時
24
縮短至5分鐘,提升了投研人員對海量文本數(shù)據(jù)的整合歸納提煉效
率。
興業(yè)銀行通過大模型技術實現(xiàn)研報摘要的智能生成,構(gòu)建了一
套包括研報文檔結(jié)構(gòu)化、信息抽取和大語言模型語義理解摘要生成
的一體化解決方案,實現(xiàn)研報核心內(nèi)容智能提煉,提高了興銀理財
子公司投研團隊查洵、閱讀內(nèi)外部研報的效率,加快了投資決策效
率,一定程度節(jié)省人力成本,同時提升了客戶體驗。
國泰君安證券利用大模型的自然語言到結(jié)構(gòu)化查詢(NL2SQL)
等能力,改進傳統(tǒng)問答系統(tǒng)的精準性和靈活性,實現(xiàn)對投研領域
內(nèi)包
括行情、公司、基金等數(shù)據(jù)的精確、高效問答。
華泰證券正探索運用大模型對文本的學習理解能力,學習歷史
研報的撰寫模式、分析邏輯和行文風格等內(nèi)容,從而實現(xiàn)研究報告
初稿的自動撰寫。目前已初步搭建內(nèi)容召回、內(nèi)容生成的線上撰寫
服務框架,打通從財務報告的非結(jié)構(gòu)化文檔解析,利用embedding
技術構(gòu)建財報知識庫,根據(jù)歷史研報進行高相關內(nèi)容召回,結(jié)合內(nèi)
容召回與大模型服務,通過建設Prompt工程,打通大模型撰寫能力
鏈路。
5.智能營銷
結(jié)合金融業(yè)語料進行適應性訓練后,大模型可輔助生成營銷
話術和營銷文案,幫助客戶更快地獲取最新資訊和產(chǎn)品的信息。
同時,通過對話式營銷,大模型可優(yōu)化客戶參與度,提升服務的
效率與質(zhì)量,引導其做出決策。此外,隨著投資者數(shù)據(jù)、產(chǎn)品知
25
識和營銷文案的不斷積累,大模型技術可以從海量信息中檢索詞
條,并提煉整合,可針對特定客戶實現(xiàn)貼心、高質(zhì)量、有創(chuàng)意的
精準營銷,快速生成個性化建議和推薦,并構(gòu)造相應的圖文推廣,
進一步提升客戶轉(zhuǎn)化率和營銷效率,為客戶提供更加全渠道、個
性化、有溫度的金融服務。
專欄六智能營銷場景
平安銀行借助BankGPT優(yōu)秀的文案生成能力,針對不同客戶,批
量生成個性化營銷文案,從而更有針對性地提升客戶粘性和業(yè)務轉(zhuǎn)
化率,為營銷運營團隊提供支持。同時,平安銀行利用BankGPT的
自然語言理解能力,助力多媒體運營團隊實現(xiàn)自動化FAQ抽取功能。
民生銀行探索運用大模型技術賦能客戶意圖理解營銷場景,通
過搜索知識庫、產(chǎn)品庫、聊天記錄等,洞察客戶真實意圖,自動提
供廣告等營銷文案、自動生成個性化營銷內(nèi)容、自動提供各類分析
報告,提升營銷成功率。
平安保險通過大模型的自然語言交互、內(nèi)容生成等能力,智能
化分析并提取客戶需求,輔助生成保險產(chǎn)品營銷素材,并根據(jù)客戶
標簽屬性提供針對該客群的產(chǎn)品推薦以及推薦理由相關話術,基于
個人醫(yī)療歷史和分線因素,提供個性化保險建議和方案,有助于產(chǎn)
品精算人員制定針對性保險方案。
6.智能運維
金融機構(gòu)可以利用大模型生成技術,實現(xiàn)智能運維分析、運
維知識獲取、網(wǎng)絡安全分析等,進一步提升運維效率。大模型具
26
備良好的語義搜索能力,在復雜的數(shù)據(jù)中準確找到所需結(jié)果,助
力運維人員快速對接各類型的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),實現(xiàn)流程
自動化、智能檢索和內(nèi)部資料的輔助審核。止匕外,對于大模型還
可以輔助運維人員完成代碼攻防測試、明文檢測等安全檢測工作。
專欄七智能運維場景
上海銀行探索將大模型應用于故障分析及解決等場景,結(jié)合歷
史生產(chǎn)事件解決工單、運維文檔或問答對等知識庫,當故障發(fā)生時,
大模型能夠自動根據(jù)歷史解決經(jīng)驗及知識庫給出故障分析及解決方
案,從而為運維人員提供輔助支持,以提升事件解決效率。
7.智能風控
風險控制是金融業(yè)的核心要務。大語言模型的閱讀理解能力
可以輔助提示存在的法律風險,降低人為疏漏概率并提升法官人
員工作效率。在大模型的通用能力基礎上融合金融行業(yè)的知識和
數(shù)據(jù)用于真?zhèn)魏蓑?、輿情分析等環(huán)節(jié),結(jié)合風控數(shù)據(jù)模型,進行
風險模擬與壓力測試,對可能發(fā)生的風險事件作出預警,實現(xiàn)貸
前智能推薦、貸中全面風控、貸后監(jiān)測預警全流程風控管理。此
外,基于大模型的合規(guī)知識問答助手在金融合規(guī)場景中也發(fā)揮了
一定作用。
專欄八智能風控場景
光大銀行基于大模型理解能力,探索大模型解讀法律法規(guī)政策
的可行性,基于業(yè)務問題快速定位政策文件并給出法律法規(guī)依據(jù)、
打造法律法規(guī)領域智能專家,輔助各業(yè)務場景快速把控政策、法規(guī)
27
風險。
華夏銀行探索利用大語言模型技術疊加合規(guī)圖譜,以高質(zhì)量內(nèi)
外規(guī)數(shù)據(jù)為基礎,以結(jié)構(gòu)化合規(guī)知識標簽為輔助,利用大語言模型
語義理解、信息匯總和自然語句生成能力實現(xiàn)智能化合規(guī)知識問答
功能,降低合規(guī)知識查詢門檻。
平安保險運用大模型技術,基于歷史數(shù)據(jù)和模擬數(shù)據(jù)進行風險
模擬和壓力測試,評估產(chǎn)品設計的可靠程度和穩(wěn)定性,以便產(chǎn)品精
算人員更好地了解產(chǎn)品可能面臨的風險和挑戰(zhàn),助力產(chǎn)品精算人員
制定相應保險策略。
8.智能投顧
圍繞財富管理專業(yè)知識對大模型進行增量訓練,構(gòu)建基于大
模型的投資顧問助手,提供圍繞個體的全生命周期智能投顧服務,
實時監(jiān)測市場動態(tài),調(diào)整投資策略,并根據(jù)客戶的風險偏好、收
益目標和資產(chǎn)狀況,為客戶提供個性化的投資建議和組合優(yōu)化,
大幅提升服務效率和服務體驗。
專欄九智能投顧場景
國泰君安證券運用大模型的理解分析能力,進行金融資訊熱點
話題提取和!tl納,對相關信息做正面/負面消息的評分和整理,生成
每天/周/月的熱點話題榜單,既能實時跟蹤行業(yè)網(wǎng)站熱點,又能回
顧過去一段時間的熱點話題,基于榜單排名走勢預測股市熱點信息。
大模型在提升金融服務效率和體驗、降低金融風險和成本、
創(chuàng)新金融產(chǎn)品和模式等方面有著顯著作用。大模型在金融領域的
28
應用場景具有較大空間,隨著大模型與各個金融場景的深度融合,
將進一步提升我國金融業(yè)的智能化水平,進一步深入推動金融機
構(gòu)數(shù)字化轉(zhuǎn)型。
(四)應用趨勢
一是金融機構(gòu)將采用先內(nèi)后外、從易到難、場景遷移的方式
落地大模型金融應用。由于目前大模型直接對客難度較大、可控
性不強,金融機構(gòu)主要對內(nèi)應用大模型能力,待技術逐漸成熟,
可以考慮對外輸出。此外,金融機構(gòu)也將優(yōu)先選擇風險等級低、
適配應用難度小、業(yè)務提升效果明顯的場景進行大模型試點落地,
逐步將試點應用場景遷移到真實、復雜的業(yè)務場景,實現(xiàn)大模型
對金融產(chǎn)品和服務的全面升級。
二是大小模型協(xié)同進化是大模型發(fā)展的一個必然趨勢。大模
型對應場景多為開放式和主觀型問題,測重推理和創(chuàng)造,也可被
用于作為連接多個具體任務模型的通用接口,而小模型對應場景
多為封閉式問題,不涉及過多主觀推斷,答案的正確性可以被清
晰驗證,因此在某些特定場景仍具有更好的表現(xiàn)。大模型對于中
小模型并非是替代或?qū)α⒌年P系,兩者應相互協(xié)作、互相搭配,
由大模型向邊、端的小模型輸出模型能力,而小模型負責實際的
推理與執(zhí)行,同時向大模型反饋算法與執(zhí)行成效,使得大模型的
能力持續(xù)強化。金融機構(gòu)將加強研究和推進大小模型協(xié)同、生成
式技術與傳統(tǒng)人工智能技術協(xié)同,將大模型連接到傳統(tǒng)軟件,提
升行業(yè)整體智能化水平。
29
三是多模態(tài)金融大模型的發(fā)展與應用仍有較大潛力。大模型
生成效果的提升依賴于垂直場景系統(tǒng)化程度和高質(zhì)量數(shù)據(jù)。金融
業(yè)具備專業(yè)領域知識庫,多年來沉淀了大量格式多樣的優(yōu)質(zhì)業(yè)務
數(shù)據(jù)。運用多模態(tài)技術實現(xiàn)知識的遷移、表示、對齊和推理,使
得大模型能更好地構(gòu)建金融領域內(nèi)外部生態(tài)系統(tǒng),助力金融科技
創(chuàng)新和金融業(yè)務賦能,為金融機構(gòu)提供更多智能化、個性化的服
務和決策支持,同時也為客戶和市場參與者帶來更好的體驗和更
穩(wěn)健的金融環(huán)境。
四是AIAgent未來可能推動人工智能成為金融業(yè)信息基礎
設施。AIAgent是有能力主動思考和行動的智能體,以大模型
為大腦驅(qū)動,能夠自主感知環(huán)境、形成記憶、規(guī)劃決策、使用工
具并執(zhí)行復雜任務,甚至與其他Agent合作實現(xiàn)任務。盡管多智
能體的發(fā)展仍面臨較大困境,但隨著算力支撐和技術研究的不斷
演進,AIAgent將在各行業(yè)發(fā)揮強勁動力,尤其在與各行業(yè)緊
密相連的金融業(yè),更全面地實現(xiàn)人機融合,為金融機構(gòu)提質(zhì)增效,
創(chuàng)造更深度的價值。
四、大模型在金融業(yè)應用面臨的風險與挑戰(zhàn)
(一)金融應用規(guī)范與指南亟需完善
金融業(yè)作為強監(jiān)管行業(yè),在政策方面一直遵循著高標準和嚴
要求。我國已相繼發(fā)布《生成式人工智能服務管理暫行辦法》《網(wǎng)
絡安全標準實踐指南——生成式人工智能服務內(nèi)容標識方法》
30
《生成式人工智能服務安全基本要求》(征求意見稿)等文件,
對大模型在通用領域的應用進行了合理的約束和引導,但是針對
大模型在金融領域的應用尚且缺少可實施落地的標準規(guī)范和指
南,對應用過程中的權責界定尚不明晰,缺少對生成內(nèi)容的問罰
機制及大模型廣泛應用后可能存在的無序商業(yè)行為的監(jiān)管機制。
此外,針對大模型訓練和推理的AI算力基礎設施、行業(yè)語料庫
標準化建設也較為欠缺。
(二)金融應用場景缺少范式
大模型選型、架構(gòu)調(diào)整設計、技術驗證等環(huán)節(jié)過程復雜,金
融機構(gòu)缺乏大模型技術融合場景落地的方法論,對大模型的能力
邊界認知不足,尚未明確大模型適合哪些業(yè)務場景、是否有必要
替換傳統(tǒng)的AI設備、何時適合落地,尚未健全大模型應用創(chuàng)新
風控管理機制,尚未有典型的落地案例可以向行業(yè)規(guī)模化推廣。
大模型支撐多個場景或服務的行業(yè)應用,其測評指標非常復雜,
測試數(shù)據(jù)集設計構(gòu)建與更新維護難度大、成本高,尚且缺少一個
覆蓋面廣、公允度高、滿足不同場景和任務特征的大模型金融應
用及其風險治理的評估方法或指標體系,致使金融機構(gòu)進行大模
型選型及評估存在較大困難,阻礙了大模型金融場景應用進程。
大模型需要提示工程相關的內(nèi)置模板,與原有的機器學習、深度
學習等模型工作方式有很大差別,也增加了相關人員的工作范度。
此外,大模型金融應用需要與現(xiàn)有系統(tǒng)和業(yè)務流程進行集成,需
要跨組織、跨部門、跨團隊協(xié)作,組織能力面臨挑戰(zhàn)。
31
(三)高質(zhì)量金融訓練數(shù)據(jù)欠缺
數(shù)據(jù)是大模型訓練的基礎,為了切實解決金融業(yè)務問題,需
要大量高質(zhì)量、多領域的金融數(shù)據(jù)基于業(yè)務屬性對大模型進行增
量訓練。金融領域知識存儲形式繁多,包括影像件、PDF、
Excel等多種格式,需要通過分類、清洗、問答數(shù)據(jù)集梳理等大
量前期處理及后期更新維護工作,針對各種業(yè)務難點、要點問
題的解答還需要嗖集大量專家經(jīng)驗,以保持大模型的準確性和
有效性,而這會耗費大量人力物力。同時,大模型訓練迭代需
要一定時間,致使大模型對時事的了解有限。金融數(shù)據(jù)流通仍
在探索階段,而單一金融機構(gòu)掌握的數(shù)據(jù)資源較為有限,一定
程度上影響了大模型金融應用效果。金融數(shù)據(jù)敏感性高,在數(shù)
據(jù)分級分類管理、數(shù)
據(jù)脫敏清洗、防止數(shù)據(jù)偏見和濫用等環(huán)節(jié)也存在難題。
(四)訓練算力支撐普遍不足
大模型訓練和推理需要足夠的算力支撐,在高端GPU芯片斷
供的背景下,金融機構(gòu)對中高端AI算力的需求存在較大缺口。
由于金融數(shù)據(jù)敏感度高,金融機構(gòu)普遍選擇私有化部署大模型,
而構(gòu)建、訓練、優(yōu)化大模型需要高性能的計算資源和大量的存儲
資源,硬件設備的采購和維護需要高昂的資金投入,給金融機構(gòu)
帶來較大的成本壓力。大模型的訓練與推理對AI芯片的要求有
所不同,當前我國AI芯片能較好地支撐推理,而在訓練上仍與
國際領先水平有明顯差距,存在計算能力不足、芯片制程工藝有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 文化管理考試題及答案
- 大一民法試題及答案
- 怎樣培養(yǎng)孩子的審美觀
- 網(wǎng)頁設計師工作總結(jié)
- 全職托管面試題及答案
- 政治機構(gòu)面試題及答案
- 家電公司招投標管理辦法
- 2026屆河北省衡水市中學·高二化學第一學期期中監(jiān)測試題含解析
- 1.3 一元二次方程的根與系數(shù)的關系(教學課件)數(shù)學蘇科版九年級上冊
- 保安負責人崗位知識培訓課件
- 2025年全國幼兒園教師資格證考試教育理論知識押題試題庫及答案(共九套)
- 專業(yè)鞋品采購協(xié)議模板2024版
- 太陽能熱水器維保合同2025年
- 《護士職業(yè)素養(yǎng)》課件
- 西安26中小升初分班考試語文真題
- 2024年深圳技能大賽-電工職業(yè)技能競賽理論考試題庫-上(單選題)
- DB5104T 30-2020 康養(yǎng)旅居地康養(yǎng)民宿建設、服務與管理規(guī)范
- 2024光伏并網(wǎng)柜技術規(guī)范
- 梨狀窩瘺的臨床特征
- 《公路工程預算定額》(JTGT3832-2018)
- 商業(yè)綜合體新舊物業(yè)交接方案
評論
0/150
提交評論