




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
王永超聯(lián)想金融行業(yè)資深架構師1大模型2.0的新賽道世界模型多模態(tài)學習世界模型多模態(tài)學習持續(xù)學習與自適應新型架構與算法個性化與定制化推理超強算力高端模型壓縮小模型可解釋性與透明度倫理與普惠11HunyuanLlama4訓練算力需求(PFLOPS)HunyuanLlama4GPT-5GGemini2.0GPT-5GeminiUltraDoubao2.0GPT-4/4oClaude2Llama3-70B2PalM(540B)Megatron-TuningNLG530BDoubao2.0GPT-4/4oClaude2Llama3-70B2GLM-130BGPT-3175BBaichuanGLM-130BGPT-3175BDeepSeek-V3-671BDeepSeek-R1-671BDeepSeek-R1-Distill-Qwen-32BBERT-LargeTransformerDeepSeek-R1-DistillBERT-LargeTransformerAlexNetDeepSeek:從技術探索到規(guī)模落地的轉折點高性能高性價比2012201320142015201620172018201920202021202220232024202520262模型推理GPU計算為主模型推理GPU計算為主AI邊緣計算超算與智算的差異計算精度數(shù)據規(guī)模AIforScienceAIforScienceGPU加速工程計算CPU并行計算為主Transformer大語言模型訓練深度學習模型訓練大語言模型訓練深度學習模型訓練TBGPU、TPU、DPU等計算為主智算中心GFlopsTFlopsPFlopsEFlops計算規(guī)模3AI在金融行業(yè)的應用場景智能體覆蓋金融業(yè)務全鏈路,前臺精準服務、中臺實時風控、后臺自動合規(guī),實現(xiàn)端到端智能化重構。服務智能化客戶服務交互?智能聊天客服服務智能化客戶服務交互?智能聊天客服?智能自助服務?智能客戶經理?實時服務跟蹤金融產品推薦?產品智能推薦?市場趨勢預測?推薦動態(tài)調整?智能定期回訪投資建議咨詢?智能理財規(guī)劃?智能投資顧問?市場風險預警?投資組合優(yōu)化中中產品設計優(yōu)化風險評估管理業(yè)務決策支持客戶服務交互金融產品推薦投資建議咨詢后運營流程管理合規(guī)審查審計系統(tǒng)技術保障運營智能化運營流程管理?運營智能化運營流程管理?智能財務管理?智能任務分配?智能行政管理?資源調度與優(yōu)化合規(guī)審查審計?智能合規(guī)審查?自動化審計追蹤?智能交易監(jiān)控?合規(guī)策略智能調整系統(tǒng)技術保障?智能資源調度?安全漏洞智能防護?智能故障檢測與修復數(shù)據智能化產品設計優(yōu)先?智能需求分析?產品智能定價?競品分析和對比?用戶行為分析風險評估管理?市場風險監(jiān)測?智能風控評估?欺詐智能識別?智能模擬風險情景業(yè)務決策支持?智能決策規(guī)劃4u4u營銷智腦:客戶服務及流失預警u風險智腦:風險預測及投研決策u運營智腦:智能合規(guī)及技術升級AI技術創(chuàng)新不止,用戶需求演變不息廣泛的千行百業(yè)AI用戶(100,000+)有限的基礎大模型開發(fā)用戶廣泛的千行百業(yè)AI用戶(100,000+)有限的基礎大模型開發(fā)用戶(100+)訓練訓練訓推推理預訓練預訓練高MFU高可用綜合全面5聯(lián)想智能體矩陣賦能金融業(yè)務場景“魔方”提供全渠道接入、AI輔助與情緒識別,“魔方”提供全渠道接入、AI輔助與情緒識別,實現(xiàn)客服效率與體驗雙提升前臺智能服務客服智能體(魔方)解決方案省省省時力心端到端客服方案一體化AI升級數(shù)據安全有保障90%+客戶滿意度提升坐席效率提升運營成本降低通過智研、智問、智繪三大能力,通過智研、智問、智繪三大能力,構建企業(yè)級投研中臺,全面提升投研效率中臺智能決策智能投研解決方案冒研智能體解讀研報冒面智能問數(shù)工具200%+數(shù)據準確度提升投研覆蓋率提升90%+創(chuàng)作效率提升智能報告生成靈活部署助力風險防控實精全時準面多模態(tài)合規(guī)監(jiān)測一體化智能風控全流程合規(guī)保障后臺智能合規(guī)智能行為合規(guī)解決方案95%+風險攔截準確率提高90%+合規(guī)檢查效率提升80%+人工審查成本下降666大模型應用面臨的挑戰(zhàn)大模型訓練模擬仿真大模型訓練模擬仿真推理大模型推理知識庫多元算力——o多元生態(tài)7大模型訓推部署架構應用…應用…AI模型開發(fā)知識庫風險管理策略交易行業(yè)方案推理推理Docker集群(邏輯隔離)大模型訓推平臺基座大模型硬件平臺大模型訓推平臺基座大模型硬件平臺vLLM/Ollama/NVIDIATriton大模型推理框架從大模型生成的文本中提取問答對訓練集群訓練集群DeepSpeed/Ollama/LlamaFactDeepSpeed/Ollama/LlamaFactory大模型訓練框架異構算力管理平臺統(tǒng)一部署、管理、調度和優(yōu)化智能算力異構算力管理平臺統(tǒng)一部署、管理、調度和優(yōu)化智能算力算力存儲服務器服務器WA7780G3WA5480G3存儲交換機AIAI硬件設備GPU芯片8異構智算平臺在AI計算中的作用生成AI生成圖像數(shù)據圖像數(shù)據智能問答文本數(shù)據審查AI異構智算平臺模型開發(fā)推理服務發(fā)布智能問答文本數(shù)據審查AI異構智算平臺模型開發(fā)推理服務發(fā)布音頻數(shù)據推理音頻數(shù)據推理訓練、精調知識庫應用開發(fā)場景需求數(shù)據治理模型優(yōu)化訓練、精調知識庫應用開發(fā)場景需求數(shù)據治理模型優(yōu)化視頻視頻數(shù)據算力管理與監(jiān)控算力調度與優(yōu)化營銷推薦算力管理與監(jiān)控算力調度與優(yōu)化營銷推薦異構算子庫的集成關系數(shù)據代碼生成關系數(shù)據代碼生成AI算力生態(tài):芯片、核心部件…9聯(lián)想萬全異構智算平臺持續(xù)升級聯(lián)想以前沿技術為用戶實現(xiàn)定制化服務優(yōu)勢大模型預訓練差異化技術進一步升級虛擬化GPU算力利用率AI訓推慢節(jié)點故障預測與自愈系統(tǒng)AI編譯優(yōu)化器AI訓推慢節(jié)點故障預測與自愈系統(tǒng)AI編譯優(yōu)化器訓練和推理計算開銷各降低15%+推理延遲降低3倍+AI推理性能提升5-10倍AI推理加速算法集-推理性能提升5-10倍相比業(yè)界最優(yōu)社區(qū)方案保持20%+優(yōu)勢基于推理綜合性能基準AIAI一體機綜合性能TTFTTPOT并發(fā)數(shù)量序列長度首字延遲并發(fā)數(shù)量序列長度AI編譯優(yōu)化–挖掘計算潛力訓練和推理計算開銷各降低15%+AI開發(fā)框架計算路徑優(yōu)化CPU/GPU/NPUAI開發(fā)框架計算路徑優(yōu)化CPU/GPU/NPU/TPU…驅動層算子替代用更高效的算子替代算子融合將不同基礎算子融合路徑優(yōu)化算子替代用更高效的算子替代算子融合將不同基礎算子融合等價變換簡化計算路徑慢節(jié)點故障預測與自愈-保障算力極致可靠自動發(fā)現(xiàn)故障,百卡秒級、千卡分鐘級、萬卡十分鐘級自愈大模型訓推容錯框架多層次異步并行即時檢查點讀寫多層次異步并行即時檢查點讀寫檢查點壓縮網絡通信輪詢GPU利用率統(tǒng)計分析計算與通信API攔截故障模式匹配慢節(jié)點網絡擁塞/GPU故障模式匹配慢節(jié)點網絡擁塞/GPU性能異常檢查點與數(shù)據親和性指標與日志監(jiān)控網絡拓撲感知指標與日志監(jiān)控網絡拓撲感知主動預測、發(fā)現(xiàn)并快速自動解決慢節(jié)點故障算力使用時慢節(jié)點不易識別主動預測、發(fā)現(xiàn)并快速自動解決慢節(jié)點故障算力使用時慢節(jié)點不易識別異步設計對訓推干擾小于5%推理延遲降低3倍以上 AlltoAll分發(fā)AlltoAll聚合計算1計算通信獨立計算1計算通信獨立計算2計算2通信1通信1時間節(jié)省計算通信協(xié)同計算1時間節(jié)省計算通信協(xié)同計算1計算2計算2通信1通信1AlltoAll分發(fā)專家計算專家計算AlltoAll聚合大幅提高推理響應速度聯(lián)想可持續(xù)發(fā)展ESG解決方案全景ESGESG外化能力屋頂圖愿景:五年內成為ICT行業(yè)內可持續(xù)發(fā)展(ESG)解決方案的領導者EGovernanceESGEGovernanceESG咨詢服務戰(zhàn)略咨詢|綠色供應鏈管理|企業(yè)碳管理|評級提升|ESG報告|生物多樣性nvironmental環(huán)境nvironmental氣候行動丨循環(huán)經濟|能源效率 氣候行動聯(lián)想零碳服務聯(lián)想零立方服務 循環(huán)經濟IT設備再生服務(回收、處置、翻新) 能源效率 零碳智慧園區(qū)低碳智算中心社會企業(yè)合規(guī)社會公益合規(guī)治理聯(lián)想全球學習中心聯(lián)想全球學習中心聯(lián)想法務咨詢服務聯(lián)想法務咨詢服務?企業(yè)人才培養(yǎng)咨詢服務?企業(yè)出海、AI應用與實踐、前沿技術相關的戰(zhàn)略與經營管理咨詢?專業(yè)共建、聯(lián)合授課、人才培養(yǎng)基地等?合規(guī)評估與咨詢?合規(guī)體系建立?數(shù)字化合規(guī)治理平臺?企業(yè)出海&貿易合規(guī)?應對監(jiān)管與法律支持?AI能耗管理解決方案?智慧能源管理解決方案?智慧園區(qū)運營管理解決方案?模塊化數(shù)據中心解決方案?液冷數(shù)據中心解決方案企業(yè)企業(yè)ESG數(shù)字化管理平臺(樂循)項目背景&挑戰(zhàn)?業(yè)務發(fā)展要求從“經驗驅動”轉向“數(shù)據+項目背景&挑戰(zhàn)?業(yè)務發(fā)展要求從“經驗驅動”轉向“數(shù)據+認知驅動”
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 椒江區(qū)種植養(yǎng)護施工方案
- 綦江玻璃鋼防腐施工方案
- 洗車池加固施工方案設計
- 云南高效率施工方案審計
- 建筑項目各崗位職責與工作重點試題含答案
- 2025年鄭州美術中招試卷及答案
- 2025年高考音樂模擬試卷及答案
- 幼師面試考試試題及答案
- 化學與環(huán)境保護(治理)試題
- 化學平等精神(交流、尊重)培養(yǎng)試題
- 2025年部編版新教材三年級上冊《9.犟龜》教案
- 2024年南寧市招聘中小學教師筆試真題
- 養(yǎng)老院安全生產培訓
- 老員工帶新員工的培訓制度
- 高標準農田建設項目風險評估與應對措施
- 水滸傳每回內容梗概
- 人教版初中九年級全冊英語單詞表(完整版)
- 工地試驗室安全培訓內容
- 合同車輛質押合同
- 2024版數(shù)據中心基礎設施運維與維保服務合同2篇
- 增材制造課件
評論
0/150
提交評論