




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
三大發(fā)展引擎(公共云、開(kāi)源生態(tài)、高質(zhì)量數(shù)據(jù))+一套安全架構(gòu)大模型已成為新質(zhì)生產(chǎn)力的重要組成部分,促進(jìn)著科技融合創(chuàng)新、產(chǎn)業(yè)結(jié)構(gòu)升級(jí)。同時(shí),也面臨著來(lái)自算力、算法、數(shù)據(jù)以及安全等方面的新挑戰(zhàn)?,F(xiàn)如今,兼顧發(fā)展與安全的治理模式逐漸成為共識(shí),本書基于大模型技術(shù)及其應(yīng)用的風(fēng)險(xiǎn)現(xiàn)狀與產(chǎn)業(yè)實(shí)踐,形成了以公共云基礎(chǔ)設(shè)施、開(kāi)源生態(tài)、數(shù)據(jù)供給為發(fā)展引擎,以安全可信架構(gòu)為保障的治理藍(lán)圖,為落地實(shí)現(xiàn)發(fā)展與安全兼顧的目標(biāo)提供參考。多角色全生命理實(shí)踐大模型產(chǎn)業(yè)應(yīng)用日益廣泛,生態(tài)愈發(fā)成熟,其背后是逐漸清晰的角色劃分和更加復(fù)雜的應(yīng)用模式。在大模型研發(fā)應(yīng)用的全生命,基礎(chǔ)供應(yīng)者、技術(shù)支持者、服務(wù)提供者、服務(wù)使用者、內(nèi)容傳播者等相關(guān)角色在產(chǎn)業(yè)發(fā)展和安全保障方面承擔(dān)著不同的使命和責(zé)任。在大模型落地應(yīng)用時(shí),還有更多的工具
/
插件、文檔及環(huán)境信息、知識(shí)庫(kù)等被開(kāi)發(fā)和利用,幫助提升大模型的能力。在這種復(fù)雜多元的產(chǎn)業(yè)現(xiàn)狀下,新風(fēng)險(xiǎn)和新挑戰(zhàn)與日俱增。如何沉淀多方安全實(shí)踐,明確全鏈路、多角色的技術(shù)與應(yīng)用控制措施,促進(jìn)協(xié)同治理,有效防范化解人工智能的風(fēng)險(xiǎn),保障大模型技術(shù)及應(yīng)用的持續(xù)穩(wěn)定發(fā)展,是本書闡述的重點(diǎn)。98大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告編寫單位指導(dǎo)委員會(huì)邵曉鋒 阿里巴巴集團(tuán)風(fēng)險(xiǎn)委員會(huì)主席聞
佳 阿里巴巴集團(tuán)公共事務(wù)總裁俞思瑛 阿里巴巴集團(tuán)首席法務(wù)官范科峰 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院副院長(zhǎng)錢
磊 阿里巴巴集團(tuán)安全部總裁傅宏宇 阿里研究院人工智能治理中心主任 阿里巴巴達(dá)摩院法務(wù)安全負(fù)責(zé)人彭駿濤 阿里云智能集團(tuán)
AI
標(biāo)準(zhǔn)負(fù)責(zé)人黃龍濤 阿里安全資深算法專家陳岳峰 阿里安全
AIGC
安全算法負(fù)責(zé)人沈
暉 阿里巴巴達(dá)摩院安全總監(jiān) 阿里安全生態(tài)合作負(fù)責(zé)人
阿里安全高級(jí)體驗(yàn)設(shè)計(jì)專家 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院大模型安全標(biāo)準(zhǔn)負(fù)責(zé)人黃
晴 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院工程師薛
暉 阿里巴巴科技倫理委員會(huì)委員
&AAIG
主任 阿里云智能集團(tuán)標(biāo)準(zhǔn)化業(yè)務(wù)副總裁袁
媛 阿里研究院院長(zhǎng) 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院網(wǎng)安中心主任胡
影
中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院網(wǎng)安中心副主任專家委員會(huì)編寫組主要成員編寫組組長(zhǎng)張
榮 阿里云智能集團(tuán)通義安全負(fù)責(zé)人郝春亮 中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院網(wǎng)安中心數(shù)據(jù)部主任聯(lián)系我們.alibaba-inc鳴謝朱琳潔王崢
陶嘉羚許曉東聶云奕
李進(jìn)鋒李金純杜東為
王瑩徐璐妮牟立煜
石洪竺張
強(qiáng)關(guān)于我們阿里巴巴人工智能治理與可持續(xù)發(fā)展研究中心(AAIG)是阿里巴巴集團(tuán)旗下的人工智能頂級(jí)研發(fā)團(tuán)隊(duì),致力于利用AI
技術(shù)解決安全風(fēng)險(xiǎn)問(wèn)題,并推動(dòng)AI
技術(shù)更加安全、可靠、可信賴和可用。團(tuán)隊(duì)成員在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解、數(shù)據(jù)挖掘與網(wǎng)絡(luò)安全等領(lǐng)域的國(guó)際頂級(jí)會(huì)議和期刊上發(fā)表論文
100
多篇,獲得國(guó)際國(guó)內(nèi)專利授權(quán)
60
余項(xiàng),申請(qǐng)中專利
200
多項(xiàng)。AAIG
貫徹“科技創(chuàng)新是最好的網(wǎng)絡(luò)安全”的理念,所研發(fā)的人工智能產(chǎn)品涵蓋內(nèi)容安全、業(yè)務(wù)風(fēng)控、網(wǎng)絡(luò)安全、數(shù)據(jù)安全與算法安全等多個(gè)領(lǐng)域,為集團(tuán)在全球的千萬(wàn)商家和十億消費(fèi)者提供更好的安全和體驗(yàn)。掃碼關(guān)注微信大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告1.
大模型成為新質(zhì)生產(chǎn)力的重要組成 18部分10112.
安全可信是大模型持續(xù)發(fā)展的基本 20要求二大模型發(fā)展與挑戰(zhàn)1.
大模型技術(shù)與應(yīng)用的發(fā)展現(xiàn)狀24原生多模態(tài)成為發(fā)展主流 24超長(zhǎng)上下文理解能力不斷突破 24傳統(tǒng)人機(jī)交互方式被顛覆重塑 25大模型的應(yīng)用模式日益豐富、產(chǎn)業(yè)生態(tài)愈發(fā) 26成熟2.
算力、算法、數(shù)據(jù)與安全挑戰(zhàn)27算力短缺問(wèn)題突出,制約大模型持續(xù)發(fā)展 27模型結(jié)構(gòu)創(chuàng)新難度大,可解釋性問(wèn)題加劇 28高質(zhì)量數(shù)據(jù)供給不足,成為模型訓(xùn)練新瓶頸 28大模型的技術(shù)特性帶來(lái)了新的安全風(fēng)險(xiǎn) 29目錄一引言三公有云是大模型技術(shù)發(fā)展和應(yīng)用落地的優(yōu)選路徑1.
大模型的訓(xùn)練強(qiáng)依賴大規(guī)模的基礎(chǔ)設(shè)
34施資源挑戰(zhàn)技術(shù)挑戰(zhàn)3434362.
公共云是大模型發(fā)展與應(yīng)用的優(yōu)選解決方案公共云為訓(xùn)練全球領(lǐng)先的大模型提供必要條件
36公共云提供高效率和低成本 37公共云為大模型提供全面安全保障 393.
公共云可有效應(yīng)對(duì)算力短缺困境41算力短缺的根本原因是供應(yīng)無(wú)法滿足需求 41公共云最大化發(fā)揮稀缺計(jì)算資源的價(jià)值,推動(dòng)
42規(guī)?;瘧?yīng)用公共云可協(xié)同利用多來(lái)源算力,豐富算力生態(tài)
42四開(kāi)源生態(tài)促進(jìn)大模型算法發(fā)展與安全1.
開(kāi)源生態(tài)對(duì)于大模型的誕生具有基礎(chǔ)
46性作用2.
開(kāi)源生態(tài)是大模型技術(shù)發(fā)展和應(yīng)用推
48廣的加速器大模型開(kāi)源的核心意義是普惠開(kāi)源生態(tài)助力提升大模型透明度與安全性開(kāi)源生態(tài)加速大模型發(fā)展和應(yīng)用開(kāi)源生態(tài)助力我國(guó)搶占產(chǎn)業(yè)生態(tài)制高點(diǎn)484950513.
開(kāi)源生態(tài)提升大模型安全性、強(qiáng)化業(yè)
53界信任度開(kāi)源生態(tài)促進(jìn)多方協(xié)同安全治理 53開(kāi)源生態(tài)確保模型安全評(píng)估客觀公正 54開(kāi)源生態(tài)幫助建立業(yè)界對(duì)大模型技術(shù)的信任 55大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告五高質(zhì)量數(shù)據(jù)供給生態(tài)是具備持續(xù)競(jìng)爭(zhēng)力的基礎(chǔ)1.
合成數(shù)據(jù)是解決高質(zhì)量訓(xùn)練數(shù)據(jù)供給
58不足的突破口12132.
構(gòu)建更匹配模型部署要求的高質(zhì)量應(yīng)
61用數(shù)據(jù)生態(tài)數(shù)據(jù)上云推動(dòng)模型應(yīng)用數(shù)據(jù)生態(tài)建設(shè),提供保
61障數(shù)據(jù)安全的能力基礎(chǔ)檢索增強(qiáng)是模型高質(zhì)量用數(shù)的可行方案 62以更開(kāi)放、務(wù)實(shí)、多元的方式促進(jìn)高質(zhì)量數(shù)據(jù)
64供給六體系化的安全治理能力是穩(wěn)定發(fā)展的保障1.
多角色視角安全治理架構(gòu) 682.
大模型安全治理規(guī)范:全面多元融合
71的規(guī)范框架法律法規(guī)、標(biāo)準(zhǔn)規(guī)范、倫理道德原則的性質(zhì)、
71作用、執(zhí)行路徑有明顯的差異組織保障是一切體系化治理能力的基礎(chǔ)723.
大模型安全治理措施:技術(shù)與應(yīng)用風(fēng)
73險(xiǎn)治理構(gòu)成的立體防護(hù)網(wǎng)圍繞全生命技術(shù)治理措施針對(duì)用途和場(chǎng)景的應(yīng)用風(fēng)險(xiǎn)治理以安全使用管理防范濫用誤用行為7391934.
模型產(chǎn)業(yè)鏈逐步成熟,多方協(xié)同治理
95價(jià)值日益凸顯多方協(xié)同治理的價(jià)值多方協(xié)同治理的特點(diǎn)多方協(xié)同治理中的產(chǎn)業(yè)貢獻(xiàn)959696七結(jié)語(yǔ)附錄A:大模型各領(lǐng)域應(yīng)用場(chǎng)景及實(shí)踐案例個(gè)人生活新助理產(chǎn)業(yè)智能新模式公共服務(wù)新體驗(yàn)106106108大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告附錄B:云上開(kāi)放的大模型平臺(tái):百煉1.
大模型時(shí)代的需求分析 11014151.5
合規(guī)與安全是基礎(chǔ)1122.
百煉作為大模型服務(wù)平臺(tái)的突出優(yōu)勢(shì)
113百煉提供強(qiáng)大而實(shí)惠的計(jì)算資源百煉提供豐富的模型供給百煉提供模型全生命服務(wù)百煉提供構(gòu)建應(yīng)用的完整工具鏈合規(guī)性與安全性1131141151161183.
百煉助推我國(guó)人工智能行業(yè)發(fā)展120附錄C:
人工智能開(kāi)源社區(qū):魔搭人工智能發(fā)展與應(yīng)用須跨過(guò)四道門檻
121MaaS
實(shí)現(xiàn)人工智能模型“開(kāi)箱即用”
1221.1
靈活性和彈性兼?zhèn)涞挠?jì)算能力1101.2
豐富的模型供給1113.
魔搭社區(qū)的四大核心優(yōu)勢(shì)123模型全生命服務(wù)構(gòu)建應(yīng)用的工具鏈1111124.
魔搭社區(qū)正成為模型應(yīng)用的“加速器”1245.
魔搭社區(qū)助力大模型安全125大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告1
.大模型成為新質(zhì)生產(chǎn)力的重要組成部分大模型已成為信息技術(shù)的新里程碑??v觀歷史,信息技術(shù)的發(fā)展往往由計(jì)算機(jī)技術(shù)、數(shù)據(jù)技術(shù)、算法技術(shù)的獨(dú)立發(fā)展而推動(dòng),傳統(tǒng)人工智能局限于執(zhí)行特定目的功能、應(yīng)用于特定場(chǎng)景之中。大模型整合利用了各類信息技術(shù)資源,不僅代表著算法的飛躍,也是算力、數(shù)據(jù)、工程等協(xié)同發(fā)展的結(jié)果,推動(dòng)信息技術(shù)新拐點(diǎn)的到來(lái)。隨著大模型的不斷發(fā)展,人工智能的能力邊界不斷拓展,正逐步從目的單一、場(chǎng)景限定的專用型人工智能向具有認(rèn)知和推理能力、勝任多種用途的通用型人工智能轉(zhuǎn)變。大模型促進(jìn)科技進(jìn)一步融合創(chuàng)新。自
2023
年以來(lái),大模型步入了高速發(fā)展階段,技術(shù)先進(jìn)性和能力通用性兼?zhèn)涑蔀槠浜诵膬?yōu)勢(shì),通過(guò)大模型賦能千行百業(yè),利用人工智能提高傳統(tǒng)要素的邊際生產(chǎn)率已經(jīng)逐步成為現(xiàn)實(shí)。在國(guó)家大力推動(dòng)“人工智能+”行業(yè)應(yīng)用融合創(chuàng)新的背景下,大模型已經(jīng)滲透到業(yè)并得到深度應(yīng)用,例如,在在線購(gòu)物中降低商品展示成本、提高用戶購(gòu)物體驗(yàn);在工業(yè)機(jī)器人和無(wú)人駕駛中,環(huán)境感知和判斷提高了其自動(dòng)化能力;人工智能驅(qū)動(dòng)的科研推動(dòng)解決蛋白質(zhì)組成結(jié)構(gòu)等科學(xué)難題。從服務(wù)用戶到助力生產(chǎn),從基礎(chǔ)研發(fā)到應(yīng)用開(kāi)發(fā),大模型大幅提升了生產(chǎn)效率和創(chuàng)新能力。大模型創(chuàng)新推動(dòng)產(chǎn)業(yè)結(jié)構(gòu)全面升級(jí)。大模型所帶來(lái)的技術(shù)革新降低了知識(shí)門檻、節(jié)約了創(chuàng)新成本、某省市場(chǎng)活力,讓更多人能夠參與到創(chuàng)造性活動(dòng)中,催生全新的商業(yè)模式和服務(wù)形態(tài),引領(lǐng)新一輪的產(chǎn)業(yè)轉(zhuǎn)型升級(jí)。大模型有望在未來(lái)重塑產(chǎn)業(yè)鏈條,推動(dòng)形成以數(shù)據(jù)驅(qū)動(dòng)、智能主導(dǎo)的新型生產(chǎn)方式和經(jīng)濟(jì)增長(zhǎng)點(diǎn),讓經(jīng)濟(jì)發(fā)展始終保持活力,通過(guò)持續(xù)創(chuàng)新推動(dòng)高質(zhì)量發(fā)展,用科技進(jìn)步解決發(fā)展帶來(lái)的不平衡難題。大模型發(fā)展與治理同步推進(jìn)成為新共識(shí)。大模型技術(shù)的出現(xiàn)和發(fā)展標(biāo)志著人工智能從1819專用化走向通用化,人工智能超越人類智能、人類和機(jī)器共生共棲的社會(huì)場(chǎng)景從幻想走向現(xiàn)實(shí)。人工智能從多元發(fā)展轉(zhuǎn)向聚焦于大模型的通用能力,通用人工智能成為國(guó)家科技能力現(xiàn)代化的重要標(biāo)志,大模型的泛化、推理等特有能力為大模型更為廣泛的應(yīng)用提供了新的機(jī)遇,大模型研發(fā)所需的模型、算力和數(shù)據(jù)等科技要素成為關(guān)注焦點(diǎn),對(duì)人才、投入和制度進(jìn)行有效利用和合理配置的政策試點(diǎn)也迅速鋪開(kāi)。與此同時(shí),大模型超出預(yù)期的表現(xiàn)也不斷刷新人類對(duì)機(jī)器智能的認(rèn)知。人工智能的突破性創(chuàng)新對(duì)人類文化價(jià)值、社會(huì)經(jīng)濟(jì)形態(tài)、個(gè)人基本權(quán)益帶來(lái)諸多影響,重構(gòu)人類對(duì)機(jī)器的主導(dǎo)性和權(quán)威性,讓人工智能回歸以人類為中心的發(fā)展路徑,有效管控大模型帶來(lái)的核心風(fēng)險(xiǎn)等目標(biāo)成為各國(guó)政府以及人工智能產(chǎn)業(yè)界的共識(shí)。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告2
.
安全可信是大模型持續(xù)發(fā)展的基本要求人工智能安全理念從
AI
Security
向AI
Safety
發(fā)展。隨著互聯(lián)網(wǎng)步入智能化時(shí)代,網(wǎng)絡(luò)空間安全的關(guān)注重心從系統(tǒng)安全、數(shù)據(jù)安全轉(zhuǎn)向人工智能安全。大模型技術(shù)的快速發(fā)展和通用化應(yīng)用潛力對(duì)人類社會(huì)和網(wǎng)絡(luò)文明帶來(lái)了新的挑戰(zhàn),相較于關(guān)注系統(tǒng)完整性、防止數(shù)據(jù)和未授權(quán)訪問(wèn)的
AI
security
理念,AI
safety
理念更多聚焦于前沿人工智能技術(shù)對(duì)人類核心權(quán)益和中長(zhǎng)期發(fā)展的影響,通過(guò)尋求共識(shí)、構(gòu)建規(guī)則、評(píng)估影響、防控風(fēng)險(xiǎn)、完善技術(shù)、落實(shí)責(zé)任、推動(dòng)協(xié)作的系統(tǒng)化機(jī)制,將國(guó)家安全、個(gè)體權(quán)利、群體利益、國(guó)際合作等納入人工智能安全的標(biāo)準(zhǔn)和要求之中,呼吁各方共同面對(duì)人工智能帶來(lái)的不確定性挑戰(zhàn),更負(fù)責(zé)任地開(kāi)發(fā)、部署和使用人工智能,防止濫用誤用,通過(guò)人工智能安全治理構(gòu)建信任,讓可靠的人工智能推動(dòng)網(wǎng)絡(luò)技術(shù)應(yīng)用發(fā)展。追求大模型安全可信是全球共識(shí)。自大模型問(wèn)世之時(shí)起,其潛在的安全風(fēng)險(xiǎn)和安全技術(shù)能力就備受全球關(guān)注,在大模型技術(shù)能力不斷突破、模型性能不斷提升的同時(shí),人們對(duì)大模型安全風(fēng)險(xiǎn)以及安全治理的研究也在持續(xù)推進(jìn)。根據(jù)大模型的技術(shù)特征和應(yīng)用特點(diǎn),對(duì)大模型進(jìn)行有效治理,讓大模型始終處在人類控制之下,不斷降低大模型的安全風(fēng)險(xiǎn),讓大模型更好地服務(wù)人類發(fā)展,已成為全球共識(shí)。歐盟針對(duì)通用人工智能進(jìn)行立法,保障人類權(quán)利免受大模型侵害,美國(guó)、英國(guó)則針對(duì)基礎(chǔ)模型或前沿模型提出安全倡議,并發(fā)展風(fēng)險(xiǎn)評(píng)測(cè)等安全技術(shù)。我國(guó)《全球人工智能治理倡議》強(qiáng)調(diào)以人為本、智能向善,堅(jiān)持發(fā)展與安全并重,提出打造可審核、可監(jiān)督、可追溯、可信賴的人工智能技術(shù),以務(wù)實(shí)、包容的態(tài)度動(dòng)態(tài)管控大模型風(fēng)險(xiǎn),綜合采取政策、標(biāo)準(zhǔn)、技術(shù)等手段,讓大模型成為安全可信的生產(chǎn)力工具。人工智能科技企業(yè)主動(dòng)盡責(zé),響應(yīng)政府倡議、落實(shí)安全要求,在大模型安全方面加大投入、加強(qiáng)研究,不斷提高大模型安全水平,更好地在人工智能技術(shù)擴(kuò)散期建立信任。安全是大模型發(fā)展的必然要求,是大模型廣泛應(yīng)用的前提條件。一是人工智能2021技術(shù)的發(fā)展離不開(kāi)安全。人工智能安全技術(shù)能夠控制人工智能本身帶來(lái)的負(fù)外部性,規(guī)范人工智能技術(shù)的健康持續(xù)發(fā)展,降低技術(shù)新變化對(duì)人類社會(huì)的潛在傷害,讓更多人享受到科技可持續(xù)發(fā)展帶來(lái)的惠益。具有代表性的大模型企業(yè)都不斷加大在模型安全方面的技術(shù)研發(fā)投入,提高模型負(fù)責(zé)任性,強(qiáng)化模型與人類價(jià)值觀的對(duì)齊,從而建立并加強(qiáng)開(kāi)發(fā)者和使用者對(duì)大模型的信任和信賴。二是安全水平將成為大模型應(yīng)用的核心競(jìng)爭(zhēng)力。安全技術(shù)對(duì)于大模型的應(yīng)用至關(guān)重要,只有當(dāng)用戶確信其數(shù)據(jù)隱私能得到有效保護(hù),模型輸出結(jié)果可靠且不擊時(shí),大模型才能在更多領(lǐng)域得以廣泛應(yīng)用,并逐步與實(shí)體經(jīng)濟(jì)深度融合。大模型的安全水平也決定了特定行業(yè)智能化發(fā)展的速度,如金融、醫(yī)療等行業(yè)對(duì)安全有著極高的要求,大模型安全技術(shù)的成熟度直接決定了這些行業(yè)智能化發(fā)展的速度和格局。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告1.1
原生多模態(tài)成為發(fā)展主流當(dāng)前,大模型的關(guān)鍵詞是“多模態(tài)”。近期大模型多模態(tài)能力迅速提升,從只支持文本逐步擴(kuò)展到不同模態(tài),目前已具有對(duì)文本、圖像、音頻、視頻等多模態(tài)內(nèi)容的理解分析和推理等能力。
2024
年
5
月,OpenAI
發(fā)布了支持全模態(tài)信息輸入的
GPT-4o,Google
發(fā)布了同樣支持多模態(tài)輸入的
Gemini1.5
Pro,能夠同時(shí)處理和理解文本、視頻和音頻數(shù)據(jù);國(guó)內(nèi)阿里云等企業(yè)也陸續(xù)發(fā)布文生音頻、文生視頻等大模型產(chǎn)品。多模態(tài)能力使得模型在處理包含豐富信息的復(fù)雜場(chǎng)景時(shí)表現(xiàn)出色,例如在視頻內(nèi)容理解或多語(yǔ)言翻譯任務(wù)中,模型能夠從這些不同模態(tài)的數(shù)據(jù)中提取信息,并在需要時(shí)進(jìn)行綜合分析,以提供更準(zhǔn)確和豐富的響應(yīng)。原生多模態(tài)可能是未來(lái)大模型的“主賽道”。區(qū)別于將多個(gè)不同模態(tài)的模型整合來(lái)獲取多模態(tài)能力,原生多模態(tài)大模型是指模型天然具備處理多種不同類型輸入數(shù)據(jù)(例如文本、圖像、音頻等)的能力。與傳統(tǒng)的單一模態(tài)模型不同,原生多模態(tài)大模型通過(guò)同時(shí)處理、理解、生成多種不同類型的信息,從而實(shí)現(xiàn)更加全面和綜合的語(yǔ)義理解和生成任務(wù)。這也是GPT-4o
等模型能夠直接輸出擬人化、具備情感交流能力的原因,也進(jìn)一步提升了生成內(nèi)容的擬真度?,F(xiàn)階段來(lái)看,原生多模態(tài)是當(dāng)下一段時(shí)間大模型主要發(fā)展突破的重點(diǎn)。1.2
超長(zhǎng)上下文理解能力不斷突破大模型能夠處理的上下文長(zhǎng)度是其基礎(chǔ)能力的體現(xiàn)。對(duì)較長(zhǎng)上下文的處理能力是對(duì)話系統(tǒng)、文檔處理、代碼生成以及工具調(diào)用等的基礎(chǔ),能夠處理長(zhǎng)上下文意味著大模型1
.大模型技術(shù)與應(yīng)用的發(fā)展現(xiàn)狀能夠理解和處理越復(fù)雜的信息,繼而能進(jìn)行更全面、細(xì)致、準(zhǔn)確地閱讀和理解。這種能力使得大模型在復(fù)雜和不熟悉的情境下能也提供更專業(yè)、更有價(jià)值的幫助,從而進(jìn)一步提高其在日常應(yīng)用中的實(shí)用性和效率。2425大模型上下文窗口在過(guò)去一年不斷突破。得益于近一年大模型相關(guān)的算法架構(gòu)優(yōu)化(如位置編碼和注意機(jī)制改進(jìn))、模型壓縮技術(shù)(如量化和剪枝)以及計(jì)算資源(GPU顯存)的顯著提升,大模型處理長(zhǎng)序列的能力大幅提升。大模型上下文窗口已經(jīng)從GPT-4
的
128K
突破到百萬(wàn)乃至千萬(wàn)token
量級(jí),這意味著可向模型輸入數(shù)小時(shí)視頻、數(shù)十小時(shí)音頻、數(shù)萬(wàn)行代碼,以及超過(guò)百萬(wàn)的單詞。Google
的
Gemini、阿里巴巴的Qwen-Long
等模型均已具備類似能力。1.3
傳統(tǒng)人機(jī)交互方式被顛覆重塑具備多模態(tài)能力的大模型可像人一樣與用戶交互。大模型產(chǎn)品化的加速發(fā)展正在重塑人機(jī)交互方式,極大改變了人們與技術(shù)的互動(dòng)模式,人機(jī)交互方式未來(lái)將更接近人與人之間的交互。近期不斷有大模型產(chǎn)品展示視頻發(fā)布,大模型通過(guò)麥克風(fēng)接收用戶語(yǔ)音輸入,通過(guò)攝像頭觀察用戶狀態(tài),直接與用戶對(duì)話并給出工作生活建議。此外,傳統(tǒng)計(jì)算機(jī)操作系統(tǒng)集成了大模型后,用戶可通過(guò)自然語(yǔ)言命令控制計(jì)算機(jī)執(zhí)行各種任務(wù),例如某著名企業(yè)發(fā)布的
Copilot
PC。這種交互方式的革新,不僅提高了工作效率,還使得非技術(shù)背景的用戶也能輕松使用高級(jí)功能,極大降低了技術(shù)的使用門檻。未來(lái),人機(jī)交互的范式將從傳統(tǒng)的圖形界面和復(fù)雜的命令行操作轉(zhuǎn)變?yōu)楦又庇^和自然的多模態(tài)交互方式。大模型對(duì)人機(jī)交互方式的重塑在為人類提供便捷的同時(shí),也為技術(shù)發(fā)展開(kāi)辟了新的道路。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告1.4
大模型的應(yīng)用模式日益豐富、產(chǎn)業(yè)生態(tài)愈發(fā)成熟產(chǎn)業(yè)應(yīng)用日益廣泛的背后是更加豐富的應(yīng)用模式。在模型開(kāi)發(fā)層面,基于基礎(chǔ)大模型的優(yōu)化訓(xùn)練、二次開(kāi)發(fā)被廣泛應(yīng)用,使得各行各業(yè)能以較低成本訓(xùn)練出垂直領(lǐng)域大模型。在模型應(yīng)用層面,檢索增強(qiáng)、AI
Agent
等技術(shù)的發(fā)展,使得大量上下文信息、工具
/
插件成為大模型的一部分,有效促進(jìn)了大模型與實(shí)體經(jīng)濟(jì)的深度適配應(yīng)用。產(chǎn)業(yè)生態(tài)愈發(fā)成熟呈現(xiàn)出更加清晰的角色分工。數(shù)據(jù)、算力、算法是大模型的基礎(chǔ),其相關(guān)主體,如數(shù)據(jù)標(biāo)注平臺(tái)和數(shù)據(jù)提供商、云服務(wù)和芯片廠商、學(xué)術(shù)研究機(jī)構(gòu)和開(kāi)源社區(qū)等,為大模型提供基礎(chǔ)支撐;在模型訓(xùn)練階段,技術(shù)支持者完成數(shù)據(jù)準(zhǔn)備、算法設(shè)計(jì)、模型訓(xùn)練和優(yōu)化等,產(chǎn)出大模型;在服務(wù)上線階段,技術(shù)支持者和服務(wù)提供者共同保證選取的大模型、部署環(huán)境、應(yīng)用和系統(tǒng)的質(zhì)量和安全;在內(nèi)容生成階段,產(chǎn)品和服務(wù)將面向用戶進(jìn)行交互,由服務(wù)提供者完成模型的運(yùn)行和監(jiān)控;最后,由于大模型在擬真、泛化等方面的超強(qiáng)能力,用戶進(jìn)行生成內(nèi)容發(fā)布和傳播階段的安全措施也是大模型產(chǎn)業(yè)鏈需要考慮的重要部分。在大模型高速發(fā)展的同時(shí),我們也面臨著算力短缺、高質(zhì)量數(shù)據(jù)缺乏和模型安全等問(wèn)題的挑戰(zhàn)。要克服這些障礙,需要技術(shù)創(chuàng)新、行業(yè)合作和政策支持,從而確保大模型的安全、可靠、可信賴、可用。26272.1
算力短缺問(wèn)題突出,制約大模型持續(xù)發(fā)展算力短缺是全球共性問(wèn)題。算力短缺的本質(zhì)是需求增速遠(yuǎn)超產(chǎn)能擴(kuò)和芯片性能的提升速度。隨著模型參數(shù)規(guī)模的快速增長(zhǎng),以及模型應(yīng)用的泛化和深化,全球?qū)λ懔Φ男枨蟾咚僭鲩L(zhǎng),供給缺口巨大。比如,Meta
計(jì)劃到
2024
年年底擁有
35
萬(wàn)張H100
英偉達(dá)
GPU
卡,某著名企業(yè)計(jì)劃
2024
年采購(gòu)數(shù)萬(wàn)張
B100;亞用
16000
上
H200
卡在公共云上提供大模型服務(wù)。受限于產(chǎn)能不足,英偉達(dá)的高端
GPU
H100交貨管已經(jīng)縮短,但依然需要
8-12
周。我國(guó)算力短缺問(wèn)題突出。我國(guó)正在大模型領(lǐng)域奮勇發(fā)展,訓(xùn)練和推理對(duì)算力的需求快速上升。OpenAI
訓(xùn)練
GPT-4
使用了大約
25000
張
A100
GPU
卡;谷歌訓(xùn)練
Gemini所使用的算力是
GPT-4
訓(xùn)練算力的
4-5
倍。我某著名企業(yè)業(yè)要訓(xùn)練全球領(lǐng)先水平的大模型,至少需要萬(wàn)卡、十萬(wàn)卡的集成算力。然而,我國(guó)算力短缺問(wèn)題仍然突出,其主要原因一是國(guó)產(chǎn)
GPU
在短期內(nèi)還無(wú)法完全替代海外高端芯片,無(wú)法滿足大模型的訓(xùn)練和推理規(guī)?;瘧?yīng)用;二某省市場(chǎng)被區(qū)域性分割、大量私有化集群利用率低,導(dǎo)致有限的資源未被充分利用,造成浪費(fèi)。2
.算力、算法、數(shù)據(jù)與安全挑戰(zhàn)大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告2.2
模型結(jié)構(gòu)創(chuàng)新難度大,可解釋性問(wèn)題加劇模型結(jié)構(gòu)創(chuàng)新難度大。在理論上我們?nèi)匀蝗狈?duì)于大模型為何有效以及如何最好地進(jìn)行設(shè)計(jì)的深刻理解。這導(dǎo)致了在模型結(jié)構(gòu)創(chuàng)新時(shí)不是依靠堅(jiān)實(shí)的理論基礎(chǔ),而更多地是依靠經(jīng)驗(yàn)和試錯(cuò)。由于大模型訓(xùn)練需要海量的高質(zhì)量數(shù)據(jù)和算力資源,又缺乏有效的理論指導(dǎo),試錯(cuò)成本非常高,而且花費(fèi)大量資源仍然失敗的概率并不低。大模型算法的“黑盒”特性。大模型通過(guò)學(xué)習(xí)大量數(shù)據(jù)的模式來(lái)進(jìn)行預(yù)測(cè),意味著模型的行為是數(shù)據(jù)驅(qū)動(dòng)的,而不是基于明確的因果關(guān)系或其他解的原則。即使我們從技術(shù)上知道模型是如何工作的,也很難解釋為什么模型會(huì)做出某個(gè)特定的行為。大模型通常包含數(shù)十億到萬(wàn)億級(jí)別的參數(shù),這些參數(shù)在網(wǎng)絡(luò)通過(guò)非線性變換相互作用。這種高度復(fù)雜的交互使得單個(gè)參數(shù)或?qū)訉?duì)最終輸出的影響變得極其難以追蹤,加劇了可解釋性不足的問(wèn)題。2.3
高質(zhì)量數(shù)據(jù)供給不足,成為模型訓(xùn)練新瓶頸優(yōu)質(zhì)中文語(yǔ)料供給尚顯不足。盡管中國(guó)互聯(lián)網(wǎng)用戶數(shù)量眾多,產(chǎn)生了海量數(shù)據(jù),但經(jīng)過(guò)數(shù)據(jù)篩選、清洗、結(jié)構(gòu)化且標(biāo)注良好的語(yǔ)料依然相對(duì)稀缺。我國(guó)正在大力推動(dòng)中文語(yǔ)料訓(xùn)練數(shù)據(jù)資源平臺(tái)的建設(shè),但短時(shí)間內(nèi)仍難以滿足大模型對(duì)豐富多樣訓(xùn)練數(shù)據(jù)的海量需求。在能提升模型價(jià)值觀引導(dǎo)能力的語(yǔ)料、增強(qiáng)對(duì)物理世界專業(yè)性理解的科研數(shù)據(jù)和期刊論文,以及提升專業(yè)知識(shí)理解能力的領(lǐng)域知識(shí)等方面,還需持續(xù)增加訓(xùn)練數(shù)據(jù)的深度和廣度。大模型數(shù)據(jù)資源生態(tài)尚未完善。一方面,我國(guó)雖然公共數(shù)據(jù)范圍覆蓋較廣,但在開(kāi)放的范圍、數(shù)據(jù)質(zhì)量、與大模型訓(xùn)練匹配度等方面還有較大差距。另一方面,我國(guó)數(shù)據(jù)資源較為碎片化,數(shù)據(jù)集開(kāi)放程度低,企業(yè)用于訓(xùn)練的語(yǔ)料來(lái)源不清晰、權(quán)屬不明確,開(kāi)源后存在一定隱患,使得企業(yè)更傾向于自采、自用,大模型數(shù)據(jù)流通受阻。綜上,識(shí)別高質(zhì)量訓(xùn)練數(shù)據(jù),推動(dòng)高質(zhì)量數(shù)據(jù)有效供給,通過(guò)技術(shù)方案解決訓(xùn)練數(shù)據(jù)供給不足的問(wèn)題,需要各方共同研究并努力推動(dòng)。28292.4
大模型的技術(shù)特性帶來(lái)了新的安全風(fēng)險(xiǎn)2.4.1
輸入方面,訓(xùn)練數(shù)據(jù)中的不當(dāng)內(nèi)容內(nèi)化進(jìn)模型仍是主要風(fēng)險(xiǎn)大模型通過(guò)深度神經(jīng)網(wǎng)絡(luò),基于大規(guī)模真實(shí)數(shù)據(jù)進(jìn)行訓(xùn)練,形成向量化的概率分布。模型在給定條件下可能生成多種輸出,如果訓(xùn)練數(shù)據(jù)中存在不當(dāng)內(nèi)容的微弱信號(hào),模型在生成時(shí)可能會(huì)放大這些信號(hào),產(chǎn)生不當(dāng)輸出。一是數(shù)據(jù)預(yù)處理的局限性可能引入不當(dāng)內(nèi)容,由于訓(xùn)練數(shù)據(jù)量巨大,過(guò)濾算法可能無(wú)法完美識(shí)別出所有違法不良信息,很難保證訓(xùn)練數(shù)據(jù)中完全不存在不當(dāng)內(nèi)容。在訓(xùn)練階段,大模型會(huì)內(nèi)化這些知識(shí),從而在后續(xù)的生成過(guò)程中產(chǎn)生安全風(fēng)險(xiǎn)。二是模型對(duì)訓(xùn)練數(shù)據(jù)的創(chuàng)造性組合能力可能新生成或放大不當(dāng)內(nèi)容,大模型在理解上下文方面取得了顯著進(jìn)步,但在處理復(fù)雜語(yǔ)境依賴關(guān)系時(shí),仍可能錯(cuò)誤地將不同情境下的表達(dá)組合在一起,產(chǎn)生不當(dāng)內(nèi)容。三是大模型在試圖從有限訓(xùn)練數(shù)據(jù)中歸納出更廣泛的規(guī)律時(shí),可能過(guò)度簡(jiǎn)化或泛化某些概念,甚至放大訓(xùn)練數(shù)據(jù)中不當(dāng)內(nèi)容的微弱信號(hào),導(dǎo)致生成內(nèi)容時(shí)出現(xiàn)偏差。2.4.2
模型方面,“幻覺(jué)”問(wèn)題爆發(fā)帶來(lái)誤導(dǎo)用戶的風(fēng)險(xiǎn)“知識(shí)幻覺(jué)”是難以避免的技術(shù)問(wèn)題。傳統(tǒng)模型通常圍繞特定領(lǐng)域的分類、聚類、回歸等單一任務(wù)尋找最優(yōu)損失函數(shù)
(Loss
Function),形成單一的識(shí)別能力。而大模型在預(yù)訓(xùn)練階段采用無(wú)監(jiān)督學(xué)習(xí)的方式學(xué)習(xí)世界知識(shí),在后訓(xùn)練階段學(xué)習(xí)如何利用學(xué)到的大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告知識(shí)解決不同的任務(wù),這個(gè)過(guò)程是大模型通用能力形成的基礎(chǔ),使其具備了有問(wèn)必答的特質(zhì),同時(shí)也產(chǎn)生“幻覺(jué)”。具體而言,幻覺(jué)的來(lái)源主要包括四方面,一是預(yù)訓(xùn)練階段缺乏相關(guān)領(lǐng)域知識(shí)或?qū)W到了錯(cuò)誤知識(shí),二是后訓(xùn)練階段引入了問(wèn)題數(shù)據(jù)(例如包含偏見(jiàn)的數(shù)據(jù)),三是生成階段大模型超出自身知識(shí)邊界輸出結(jié)果,四是大模型生成的隨機(jī)性帶來(lái)了內(nèi)容含義的偏離?!盎糜X(jué)問(wèn)題”在高安全需求領(lǐng)域有較大影響。從風(fēng)險(xiǎn)角度來(lái)看,過(guò)于泛化的大模型會(huì)3031帶來(lái)結(jié)果不真實(shí)、偏離客觀規(guī)律和與世界事實(shí)不符等誤導(dǎo)用戶的風(fēng)險(xiǎn),這些風(fēng)險(xiǎn)在醫(yī)療、司法等領(lǐng)域應(yīng)用時(shí),更有可能演化為真實(shí)的安全問(wèn)題,大模型需要重點(diǎn)考慮其泛化性與安全性的平衡點(diǎn),并采取相應(yīng)控制措施。2.4.3應(yīng)用方面,超長(zhǎng)技術(shù)引發(fā)全新的誘導(dǎo)攻擊Transformer
架構(gòu)的自注意力機(jī)制是大模型區(qū)別于傳統(tǒng)模型并帶來(lái)智能涌現(xiàn)的基礎(chǔ),它讓大模型如同人類大腦一般理解并學(xué)習(xí)世界,同時(shí)也帶來(lái)了全新的風(fēng)險(xiǎn)。自注意力機(jī)制允在處理輸入時(shí),對(duì)不同部分之間的關(guān)系給予不同的注意力權(quán)重。這意味著用戶可以在大模型產(chǎn)品中獲得更具交互性的體驗(yàn),同時(shí)也意味著如果攻擊者能夠精心設(shè)計(jì)輸入,使得模型對(duì)某些關(guān)鍵詞或短語(yǔ)賦予過(guò)高的關(guān)注度,那么模型就可能被誤導(dǎo)去執(zhí)行特定的行為,或直接改變、忽略原有的安全機(jī)制而生成不當(dāng)?shù)妮敵?,因此產(chǎn)生了全新的誘導(dǎo)攻擊。如今超長(zhǎng)上下文技術(shù)的發(fā)展,將大模型應(yīng)用推向了一個(gè)全新的高度,但也極大加劇了這種風(fēng)險(xiǎn)。2.4.4輸出方面,生成內(nèi)容愈發(fā)逼真加劇誤用、濫用、惡意使用風(fēng)險(xiǎn)隨著大模型在多模態(tài)理解能力和原生多模態(tài)技術(shù)等方面的進(jìn)步,AIGC(人工智能生成內(nèi)容)在擬真度方面取得了顯著進(jìn)步,高度的擬真導(dǎo)致了用戶更容
AIGC
和真實(shí)內(nèi)容之間產(chǎn)生混淆,一方面增加了誤用、濫用的可能性,例如醫(yī)療咨詢場(chǎng)景中的AIGC
內(nèi)容如不清楚標(biāo)識(shí),可能被誤認(rèn)為醫(yī)生的診斷結(jié)果;另一方面加重了惡意使用的風(fēng)險(xiǎn)影響,例如
AIGC
在情景化和個(gè)性化語(yǔ)境中實(shí)施大規(guī)模、高效率的信息欺詐變得更加容易。同時(shí),大模型產(chǎn)品化的加速發(fā)展、AI
Agent
和垂直領(lǐng)域模型微調(diào)的廣泛應(yīng)用,使得大模型濫用和惡意使用的門檻被降低,并具備了規(guī)?;a(chǎn)的條件。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告1.1
資源挑戰(zhàn)3435大模型的參數(shù)規(guī)模越來(lái)越大(目前世界先進(jìn)的模型普遍擁有
100B
及以上的參數(shù)),訓(xùn)練使用的語(yǔ)料越來(lái)越多(普遍有
5T
token
以上),其訓(xùn)練過(guò)程對(duì)計(jì)算資源、存儲(chǔ)能力和網(wǎng)絡(luò)帶寬有極高的要求。以
Llama3
技術(shù)報(bào)告中披露的
405B
參數(shù)規(guī)模模型的信息為例。計(jì)算資源方面,Llama3
的訓(xùn)練需要
16000
張
H100GPU,每個(gè)服務(wù)器配有
8
個(gè)通過(guò)NVLink
連接的GPU
和
2
個(gè)CPU,且具備專門設(shè)計(jì)的全局規(guī)模訓(xùn)練調(diào)度器安排訓(xùn)練作業(yè)。存儲(chǔ)方面,使用了
7500
個(gè)配備
SSD
的服務(wù)器上的
240PB
存儲(chǔ)空間,并支持
2TB/s
的可持續(xù)吞吐量和
7TB/s
的峰值吞吐量。1.2
技術(shù)挑戰(zhàn)在過(guò)去的一年里,預(yù)訓(xùn)練技術(shù)不斷創(chuàng)新,硬件能力持續(xù)進(jìn)步,但由于參數(shù)規(guī)模和訓(xùn)練語(yǔ)料的增長(zhǎng),大模型訓(xùn)練時(shí)長(zhǎng)仍然以月為單位計(jì)算,需要海量基礎(chǔ)設(shè)施長(zhǎng)時(shí)間穩(wěn)定可靠地運(yùn)行。1
.大模型的訓(xùn)練強(qiáng)依賴大規(guī)模的基礎(chǔ)設(shè)施大模型訓(xùn)練是一項(xiàng)系統(tǒng)性工程,一是需要足夠算力支撐,對(duì)計(jì)算硬件資源有極高要求;二是需具備對(duì)大規(guī)模硬件的高效調(diào)度和通信能力,實(shí)現(xiàn)并行計(jì)算以及強(qiáng)大的系統(tǒng)監(jiān)控與穩(wěn)定性管理,確保訓(xùn)練過(guò)程順暢與資源最優(yōu)化利用。尤其是在預(yù)訓(xùn)練階段,工程能力是更為關(guān)鍵的因素。一是大模型訓(xùn)練的同步特性使得訓(xùn)練過(guò)程的故障容忍度低,單個(gè)
GPU
故障可能導(dǎo)致整個(gè)訓(xùn)練的重啟。仍然以
Llama3
技術(shù)報(bào)告為例,使用
16000
張
GPU
訓(xùn)練的復(fù)雜性和潛在故障場(chǎng)景超過(guò)了更大規(guī)模的
CPU
集群。在預(yù)訓(xùn)練的
54
天里,Llama3
經(jīng)歷了466
次作業(yè)中斷,其中
47
次是計(jì)劃內(nèi)的中斷,如固件升級(jí)或操作員啟動(dòng)的操作,如配置或數(shù)據(jù)集更新。其余
419
次是意外的中斷,其中
78%
歸因于硬件問(wèn)題,如
GPU或主機(jī)組件故障等。有時(shí)還會(huì)出現(xiàn)沒(méi)有明顯故障,但運(yùn)行緩慢的落后者,單個(gè)落后者也可以減慢數(shù)千個(gè)其他
GPU
的速度。二是訓(xùn)練過(guò)程中往往需要及時(shí)保存
checkpoint,用于恢復(fù)和調(diào)試,一個(gè)主要挑戰(zhàn)是支持在短時(shí)間內(nèi)飽和存儲(chǔ)網(wǎng)絡(luò)的高突發(fā)性
checkpoint
寫操作。網(wǎng)絡(luò)方面,以
Llama3為例,Meta
設(shè)計(jì)了一個(gè)復(fù)雜的三層網(wǎng)絡(luò)連接數(shù)千臺(tái)服務(wù)器。大型語(yǔ)言模型訓(xùn)練產(chǎn)生的網(wǎng)絡(luò)流量極大,使用傳統(tǒng)方法(如等價(jià)成本多路徑路由方法等)在所有可用網(wǎng)絡(luò)路徑上進(jìn)行負(fù)載均衡難以實(shí)現(xiàn)。除此之外,還需要解決訓(xùn)練過(guò)程中常見(jiàn)的由集合通信模式引起的瞬態(tài)擁塞和緩沖難題。三是大規(guī)模訓(xùn)練對(duì)供某著名企業(yè)絡(luò)同樣也會(huì)帶來(lái)挑戰(zhàn)。數(shù)萬(wàn)個(gè)GPU
可能同時(shí)增加或減少功耗,例如:當(dāng)所有
GPU
等待
checkpoint
或通信完成的時(shí)刻,以及整個(gè)訓(xùn)練任務(wù)的啟動(dòng)或關(guān)閉的時(shí)刻。這種情況可能導(dǎo)致數(shù)據(jù)中心的功率瞬間波動(dòng)數(shù)十兆瓦,對(duì)供某著名企業(yè)絡(luò)造成大的沖擊。隨著未來(lái)模型的持續(xù)迭代和參數(shù)規(guī)模的增長(zhǎng),這是我們面臨的一個(gè)持續(xù)挑戰(zhàn)。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告2.1
公共云為訓(xùn)練全球領(lǐng)先的大模型提供必要條件公共云具備建設(shè)萬(wàn)卡集群的工程化能力。當(dāng)前,訓(xùn)練全球領(lǐng)先水平的大模型至少需要具備萬(wàn)卡的集成能力,比如
Llama3
405B
模型的訓(xùn)練使用了
16000
張
H100。構(gòu)建萬(wàn)卡集群具有非常高的技術(shù)門檻,因?yàn)樾枰С执罅啃酒龈咚俨⑿羞\(yùn)算,通過(guò)優(yōu)化技術(shù)達(dá)到較高的運(yùn)行效率,并保持長(zhǎng)時(shí)間穩(wěn)定運(yùn)行。這并不是簡(jiǎn)單的芯片堆砌,也不僅僅是加大資金投入就可以解決的問(wèn)題。實(shí)現(xiàn)萬(wàn)卡高效協(xié)同工作,涉及
GPU
與
GPU之間、服務(wù)器與服務(wù)器之間,甚至是數(shù)據(jù)中心與數(shù)據(jù)中心之間的通信、監(jiān)控、調(diào)度、管理,其背后是高并發(fā)分布式計(jì)算、高性能網(wǎng)絡(luò)、超大規(guī)模彈性計(jì)算能力,包括芯片、操作系統(tǒng)和網(wǎng)絡(luò)等龐大的軟硬件結(jié)合的工程,這些與云計(jì)算(尤其公共云)的技術(shù)特征完全吻合。通過(guò)優(yōu)化的軟件棧和調(diào)度算法,公共云可以實(shí)現(xiàn)萬(wàn)卡集群高達(dá)
90%
的并行效率。公共云大規(guī)模計(jì)算集群具有高穩(wěn)定性。訓(xùn)練全球領(lǐng)先水平的大模型需要大規(guī)模計(jì)算集群具備高可靠性,長(zhǎng)時(shí)間穩(wěn)定運(yùn)行。公共云通過(guò)多可用區(qū)部署,確保即使某個(gè)區(qū)域發(fā)生故障,服務(wù)依然能夠在其他區(qū)域無(wú)縫切換,維持服務(wù)連續(xù)性。關(guān)鍵組件和服務(wù)采用了冗余設(shè)計(jì),確保主節(jié)點(diǎn)故障時(shí)備節(jié)點(diǎn)可以迅速接管,降低單點(diǎn)故障的風(fēng)險(xiǎn)。公共云通過(guò)實(shí)時(shí)監(jiān)控集群狀態(tài),一旦檢測(cè)到異常,立即觸發(fā)告警通知,并啟動(dòng)自動(dòng)化修復(fù)流2
.公共云是大模型發(fā)展與應(yīng)用的優(yōu)選解決方案大模型的發(fā)展與應(yīng)用所需要的條件與公共云的優(yōu)勢(shì)高度契合。公共云憑借強(qiáng)大的基建能力、高效的資源利用和較低的成本,以及完備的安全保障,為大模型的發(fā)展和應(yīng)用提供了極具競(jìng)爭(zhēng)力的解決方案。程,可以自動(dòng)檢測(cè)并替換故障節(jié)點(diǎn),無(wú)需人工干預(yù)。定期進(jìn)行自動(dòng)數(shù)據(jù)備份,并建立異地容災(zāi)機(jī)制,以防發(fā)生意外時(shí)能迅速恢復(fù)數(shù)據(jù)。通過(guò)上述措施,公共云確保大規(guī)模計(jì)算集群能夠長(zhǎng)期穩(wěn)定運(yùn)行,為用戶提供可靠的服務(wù)。這種高穩(wěn)定性不僅體現(xiàn)在日常運(yùn)營(yíng)中,也能經(jīng)受住一些極端情況的考驗(yàn),有效訓(xùn)練時(shí)間占比超過(guò)
99%。36372.2
公共云提供高效率和低成本公共云預(yù)置完備的工具提高工作效率。云計(jì)算平臺(tái)可以整合從數(shù)據(jù)預(yù)處理、模型訓(xùn)練到模型評(píng)測(cè)的全流程所需的工具,大幅度降低使用難度,提升工作效率。高效訓(xùn)練:公共云提供分布式存儲(chǔ)解決方案,可以高效存儲(chǔ)和訪問(wèn)TB
甚至PB
級(jí)別的數(shù)據(jù),解決高頻訪問(wèn)海量數(shù)據(jù)集的問(wèn)題。公共云預(yù)置的深度學(xué)習(xí)框架(如
TensorFlow、PyTorch、MXNet
等)、開(kāi)發(fā)套件,集成了高性能計(jì)算庫(kù)、分布式訓(xùn)練工具、自動(dòng)混合精度訓(xùn)練等功能,能夠顯著提升訓(xùn)練效率,縮短訓(xùn)練時(shí)間,某省市了計(jì)算資源消耗。簡(jiǎn)化部署:公共云提供了開(kāi)箱即用的模型部署服務(wù),用戶可以便捷地將完成訓(xùn)練的模型封裝成
API、容器服務(wù)或邊緣計(jì)算模塊,快速上線并對(duì)外提供服務(wù),無(wú)需從零構(gòu)建復(fù)雜的后端架構(gòu),大大減少了部署時(shí)間和人力成本。通過(guò)容器化技術(shù),確保大模型訓(xùn)練和推理環(huán)境的一致性,簡(jiǎn)化版本控制和更新過(guò)程。按照阿里云的測(cè)算,在公共云上部署模型,效率是企業(yè)自建的
2
倍及以上。公共云的資源共享帶來(lái)資源的高效使用。公共云通過(guò)資源共享機(jī)制,能夠在不同用戶和任務(wù)之間動(dòng)態(tài)分配計(jì)算資源,避免了專用硬件常見(jiàn)的閑置和浪費(fèi),降低了成本,增強(qiáng)了計(jì)算資源的靈活性和可擴(kuò)展性。資源集中管理:公共云支持大規(guī)模分布式訓(xùn)練,允輕松搭建和管理包含數(shù)百甚至數(shù)千個(gè)計(jì)算節(jié)點(diǎn)的集群。公共云能夠自動(dòng)均衡工作負(fù)載、優(yōu)化數(shù)據(jù)通信、處理節(jié)點(diǎn)故障,確保資源在大規(guī)模訓(xùn)練任務(wù)中得到充分利用。按需使用節(jié)約成本:用戶僅需為實(shí)際使用的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)資源付費(fèi),無(wú)需預(yù)先投資昂貴的硬件設(shè)備。用戶可以根據(jù)模型規(guī)模、訓(xùn)練時(shí)間窗口以及計(jì)算需求的變化,大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告2.3
公共云為大模型提供全面安全保障公共云原生的安全能力為大模型的全生命供完備的安全保障。云通過(guò)提供標(biāo)準(zhǔn)化與自動(dòng)化的基礎(chǔ)設(shè)施級(jí)防護(hù)、動(dòng)態(tài)實(shí)時(shí)防護(hù)、數(shù)據(jù)安全、內(nèi)容安全、算法安全等多重保障,顯著增強(qiáng)了大模型全生命安全性,助力企業(yè)應(yīng)對(duì)復(fù)雜的安全挑戰(zhàn),確保服務(wù)的穩(wěn)定和安全。標(biāo)準(zhǔn)化與自動(dòng)化的基礎(chǔ)設(shè)施級(jí)別安全管控。云平臺(tái)通常具備強(qiáng)大的底層安全防護(hù)能力,包括DDoS防護(hù)、入侵檢測(cè)與防御系統(tǒng)(IDS/IPS)、防火墻、密鑰管理服務(wù)等,為大模型提供全方位的安全屏障。云上安全配置、策略和工具高度標(biāo)準(zhǔn)化,能夠自動(dòng)應(yīng)用最佳安全實(shí)踐,如使用安全的鏡像構(gòu)建流程、實(shí)施最小權(quán)限原則、集成安全掃描等,降低因人為錯(cuò)誤導(dǎo)致的安全風(fēng)險(xiǎn)。DevSecOps(開(kāi)發(fā)、安全與運(yùn)維一體化)確保安全檢測(cè)與加固貫穿大模型應(yīng)用的開(kāi)發(fā)、測(cè)試、部署全過(guò)程,及時(shí)發(fā)現(xiàn)并修復(fù)潛在安全漏洞。動(dòng)態(tài)安全策略與實(shí)時(shí)防護(hù)。公共云廠商持續(xù)投資于安全研究與防護(hù)技術(shù)升級(jí),能夠快速響應(yīng)新威脅,為用戶提供及時(shí)的安全補(bǔ)丁和更新,減輕用戶的安全運(yùn)維壓力。云的技術(shù)體系支持動(dòng)態(tài)調(diào)整安全策略,可以根據(jù)大模型應(yīng)用的運(yùn)行狀態(tài)、威脅情報(bào)以及業(yè)務(wù)需求實(shí)時(shí)更新防護(hù)措施,提供細(xì)粒度的訪問(wèn)控制、網(wǎng)絡(luò)隔離和流量管理。公共云對(duì)大模型應(yīng)用的組件間通信進(jìn)行嚴(yán)格控制,防止橫向攻擊;通過(guò)服務(wù)網(wǎng)格實(shí)現(xiàn)安全策略的集中管理和分布式執(zhí)行,增強(qiáng)整體安全性。數(shù)據(jù)安全與隱私保護(hù)。對(duì)于大規(guī)模訓(xùn)練數(shù)據(jù)集,尤其是高價(jià)值的
SFT、DPO
數(shù)據(jù),公共云提供安全的數(shù)據(jù)存儲(chǔ)服務(wù),配合嚴(yán)格的訪問(wèn)控制和審計(jì)機(jī)制,防止數(shù)據(jù)的未授權(quán)訪問(wèn)。容器化技術(shù)和虛擬化技術(shù)提供了邏輯隔離,使每個(gè)大模型應(yīng)用實(shí)例在獨(dú)立的環(huán)境中運(yùn)行,有效防止推理服務(wù)階段用戶數(shù)據(jù)泄漏。公共云支持?jǐn)?shù)據(jù)的加密存儲(chǔ)、數(shù)據(jù)的加密傳輸(如
SSL/TLS)、密鑰管理和數(shù)據(jù)脫敏等技術(shù),確保大模型訓(xùn)練和推理涉及的用戶數(shù)據(jù)在存儲(chǔ)、處理和傳輸過(guò)程中的性和完整性。動(dòng)態(tài)調(diào)整資源配置,比如臨時(shí)增加
GPU實(shí)例數(shù)量以加快訓(xùn)練速度,或在非高峰時(shí)段減少資源以降低成本,實(shí)現(xiàn)資源的精準(zhǔn)匹配和高效利用。按需使用的方式避免了因過(guò)度預(yù)估需求而購(gòu)買閑置硬件導(dǎo)致的浪費(fèi),也消除了因需求增長(zhǎng)而不得不頻繁升級(jí)硬件設(shè)施的成本壓力。對(duì)于或突發(fā)性的高計(jì)算需求,如模型迭代訓(xùn)練、大規(guī)模數(shù)據(jù)預(yù)處理等,公共云能夠迅速提供所需的額外資源,完成后即可釋放,極大降低了總體成本。根據(jù)業(yè)界的統(tǒng)計(jì),從使用效率看,公共云資源使用效率一般可達(dá)
30%~40%;而私有云資源使用效率一般約為
5%~10%。3839公共云對(duì)能源利用效率高促進(jìn)可持續(xù)性發(fā)展。公共云往往投資建設(shè)高效、環(huán)保的數(shù)據(jù)中心、計(jì)算中心,采用先進(jìn)的冷卻技術(shù)、電源管理系統(tǒng)以及可再生能源供電,其能源效率遠(yuǎn)高于一般企業(yè)自建數(shù)據(jù)中心。公共云積極推行“東數(shù)西算”,在西部地區(qū)建設(shè)數(shù)據(jù)中心,發(fā)揮西部擁有豐富的土地、水力和太陽(yáng)能等清潔能源資源的優(yōu)勢(shì)。如果將豐富的電力資源用于大模型的訓(xùn)練和推理,既能夠滿足大規(guī)模
GPU
集群的電力需求,某省市了電力遠(yuǎn)距離傳輸?shù)某杀尽N鞑繑?shù)據(jù)中心的綠色化程度更高。按照全國(guó)一體化數(shù)據(jù)中心建設(shè)要求,西部地區(qū)新建數(shù)據(jù)中心的平均
PUE(電源使用效率)值不大于
1.2,低于東部地區(qū)新建數(shù)據(jù)中心的
1.25,這意味著其能效更高,對(duì)環(huán)境的影響更小。選擇使用公共云進(jìn)行大模型訓(xùn)練和部署,實(shí)質(zhì)上是在共享這些綠色基礎(chǔ)設(shè)施,從而間接降低了碳排放和能源消耗。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告3.1
算力短缺的根本原因是供應(yīng)無(wú)法滿足需求算力短缺的某省市場(chǎng)對(duì)算力的需求增速遠(yuǎn)遠(yuǎn)超過(guò)產(chǎn)能的擴(kuò)和芯片性能的提升速度。市場(chǎng)對(duì)算力的需求增速遠(yuǎn)超產(chǎn)能擴(kuò)。隨著模型參數(shù)規(guī)模的快速增長(zhǎng),以及模型開(kāi)始得到廣泛而深入的應(yīng)用,算力需求的增長(zhǎng)曲線將變得更加陡峭。2024
年第三季度,英偉達(dá)
H200
高性能芯片開(kāi)始出貨,受限于產(chǎn)能不足,交貨約為一年。根據(jù)需求和產(chǎn)能預(yù)測(cè),整個(gè)
2025
年都會(huì)持續(xù)供貨緊。從技術(shù)發(fā)展趨勢(shì)看,單個(gè)芯片性能的提升跟不上算力需求的增速。盡管單個(gè)芯片的性能在過(guò)去幾年中取得了顯著的進(jìn)步,但進(jìn)步的速度正在逐漸放緩。這主要是由于物理限制和技術(shù)瓶頸的存在,例如功耗墻、散熱問(wèn)題和制造工藝的復(fù)雜性等。這些因素都限制了單個(gè)芯片性能的進(jìn)一步提高。隨著模型參數(shù)量的持續(xù)增加和數(shù)據(jù)量的增長(zhǎng),對(duì)于計(jì)算能力的要求也在不斷提高。這意味著即使單個(gè)芯片的性能得到提升,也可能不足以滿足日益增長(zhǎng)的計(jì)算需求,需要更多的芯片協(xié)同工作以提供足夠的計(jì)算能力。全生命站式算法安全服務(wù)。云平臺(tái)作為大模型服務(wù)的核心載體,集成了先進(jìn)的安全技術(shù)和豐富的實(shí)踐經(jīng)驗(yàn),為用戶提供統(tǒng)一的、功能全面的算法安全解決方案。這些安全能力不僅針對(duì)大模型特有的復(fù)雜性和挑戰(zhàn)進(jìn)行了優(yōu)化,還能夠靈活適應(yīng)不同行業(yè)和應(yīng)用場(chǎng)景的需求,確保大模型在數(shù)據(jù)處理、訓(xùn)練、評(píng)測(cè)、部署、推理全生命內(nèi)的每一個(gè)環(huán)節(jié),都融入全面而深入的安全保障措施,確保人工智能模型既強(qiáng)大又安全可靠。3
.
公共云可有效應(yīng)對(duì)算力短缺困境算力短缺的原因表面上是外部供應(yīng)鏈發(fā)生波動(dòng),本質(zhì)是需求和產(chǎn)能的差距。公共云在大規(guī)模計(jì)算集群、有效利用稀缺資源、異構(gòu)算力協(xié)同以及分布式算力需求等方面都具有顯著優(yōu)勢(shì),是破解我國(guó)當(dāng)前算力短缺的有效路徑。4041大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告3.2
公共云最大化發(fā)揮稀缺計(jì)算資源的價(jià)值,推動(dòng)規(guī)?;瘧?yīng)用公共云可充分發(fā)揮稀缺的高端芯片的價(jià)值,延長(zhǎng)其壽命;并通過(guò)技術(shù)能力聚合大量低端芯片達(dá)到少量高端芯片的計(jì)算能力,增加高質(zhì)量算力的供應(yīng),推動(dòng)規(guī)模化的應(yīng)用。公共云可實(shí)現(xiàn)對(duì)既有高端芯片的深度“盤活”。這種設(shè)計(jì)的核心在于,通過(guò)先進(jìn)的資源調(diào)度算法和負(fù)載均衡技術(shù),能夠在不增加硬件投入的前提下,充分挖掘現(xiàn)有芯片的潛能,延長(zhǎng)其有效使用壽命,同時(shí)通過(guò)集群的并行計(jì)算能力,形成一個(gè)龐大的算力資源池。這一資源池不僅能夠提供媲美乃至超越單個(gè)高端芯片的算力輸出,還能根據(jù)實(shí)際需求動(dòng)態(tài)調(diào)整,實(shí)現(xiàn)算力的彈性伸縮,極大地提高了算力供給的靈活性和效率。公共云可通過(guò)技術(shù)能力聚合大量低端芯片達(dá)到少量高端芯片的計(jì)算能力。借助公共云操作系統(tǒng)的線性擴(kuò)展能力,可以克服單一芯片性能局限,實(shí)現(xiàn)集群計(jì)算能力的顯著提升,大幅度降低單個(gè)芯片能力不足的影響,實(shí)現(xiàn)聚集更多低端芯片達(dá)到少量高端芯片的計(jì)算能力。例如,我國(guó)的飛天操作系統(tǒng),已在
TPC-DS的國(guó)際基準(zhǔn)測(cè)試中驗(yàn)證了通過(guò)調(diào)用約
280
臺(tái)
A
品牌服務(wù)器就達(dá)到了
100
臺(tái)
B
品牌服務(wù)器的計(jì)算能力,而針對(duì)單個(gè)服務(wù)器
A
品牌的計(jì)算能力遠(yuǎn)遠(yuǎn)低于
B
品牌,與
B
品牌的計(jì)算能力相差
7
倍。3.3
公共云可協(xié)同利用多來(lái)源算力,豐富算力生態(tài)公共云憑借其在算力資源調(diào)配與優(yōu)化方面的獨(dú)特優(yōu)勢(shì),可充分利用現(xiàn)有的
CPU
資源,并支持異構(gòu)芯片協(xié)同計(jì)算,為算力基礎(chǔ)設(shè)施的升級(jí)和拓展提供了可行路徑,為構(gòu)建安全可控的算力生態(tài)提供了有益借鑒。公共云在技術(shù)上已實(shí)現(xiàn)利用
CPU
資源滿足部分大模型推理算力需求。在當(dāng)前高性能GPU
資源短缺的背景下,利用
CPU
資源實(shí)現(xiàn)大模型推理功能可在一定程度上緩解算力短缺問(wèn)題。例如,阿里云利用英特爾至強(qiáng)
5
代芯片和計(jì)算加速技術(shù),實(shí)現(xiàn)了
CPU推理算力
7
倍提升,能滿足
13B
及以下參數(shù)規(guī)模的大模型的推理服務(wù)要求,同時(shí)支持對(duì)通義千問(wèn)
72B
模型進(jìn)行驗(yàn)證,支撐文生圖、生成代碼以及創(chuàng)意輔助工具等任務(wù)。4243公共云為異構(gòu)芯片提供規(guī)模化應(yīng)用環(huán)境,促進(jìn)不同來(lái)源不同規(guī)格芯片協(xié)同應(yīng)用。公共云作為數(shù)字化轉(zhuǎn)型的關(guān)鍵路徑,正在成為算力破局的重要舞臺(tái)。公共云的操作系統(tǒng)可以通過(guò)“一云多芯”的技術(shù)路線,并不與特定供應(yīng)商的芯片綁定,而是盡可能提升兼容性,適配各種主要芯片,保障在不同情況下?lián)碛袑?duì)芯片的選擇權(quán)。這一架構(gòu)為各種規(guī)格的
GPU提供了在真實(shí)世界場(chǎng)景中大規(guī)模應(yīng)用的機(jī)會(huì),加某省市場(chǎng)成熟度和性能優(yōu)化的進(jìn)程。部分云計(jì)算廠商已經(jīng)通過(guò)軟件優(yōu)化,實(shí)現(xiàn)了對(duì)不同廠商不同規(guī)格
CPU和
GPU
的深度適配,這標(biāo)志著算力生態(tài)與云計(jì)算平臺(tái)的融合進(jìn)入了一個(gè)新的階段,不僅豐富了算力生態(tài),增強(qiáng)了競(jìng)爭(zhēng)力,也為云計(jì)算產(chǎn)業(yè)鏈的多元化和安全可控性提供了有力支撐。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告算法積累與分享:開(kāi)源生態(tài)為大模型的早期探索和快速發(fā)展提供了必要的技術(shù)基礎(chǔ)。通過(guò)分享算法、代碼和模型架構(gòu),開(kāi)發(fā)者能夠快速、全面吸收前人的成果,加速創(chuàng)新步伐。例如,Transformer
模型的開(kāi)源直接促成了后續(xù)一系列大模型的創(chuàng)新,如BERT、GPT系列等。4647框架和工具建設(shè):大模型的訓(xùn)練需要集中和調(diào)度大量算力,還需要充分發(fā)揮出硬件的能力。PyTorch
和
TensorFlow
等深度學(xué)習(xí)框架的開(kāi)源,為大模型開(kāi)發(fā)者提供了強(qiáng)有力的武器,是大模型技術(shù)進(jìn)步的重要助推力量。數(shù)據(jù)資源的匯聚:大模型訓(xùn)練依賴于海量數(shù)據(jù),而開(kāi)源生態(tài)中覆蓋了文本、圖像、音頻等多個(gè)模態(tài)的高質(zhì)量開(kāi)源數(shù)據(jù)集,為模型訓(xùn)練提供了寶貴的資源。比如,多模態(tài)大模型的訓(xùn)練往往需要數(shù)億到數(shù)十億高質(zhì)量的“圖片-
文本”對(duì),LAION-5B
這樣的開(kāi)源數(shù)據(jù)集就能夠滿足這一需求,也在全球各種多模態(tài)大模型中得到了廣泛使用。提供交流的平臺(tái):開(kāi)源社區(qū)為開(kāi)發(fā)者提供了實(shí)踐和交流的平臺(tái),通過(guò)參與開(kāi)源貢獻(xiàn)和討論,他們能夠掌握最新的技術(shù)趨勢(shì)和開(kāi)發(fā)經(jīng)驗(yàn),加速了各種問(wèn)題解決,為大模型領(lǐng)域培養(yǎng)了源源不斷的人才。1
.開(kāi)源生態(tài)對(duì)于大模型的誕生具有基礎(chǔ)性作用大模型的誕生,需要算法、算力、數(shù)據(jù)三個(gè)維度的條件成熟,以及匯聚足夠的開(kāi)發(fā)者,開(kāi)源生態(tài)在其中起到了基礎(chǔ)性作用。例如,Hugging
Face
開(kāi)源社區(qū)構(gòu)建了龐大的生態(tài)系統(tǒng),截至
2024
年
9
月,HuggingFace
上已經(jīng)收錄了超過(guò)
100
萬(wàn)個(gè)模型、數(shù)萬(wàn)個(gè)數(shù)據(jù)集,以及大量工具,吸引了全球海量開(kāi)發(fā)者匯聚其中,在全球居于領(lǐng)先地位。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告2.2
開(kāi)源生態(tài)助力提升大模型透明度與安全性開(kāi)源社區(qū)提供可訪問(wèn)性和透明度。典型的開(kāi)源社區(qū)提供類型豐富的模型,比如,截至2024
年
10
月,ModelScope
平臺(tái)上提供了超過(guò)
15000
個(gè)模型,覆蓋了計(jì)算機(jī)視覺(jué)、自然語(yǔ)言理解、語(yǔ)音識(shí)別等多個(gè)領(lǐng)域,并提供了大量的試用頁(yè)面,使得開(kāi)發(fā)者能夠輕松找到自己需要的模型并進(jìn)行體驗(yàn)。在開(kāi)源社區(qū)里,開(kāi)發(fā)者可以自由地下載模型,無(wú)需復(fù)雜的程,大大降低了探索和實(shí)驗(yàn)的門檻。模型開(kāi)源的同時(shí),可能還提供了模型相關(guān)的技術(shù)報(bào)告、示例、推理代碼等。技術(shù)報(bào)告往往會(huì)披露訓(xùn)練使用的數(shù)據(jù)、模型架構(gòu)、訓(xùn)練技巧、測(cè)試結(jié)果等,大幅度提升了模型的透明度。開(kāi)源社區(qū)提供基準(zhǔn)測(cè)試與安全評(píng)估。開(kāi)源生態(tài)中常包含一系列標(biāo)準(zhǔn)化的基準(zhǔn)測(cè)試集,用于評(píng)估模型在特定任務(wù)上的表現(xiàn)。開(kāi)發(fā)者可以利用這些工具和數(shù)據(jù)集,對(duì)模型的準(zhǔn)確性、魯棒性和泛化能力進(jìn)行客觀評(píng)估。例如,在
ModelScope
上開(kāi)源的
CValues-parison
中文大模型價(jià)值觀比較數(shù)據(jù)集包含
145k
的價(jià)值觀比較樣本,每個(gè)樣本包含(prompt、正例回復(fù)、負(fù)例回復(fù)),可以用于大模型安全、價(jià)值觀對(duì)齊等多個(gè)問(wèn)題的研究,例如,在
SFT
階段增強(qiáng)模型的安全性、訓(xùn)練或評(píng)估
reward
模型、構(gòu)造多項(xiàng)選擇題用于自動(dòng)化評(píng)估模型的安全性表現(xiàn)等。開(kāi)源社區(qū)為開(kāi)發(fā)者提供學(xué)習(xí)與交流的平臺(tái)。開(kāi)源生態(tài)提供了豐富的文檔、教程和示例代碼,包括快速入門指南、API
參考手冊(cè)、最佳實(shí)踐等內(nèi)容。這些文檔覆蓋了從模型選擇到部署的全過(guò)程,幫助開(kāi)發(fā)者學(xué)習(xí)和掌握大模型的使用方法。ModelScope
還擁有一個(gè)活躍的開(kāi)發(fā)者社區(qū),每月產(chǎn)生上萬(wàn)條活躍討論,開(kāi)發(fā)者分享他們的實(shí)踐經(jīng)驗(yàn),比如優(yōu)化模型性能、如何處理特定類型的數(shù)據(jù)等。開(kāi)發(fā)者可以從開(kāi)源社區(qū)獲取同行的見(jiàn)解、經(jīng)驗(yàn)分享和技術(shù)指導(dǎo)。開(kāi)源生態(tài)提供了大模型技術(shù)的可及性,讓開(kāi)發(fā)者充分認(rèn)識(shí)大模型的能力和安全性,通過(guò)社區(qū)協(xié)作加速了優(yōu)化迭代和應(yīng)用場(chǎng)景的拓展,極大地推動(dòng)了行業(yè)的進(jìn)步。48492.1
大模型開(kāi)源的核心意義是普惠訓(xùn)練特性導(dǎo)致大模型開(kāi)源無(wú)法分?jǐn)偝杀?。大模型?xùn)練區(qū)分為預(yù)訓(xùn)練(Pre-training)和后訓(xùn)練(Post-training)兩個(gè)階段,其中預(yù)訓(xùn)練所需要的資源、持續(xù)的時(shí)間比后訓(xùn)練多十倍到數(shù)十倍。預(yù)訓(xùn)練的特性是需要在一定時(shí)間內(nèi)聚集海量的高性能計(jì)算資源,不可分割地連續(xù)完成。軟件的開(kāi)源,往往可以通過(guò)完成概要設(shè)計(jì)后由開(kāi)源社區(qū)內(nèi)的開(kāi)發(fā)者共同進(jìn)行編碼、測(cè)試等工作,從而將軟件的開(kāi)發(fā)成本分?jǐn)偝鋈ァ4竽P偷念A(yù)訓(xùn)練不可分割的特性,使得大模型的開(kāi)源并不能像軟件開(kāi)源那樣通過(guò)“眾人拾柴火焰高”,由眾多開(kāi)發(fā)者分頭編寫代碼的方式來(lái)分?jǐn)傞_(kāi)發(fā)成本,而是只能由模型廠商獨(dú)自承擔(dān)。大模型開(kāi)源是對(duì)中小企業(yè)和個(gè)人開(kāi)發(fā)者的普惠。按某省市場(chǎng)價(jià)格評(píng)估,從
0
到
1
訓(xùn)練100B
以上參數(shù)的語(yǔ)言模型,在不考慮試錯(cuò)的前提下,單次成本(包含數(shù)據(jù)、計(jì)算資源、人力)是數(shù)百萬(wàn)到數(shù)千萬(wàn)人民幣。中小企業(yè)、個(gè)人開(kāi)發(fā)者根本無(wú)力獨(dú)自承擔(dān)。有能力的大模型廠商承擔(dān)了訓(xùn)練成本,并開(kāi)源給業(yè)界,這意味著任何組織和個(gè)人都可以低成本了解大模型、使用大模型,而且不需要投入大量資源來(lái)進(jìn)行持續(xù)的維護(hù)和升級(jí)。這個(gè)過(guò)程從經(jīng)濟(jì)利益角度講是單向的普惠。2
.開(kāi)源生態(tài)是大模型技術(shù)發(fā)展和應(yīng)用推廣的加速器大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告的參數(shù)規(guī)模模型,從可以流暢運(yùn)行在設(shè)備上的
0.5B、1.8B、4B,到高性價(jià)比的
7B、14B、32B,以及能力在行業(yè)內(nèi)一流的
72B、110B;與此同時(shí),還開(kāi)源了可執(zhí)行圖像理解任務(wù)的
Qwen-VL、可執(zhí)行聲音理解任務(wù)的
Qwen-Audio
的多模態(tài)大模型等?;谶@些開(kāi)源大模型,企業(yè)可快速低成本構(gòu)建豐富的應(yīng)用,加速大模型在千行百業(yè)的落地,包括
PC、手機(jī)、汽車、航空、天文、采礦、教育、文化、游戲等。2.4
開(kāi)源生態(tài)助力我國(guó)搶占產(chǎn)業(yè)生態(tài)制高點(diǎn)開(kāi)源生態(tài)的豐富構(gòu)成與協(xié)同效應(yīng)。開(kāi)源生態(tài)鼓勵(lì)跨組織的合作,形成一個(gè)由開(kāi)發(fā)者、研究機(jī)構(gòu)、企業(yè)和政府等多元主體組成的生態(tài)系統(tǒng)。這種合作模式打破了傳統(tǒng)行業(yè)壁壘,促進(jìn)了不同背景下的知識(shí)和技術(shù)交流。開(kāi)源生態(tài)中的協(xié)作機(jī)制加強(qiáng)了產(chǎn)業(yè)鏈上下游的緊密聯(lián)系,促進(jìn)了從基礎(chǔ)研究到商業(yè)化應(yīng)用的快速轉(zhuǎn)化。研究機(jī)構(gòu)可以將最新的研究成果貢獻(xiàn)給開(kāi)源社區(qū),企業(yè)則可以在此基礎(chǔ)上開(kāi)發(fā)產(chǎn)品和服務(wù),形成一個(gè)良性循環(huán)。在生態(tài)中,圍繞大模型誕生了一系列高水平的數(shù)據(jù)集、評(píng)測(cè)方法、工具和應(yīng)用實(shí)踐。這些資源被業(yè)界廣泛采用,逐漸成為事實(shí)上的標(biāo)準(zhǔn),提高了不同系統(tǒng)之間的互操作性。例如,利用人工智能加速癌癥藥物研發(fā)的某科技公司,借助
ModelScope
上的多個(gè)高質(zhì)量開(kāi)源模型和工具,服務(wù)多家藥企用于癌癥藥物臨床試驗(yàn),將搭建
Pipeline
進(jìn)行方案驗(yàn)證的幾個(gè)月縮短到幾個(gè)星期。開(kāi)源生態(tài)促進(jìn)我國(guó)大某省市場(chǎng)拓展與國(guó)際化。開(kāi)源生態(tài)的全球性質(zhì)幫助我某著名企業(yè)業(yè)更容某省市場(chǎng),與國(guó)際伙伴建立合作關(guān)系。通過(guò)開(kāi)源項(xiàng)目,我國(guó)的技術(shù)和產(chǎn)品獲得了全球用戶的檢驗(yàn),提升了品牌知名度,增強(qiáng)了在全球大模型產(chǎn)業(yè)的話語(yǔ)權(quán)和影響力。以阿里云的通義
Qwen
系列開(kāi)源模型為例,截止
2024
年
10
月在國(guó)際主流開(kāi)源平臺(tái)
Hugging
Face
上的總下載量超過(guò)
4000
萬(wàn),二次開(kāi)發(fā)的衍生模型數(shù)量突破7
萬(wàn),超越了
Llama
系列的衍生模型。在
2024
年
9
月底,開(kāi)源模型權(quán)威榜單
OpenLLM
Leaderboard
中,Qwen
及其衍生模型包攬了前十名。2024
年
6
月通義
Qwen22.3
開(kāi)源生態(tài)加速大模型發(fā)展和應(yīng)用5051開(kāi)源生態(tài)促進(jìn)技術(shù)路線優(yōu)化,降低試錯(cuò)成本。目前,高性能的語(yǔ)言模型單次訓(xùn)練時(shí)間持續(xù)一到兩個(gè)月,費(fèi)用達(dá)到千萬(wàn)人民幣級(jí)別。通過(guò)開(kāi)源,前沿的研究成果和技術(shù)創(chuàng)新能夠迅速傳播,社區(qū)內(nèi)的討論和實(shí)踐反饋為技術(shù)路線的選擇提供了寶貴的指引,幫助業(yè)界識(shí)別最有潛力的研究方向和應(yīng)用領(lǐng)域,避免無(wú)謂的試錯(cuò)。比如,Llama
開(kāi)源后,很多模型廠商都借鑒了其設(shè)計(jì)和訓(xùn)練的技巧,促進(jìn)了業(yè)界水平的快速提升。此外,開(kāi)源項(xiàng)目通常包含詳細(xì)的文檔、教程和示例代碼,這為開(kāi)發(fā)者提供了直接的學(xué)習(xí)資源和實(shí)踐指南,避免了重復(fù)造輪子,減少了在技術(shù)探索和應(yīng)用初期的不確定性,從而降低了整體的探索成本,也可以在一定程度上緩解我們面臨的算力短缺。開(kāi)源生態(tài)以豐富技術(shù)資源提升大模型開(kāi)發(fā)驗(yàn)證靈活性。開(kāi)源生態(tài)提供了豐富的數(shù)據(jù)集、模型和工具,開(kāi)發(fā)者可以利用這些資源快速進(jìn)行產(chǎn)品概念的驗(yàn)證,例如使用語(yǔ)言模型和
RAG
工具創(chuàng)建自動(dòng)化的客服系統(tǒng)。這種即時(shí)驗(yàn)證的能力極大地加速了從想法到實(shí)現(xiàn)的過(guò)程??杉靶院烷_(kāi)放性讓開(kāi)發(fā)者能夠根據(jù)自身需求對(duì)開(kāi)源模型進(jìn)行深度改造,比如調(diào)整模型結(jié)構(gòu)(增加注意力機(jī)制、引入更高效的編碼器等)、替換損失函數(shù)或更改訓(xùn)練策略,以適應(yīng)特定任務(wù)的要求,快速完成技術(shù)驗(yàn)證。開(kāi)源生態(tài)以多樣化模型能力加速賦能千行百業(yè)。開(kāi)發(fā)者可以根據(jù)不同應(yīng)用場(chǎng)景的需求,在開(kāi)源大模型的基礎(chǔ)上進(jìn)行微調(diào)和擴(kuò)展,研發(fā)出針對(duì)特定業(yè)務(wù)場(chǎng)景的解決方案。這種廣泛的適用性刺激了創(chuàng)新活動(dòng),帶動(dòng)了基于大模型技術(shù)的新形態(tài)業(yè)務(wù)的涌現(xiàn)。同時(shí),開(kāi)源生態(tài)還能夠促進(jìn)產(chǎn)業(yè)鏈上下游企業(yè)的協(xié)同發(fā)展。部分應(yīng)用需要大模型運(yùn)行在設(shè)備上,要求模型的參數(shù)規(guī)模較小,以滿足設(shè)備端對(duì)存儲(chǔ)空間、算力的限制;部分應(yīng)用追求極致的效果,要求調(diào)用尺寸最大能力、最強(qiáng)的模型;還有很多應(yīng)用會(huì)希望在效果和成本之間折中平衡。還有越來(lái)越多的企業(yè),希望大模型不僅僅提供語(yǔ)言能力,還提供多模態(tài)能力,以構(gòu)建形態(tài)豐富的應(yīng)用。以通義千問(wèn)的開(kāi)源為例,提供了一系列不同大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告3開(kāi)源生態(tài)通過(guò)促進(jìn)社區(qū)協(xié)作、增強(qiáng)透明度,使得更多參與者能夠共同識(shí)別并解決潛在的安全問(wèn)題,提升大模型安全性,強(qiáng)化業(yè)界信任,推動(dòng)技術(shù)健康發(fā)展。3.1
開(kāi)源生態(tài)促進(jìn)多方協(xié)同安全治理開(kāi)源生態(tài)為多方共治提供必要條件。多方共治是指在一個(gè)生態(tài)系統(tǒng)中,不同角色(如政府、企業(yè)、研究機(jī)構(gòu)、開(kāi)發(fā)者社區(qū)等)共同參與治理,盡到自己的職責(zé),以實(shí)現(xiàn)生態(tài)健康發(fā)展的目標(biāo)。政府和立法機(jī)構(gòu)可以制定相關(guān)的法律法規(guī),建立有效的監(jiān)管機(jī)制,確保開(kāi)源生態(tài)的合規(guī)性。研究機(jī)構(gòu)和行業(yè)協(xié)會(huì)可以共同制定技術(shù)標(biāo)準(zhǔn)和行業(yè)規(guī)范,確保模型的安全性和隱私保護(hù)達(dá)到一定水平。開(kāi)源貢獻(xiàn)者在具備足夠能力的前提下,可以公開(kāi)其數(shù)據(jù)處理方式和安全措施,實(shí)施定期的風(fēng)險(xiǎn)評(píng)估和安全測(cè)試,確保系統(tǒng)能夠.
開(kāi)源生態(tài)提升大模型安全性、強(qiáng)化業(yè)界信任度開(kāi)源后,得到全球多個(gè)主流開(kāi)源平臺(tái)和開(kāi)源工具的兼容支持,包括
TensorRT(英偉達(dá)的加速工具)、OpenVINO(英特爾的工具套件)、Llama-Factory(META
的工具套件),以及
Fire?y、OpenBuddy、vLLM、Ollama
等眾多全球開(kāi)源平臺(tái)和工具,讓Qwen
系列開(kāi)源模型得到更廣泛更深入的應(yīng)用,已成為全球產(chǎn)業(yè)界的一個(gè)主流選擇。5253大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告3.3
開(kāi)源生態(tài)幫助建立業(yè)界對(duì)大模型技術(shù)的信任開(kāi)源大模型以其高透明度的特性建立業(yè)界信任,促進(jìn)大模型技術(shù)廣泛應(yīng)用。透明度是信任的基石,開(kāi)源大模型提供了很高的透明度。如果公眾了解到大模型背后的算法是經(jīng)過(guò)全球開(kāi)發(fā)者共同審查和改進(jìn)的,且其性能和安全性得到了獨(dú)立第三方的驗(yàn)證,會(huì)明顯增強(qiáng)對(duì)模型可靠性的信心,更愿意接受并使用這些技術(shù)。開(kāi)源模式鼓勵(lì)廣泛的社區(qū)參與,包括來(lái)自學(xué)術(shù)界、產(chǎn)業(yè)界以及非專業(yè)用戶的貢獻(xiàn),這種雙向溝通機(jī)制讓公眾感受到自己的聲音被傾聽(tīng)和重視,增加了他們對(duì)技術(shù)的信任感。這一過(guò)程強(qiáng)調(diào)了技術(shù)發(fā)展與社會(huì)價(jià)值的平衡,體現(xiàn)了科技向善的理念。隨著開(kāi)源生態(tài)的進(jìn)一步成熟和完善,我們有理由期待,大模型技術(shù)將在更加開(kāi)放、透明和包容的環(huán)境中茁壯成長(zhǎng),成為連接人與智能世界的堅(jiān)實(shí)橋梁。抵御潛在威脅。開(kāi)源社區(qū)盡到主體責(zé)任,建立管理制度,并完成用戶管理、模型
/
數(shù)據(jù)集管理、服務(wù)管理。開(kāi)發(fā)者遵守法規(guī)和社區(qū)公約,在此基礎(chǔ)上進(jìn)行學(xué)習(xí)、分享和交流。服務(wù)管理。開(kāi)發(fā)者遵守法規(guī)和社區(qū)公約,在此基礎(chǔ)上進(jìn)行學(xué)習(xí)、分享和交流。5455多方參與可及時(shí)發(fā)現(xiàn)并修正錯(cuò)誤和偏差,提升大模型安全、可靠、可信賴和可用性。集體智慧的匯聚,不僅能夠及時(shí)發(fā)現(xiàn)并修復(fù)潛在的安全隱患,還能促進(jìn)算法的持續(xù)優(yōu)化,從而顯著提高大模型的安全性。大模型的開(kāi)源往往意味著公開(kāi)模型參數(shù)、推理代碼、使用示例、技術(shù)文件等,為多方檢查提供了可能,來(lái)自全球的研究人員、開(kāi)發(fā)者甚至普通用戶都可以參與其中,共同審查模型的每一個(gè)細(xì)節(jié),查看和理解模型的工作原理、數(shù)據(jù)處理以及內(nèi)容生成流程,更容潛藏的漏洞和錯(cuò)誤。被發(fā)現(xiàn)的模型缺陷會(huì)公布在開(kāi)源社區(qū),極大地增強(qiáng)了模型的透明性。在這種機(jī)制下,一方面模型的潛在風(fēng)險(xiǎn)更容現(xiàn),另一方面模型已知的缺陷很難被隱藏。例如,通義
Qwen
系列的一個(gè)量化版本開(kāi)源后,開(kāi)發(fā)者發(fā)現(xiàn)在某些條件下模型會(huì)無(wú)限循環(huán)輸出感嘆號(hào)的缺陷,迅速在開(kāi)源社區(qū)報(bào)告了情況,模型團(tuán)隊(duì)及時(shí)修復(fù)了該缺陷。3.2
開(kāi)源生態(tài)確保模型安全評(píng)估客觀公正去中心化的評(píng)估機(jī)制,避免了單點(diǎn)決策可能帶來(lái)的偏頗,確保了評(píng)估結(jié)果的客觀性和公正性。閉源大模型基本無(wú)法獨(dú)立被第三方評(píng)估與驗(yàn)證,通常需要大模型提供方配合,提供調(diào)用接口、賬號(hào)等。閉源大模型提供方可以使用圍欄安全能力,如標(biāo)準(zhǔn)問(wèn)答、檢索增強(qiáng)、風(fēng)險(xiǎn)識(shí)別等技術(shù)手段來(lái)提升服務(wù)接口體現(xiàn)出的安全性,甚至一定程度上可以針對(duì)評(píng)估與驗(yàn)證“優(yōu)化”其結(jié)果。相對(duì)的,任何第三方機(jī)構(gòu)或個(gè)人都可以獨(dú)立對(duì)開(kāi)源生態(tài)中的大模型開(kāi)展評(píng)估與驗(yàn)證工作,不僅可以檢驗(yàn)性能指標(biāo),如準(zhǔn)確率、響應(yīng)速度等,還可以深入探究模型在不同場(chǎng)景下的表現(xiàn),以及可能存在的風(fēng)險(xiǎn)點(diǎn)??浯蠡蛘`導(dǎo)性的聲明都可能被社區(qū)迅速發(fā)現(xiàn)并糾正,多個(gè)獨(dú)立來(lái)源的驗(yàn)證有助于構(gòu)建模型的可信度。大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告在生成式人工智能時(shí)代,在保障通用安全性的前提下,訓(xùn)練數(shù)據(jù)的質(zhì)量很大程度上決定了模型能力,這也無(wú)疑凸顯了高質(zhì)量數(shù)據(jù)在大模型訓(xùn)練中不可替代的重要性。同時(shí),隨著大模型應(yīng)用的不斷拓展,人工智能賦能千行百業(yè),多方數(shù)據(jù)匯聚成為模型用數(shù)生態(tài)的特征。因此,應(yīng)從訓(xùn)練數(shù)據(jù)和應(yīng)用數(shù)據(jù)的整體視角出發(fā),構(gòu)建更匹配模型對(duì)數(shù)據(jù)利用特點(diǎn)的高質(zhì)量數(shù)據(jù)供給生態(tài)。實(shí)數(shù)據(jù)的分布,然后在該分布上進(jìn)行采樣,創(chuàng)建出新數(shù)據(jù)集,模擬真實(shí)數(shù)據(jù)中的統(tǒng)計(jì)模式和關(guān)系。它類似于數(shù)據(jù)的“替身演員”,發(fā)揮補(bǔ)充或替代真實(shí)數(shù)據(jù)的作用。在機(jī)器學(xué)習(xí)和人工智能領(lǐng)域,合成數(shù)據(jù)可以為模型提供訓(xùn)練材料,幫助它們學(xué)習(xí)、理解和預(yù)測(cè)。將合成數(shù)據(jù)應(yīng)用于大模型訓(xùn)練,可以從以下三個(gè)方面幫助解決高質(zhì)量訓(xùn)練數(shù)據(jù)供給不足的問(wèn)題。其一,預(yù)訓(xùn)練中合成數(shù)據(jù)可以提升語(yǔ)料的可用性和多樣性,滿足進(jìn)一步提高模型性能的需求。預(yù)訓(xùn)練可供大模型學(xué)習(xí)的數(shù)據(jù)類型較多,但能夠進(jìn)一步拓展大模型知識(shí)邊界、1
.合成數(shù)據(jù)是解決高質(zhì)量訓(xùn)練數(shù)據(jù)供給不足的突破口合成數(shù)據(jù)
(Synthetic
Data)
是通過(guò)算法和數(shù)學(xué)模型創(chuàng)建的新形態(tài)數(shù)據(jù)。首先建模真增強(qiáng)大模型推理和泛化等關(guān)鍵能力的數(shù)據(jù),更多偏向于提升多模態(tài)理解能力的視頻和5859圖片的媒體數(shù)據(jù),提升專業(yè)理解能力的領(lǐng)域知識(shí)。此類數(shù)據(jù)主要來(lái)自人類的創(chuàng)造、制作和經(jīng)驗(yàn)積累,其規(guī)模、類型和質(zhì)量因客觀條件的不同存在較大差異。在大模型強(qiáng)大的無(wú)監(jiān)督數(shù)據(jù)學(xué)習(xí)能力面前,大模型的數(shù)據(jù)需求快速經(jīng)歷了從量到質(zhì)的轉(zhuǎn)換,能夠被大模型直接利用、可以提升關(guān)鍵能力、讓生成內(nèi)容更符合人類習(xí)慣和要求的高質(zhì)量數(shù)據(jù),成為最為關(guān)鍵的數(shù)據(jù)類型。合成數(shù)據(jù)解決了部分類型的真實(shí)世界數(shù)據(jù)難以觀測(cè)的問(wèn)題,為此類高質(zhì)量數(shù)據(jù)供給提供了解決方案。傳統(tǒng)上看,通過(guò)生成“邊緣情況”(
如極端天氣、罕見(jiàn)?。┗蛘哒鎸?shí)世界中的“潛在隱患”(
如金融詐騙等安全風(fēng)險(xiǎn)),可以彌補(bǔ)因?yàn)闃颖痉植疾痪鈱?dǎo)致的客觀限制,提高數(shù)據(jù)分布的合理性和客觀性。在大模型時(shí)代,一是可以生成更多樣化、具有不同視角的物理世界仿真數(shù)據(jù)可用于提升針對(duì)特定場(chǎng)景的數(shù)據(jù)收集效率,彌補(bǔ)真實(shí)世界中對(duì)稀有事件觀測(cè)不足的問(wèn)題。二是將之前不能被用于訓(xùn)練的數(shù)據(jù)轉(zhuǎn)化為可用,提升模型對(duì)數(shù)據(jù)利用的可能性。例如在工業(yè)制造領(lǐng)域,利用合成數(shù)據(jù)可以把生產(chǎn)、制造等工藝流程相關(guān)的原始數(shù)據(jù),結(jié)合行業(yè)知識(shí)圖譜,轉(zhuǎn)化為可供大模型學(xué)習(xí)的工業(yè)語(yǔ)料,以緩解行業(yè)語(yǔ)料短缺的問(wèn)題。其二,合成數(shù)據(jù)改變了對(duì)齊階段數(shù)據(jù)獲取的模式。與人類標(biāo)注相比,合成數(shù)據(jù)不僅能大幅提升數(shù)據(jù)的獲取效率,甚至可以探索模型“由弱到強(qiáng)”的可擴(kuò)展監(jiān)督,有機(jī)會(huì)以人機(jī)協(xié)作的方式使人工智能具備類人的能力,打破“天花板”。首先,在對(duì)齊數(shù)據(jù)獲取效率的提升上,利用參數(shù)規(guī)模較大的模型產(chǎn)出合成數(shù)據(jù),生成指令及輸入和輸出樣本,過(guò)濾掉無(wú)效或重復(fù)信息,可以自動(dòng)化微調(diào)出性能較好的小模型,全過(guò)程幾乎不需人類干預(yù)。這解決了基于人類反饋的強(qiáng)化學(xué)習(xí)過(guò)程中人類回答標(biāo)準(zhǔn)不統(tǒng)一,因知識(shí)欠缺造成問(wèn)答準(zhǔn)確性不足,以及人類提供反饋成本較高的問(wèn)題。其次,合成數(shù)據(jù)通過(guò)自博弈
(Self-play)
探索由弱模型監(jiān)督訓(xùn)練更強(qiáng)模型
(Weak-to-Strong)
的方式,即用較弱的模型標(biāo)注數(shù)據(jù),精調(diào)出能力更強(qiáng)的模型,進(jìn)而有機(jī)會(huì)實(shí)現(xiàn)用人類標(biāo)注的數(shù)據(jù),精調(diào)出具備類人能力甚至強(qiáng)于人類的基礎(chǔ)模型。該過(guò)程一方面模擬人類消化理解復(fù)雜教材的過(guò)程,提高模型對(duì)語(yǔ)料的學(xué)習(xí)效能,使模型從有限的數(shù)據(jù)中學(xué)習(xí)到更多內(nèi)容。另一方面也需要人類的參與和監(jiān)督,科學(xué)評(píng)估合成數(shù)據(jù)的質(zhì)量并進(jìn)行篩選。此外,合成大模型技術(shù)發(fā)展及治理實(shí)踐報(bào)告數(shù)據(jù)技術(shù)還廣泛應(yīng)用于需要大規(guī)模專業(yè)知識(shí)、經(jīng)驗(yàn)和耐心的指令響應(yīng)標(biāo)注,用以彌補(bǔ)人類標(biāo)注的不足,例如多模態(tài)數(shù)據(jù)的對(duì)齊、領(lǐng)域知識(shí)問(wèn)答對(duì)提取等。其三,應(yīng)用合成數(shù)據(jù)還能進(jìn)一步提升安全性。安全是高質(zhì)量數(shù)據(jù)最核心的要素之一,合成數(shù)據(jù)不僅有助于用戶的隱私保護(hù),還能提升模型的安全性和可靠性。首先,在數(shù)據(jù)獲取上,合成數(shù)據(jù)可
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 特定活動(dòng)場(chǎng)地租賃合同協(xié)議
- 2025年上海市城市規(guī)劃設(shè)計(jì)研究院招聘高層次專業(yè)技術(shù)人員考前自測(cè)高頻考點(diǎn)模擬試題完整答案詳解
- 2025年福建省寧德市營(yíng)商環(huán)境觀察員招募3人模擬試卷及答案詳解(典優(yōu))
- 誠(chéng)實(shí)守信義務(wù)承諾書6篇
- 2025年昆侖數(shù)智科技有限責(zé)任公司招聘(15人)模擬試卷附答案詳解(考試直接用)
- 業(yè)務(wù)洽談與合同簽訂指南模板
- 2025河南鄭州大學(xué)招聘500人考前自測(cè)高頻考點(diǎn)模擬試題及答案詳解(易錯(cuò)題)
- 2025甘肅特崗教師招聘考試幾月份發(fā)布?模擬試卷及一套完整答案詳解
- 2025江西撫州市婦幼保健院編制外臨床醫(yī)師招聘7人模擬試卷及答案詳解(典優(yōu))
- 租客安全措施培訓(xùn)課件
- 2025北京市交通發(fā)展年度報(bào)告
- 工程造價(jià)軟件應(yīng)用 課件 第2章 廣聯(lián)達(dá)BIM土建計(jì)量平臺(tái)應(yīng)用
- 2025成人高等學(xué)校專升本招生統(tǒng)一考試政治試題及答案解析
- 車間頂防火改造方案(3篇)
- 新技術(shù)耳石復(fù)位申請(qǐng)書
- 2025年成人高考專升本《政治》真題及答案(網(wǎng)友回憶版)
- 髓母細(xì)胞瘤護(hù)理查房
- 急性缺血性卒中再灌注治療指南解讀
- 國(guó)防動(dòng)員課件模板
- 機(jī)電安裝工程施工重點(diǎn)難點(diǎn)及應(yīng)對(duì)措施
- 《第十三屆全國(guó)交通運(yùn)輸行業(yè)機(jī)動(dòng)車駕駛教練員職業(yè)技能大賽理論題庫(kù)(540題)》
評(píng)論
0/150
提交評(píng)論