標(biāo)準(zhǔn)解讀
《GB/T 45288.3-2025 人工智能 大模型 第3部分:服務(wù)能力成熟度評估》是一項(xiàng)國家標(biāo)準(zhǔn),旨在為評估人工智能大模型的服務(wù)能力提供一套系統(tǒng)化的框架。該標(biāo)準(zhǔn)適用于各類基于大規(guī)模數(shù)據(jù)訓(xùn)練的人工智能模型,包括但不限于自然語言處理、計算機(jī)視覺等領(lǐng)域的大規(guī)模預(yù)訓(xùn)練模型。
標(biāo)準(zhǔn)首先定義了“服務(wù)能力”的概念,指出其不僅涵蓋模型的準(zhǔn)確性、穩(wěn)定性等技術(shù)性能指標(biāo),還包括用戶友好性、可訪問性等非技術(shù)因素。接著,提出了一個五級的能力成熟度模型,從低到高分別為初始級、基礎(chǔ)級、進(jìn)階級、高級和卓越級。每一級別都詳細(xì)描述了相應(yīng)的特征與要求,幫助企業(yè)或機(jī)構(gòu)定位自身所處階段,并明確提升方向。
對于如何進(jìn)行評估,《GB/T 45288.3-2025》提出了一套完整的流程指南,包括準(zhǔn)備階段(確定目標(biāo)、組建團(tuán)隊(duì))、實(shí)施階段(選擇方法論、收集證據(jù))以及報告階段(分析結(jié)果、編寫報告)。此外,還特別強(qiáng)調(diào)了在整個過程中應(yīng)遵循的原則,如客觀公正、持續(xù)改進(jìn)等。
在具體指標(biāo)方面,該標(biāo)準(zhǔn)列出了多個維度來衡量大模型的服務(wù)能力,比如功能完整性、響應(yīng)速度、安全性保障、隱私保護(hù)措施等。每個維度下又細(xì)分出若干子項(xiàng),確保評估過程全面而細(xì)致。同時,也鼓勵采用定量與定性相結(jié)合的方式來進(jìn)行綜合評價,以獲得更準(zhǔn)確的結(jié)果。
如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。
....
查看全部
- 現(xiàn)行
- 正在執(zhí)行有效
- 2025-01-24 頒布
- 2025-01-24 實(shí)施





文檔簡介
ICS35240
CCSL.70
中華人民共和國國家標(biāo)準(zhǔn)
GB/T452883—2025
.
人工智能大模型
第3部分服務(wù)能力成熟度評估
:
Artificialintelligence—Large-scalemodel—
Part3Servicecaabilitmaturitassessment
:pyy
2025-01-24發(fā)布2025-01-24實(shí)施
國家市場監(jiān)督管理總局發(fā)布
國家標(biāo)準(zhǔn)化管理委員會
GB/T452883—2025
.
目次
前言
…………………………Ⅲ
引言
…………………………Ⅳ
范圍
1………………………1
規(guī)范性引用文件
2…………………………1
術(shù)語和定義
3………………1
縮略語
4……………………1
概述
5………………………2
大模型服務(wù)類型
5.1……………………2
服務(wù)能力框架
5.2………………………2
評估指標(biāo)
6…………………3
大模型平臺
6.1…………………………3
大模型開發(fā)定制
6.2……………………7
大模型推理及運(yùn)營
6.3…………………9
成熟度分級規(guī)則
7…………………………11
成熟度等級
7.1…………………………11
能力要求
7.2……………12
成熟度評估方法
8…………………………13
評分方法
8.1……………13
評估域權(quán)重
8.2…………………………13
計算方法
8.3……………13
成熟度等級判定
8.4……………………14
Ⅰ
GB/T452883—2025
.
前言
本文件按照標(biāo)準(zhǔn)化工作導(dǎo)則第部分標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則的規(guī)定
GB/T1.1—2020《1:》
起草
。
本文件是人工智能大模型的第部分已經(jīng)發(fā)布了以下部分
GB/T45288《》3,GB/T45288:
第部分通用要求
———1:;
第部分評測指標(biāo)與方法
———2:;
第部分服務(wù)能力成熟度評估
———3:。
請注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識別專利的責(zé)任
。。
本文件由全國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會提出并歸口
(SAC/TC28)。
本文件起草單位中國電子技術(shù)標(biāo)準(zhǔn)化研究院華為技術(shù)有限公司浪潮云信息技術(shù)股份公司清華
:、、、
大學(xué)華為云計算技術(shù)有限公司中國科學(xué)院自動化研究所北京百度網(wǎng)訊科技有限公司深圳市騰訊計
、、、、
算機(jī)系統(tǒng)有限公司菲特天津檢測技術(shù)有限公司北京奇虎科技有限公司北京航空航天大學(xué)國能信
、()、、、
息技術(shù)有限公司麒麟合盛網(wǎng)絡(luò)技術(shù)股份有限公司上海市人工智能行業(yè)協(xié)會上海燧原科技股份有限
、、、
公司阿里云計算有限公司平頭哥上海半導(dǎo)體技術(shù)有限公司上海計算機(jī)軟件技術(shù)開發(fā)中心浙江大
、、()、、
華技術(shù)股份有限公司青島海信電子技術(shù)服務(wù)有限公司上海人工智能研究院有限公司南方電網(wǎng)人工
、、、
智能科技有限公司航天信息股份有限公司廣東電網(wǎng)有限責(zé)任公司北京大學(xué)長沙計算與數(shù)字經(jīng)濟(jì)研
、、、
究院北京大學(xué)中國科學(xué)院軟件研究所螞蟻科技集團(tuán)股份有限公司中國移動通信集團(tuán)有限公司
、、、、、
馬上消費(fèi)金融股份有限公司深圳云天勵飛技術(shù)股份有限公司深圳思謀信息科技有限公司北京格靈
、、、
深瞳信息技術(shù)股份有限公司中國南方電網(wǎng)有限責(zé)任公司超高壓輸電公司北京軟件產(chǎn)品質(zhì)量檢測檢驗(yàn)
、、
中心有限公司中國電力科學(xué)研究院有限公司上海文鰩信息科技有限公司浪潮軟件科技有限公司
、、、、
浪潮電子信息產(chǎn)業(yè)股份有限公司浪潮軟件集團(tuán)有限公司中電科大數(shù)據(jù)研究院有限公司上海商湯智
、、、
能科技有限公司中國電信集團(tuán)有限公司科大訊飛股份有限公司中國電信股份有限公司北京研究院
、、、、
中移蘇州軟件技術(shù)有限公司中國科學(xué)院新疆理化技術(shù)研究所杭州??低晹?shù)字技術(shù)股份有限公
()、、
司上海文鰩信息科技有限公司西北工業(yè)大學(xué)云知聲智能科技股份有限公司北京工業(yè)大學(xué)北京智
、、、、、
芯微電子科技有限公司
。
本文件主要起草人徐洋馬珊珊于超王莞爾董建陶建華曹曉琦鮑薇黃現(xiàn)翠馬騁昊
:、、、、、、、、、、
鄭佳佳鄭子木朱貴波王金橋劉靜汪群博楊旭馬同森靳偉劉海濤曹彬張向征任海峰
、、、、、、、、、、、、、
劉祥龍劉艾杉張旭陳曦趙春昊蔣燕梅敬青彭駿濤張藝伯陳敏剛孔維生劉微劉常昱
、、、、、、、、、、、、、
宋海濤任正國邵彥寧劉佳寧周昊楊超孟令中孫曦金鏑李寬王志芳呂江波胡全一王寧
、、、、、、、、、、、、、、
王志剛孔昊莫文昊仲凱韜王珂琛劉璐張?zhí)炝厥Y慧劉敬謙劉威辰高建清孟建舒玨淋
、、、、、、、、、、、、、
商興宇李旭東楊雅婷鐘凱倫仲凱韜張濤梁家恩劉崢鄭哲武姍姍
、、、、、、、、、。
Ⅲ
GB/T452883—2025
.
引言
大模型已成為人工智能發(fā)展的重要技術(shù)手段在引領(lǐng)產(chǎn)業(yè)變革中發(fā)揮重要作用國內(nèi)外人工智能相
,,
關(guān)機(jī)構(gòu)相繼研究開發(fā)百余種大模型產(chǎn)品和評測榜單導(dǎo)致用戶難以有效評價人工智能產(chǎn)品的技術(shù)水平
,
和服務(wù)能力旨在規(guī)定通用大模型的技術(shù)要求評測指標(biāo)和服務(wù)能力擬由五個部分
。GB/T45288、,
構(gòu)成
。
第部分通用要求目的在于確立大模型的參考架構(gòu)規(guī)定通用技術(shù)要求
———1:。,。
第部分評測指標(biāo)與方法目的在于確立大模型的評測指標(biāo)描述評測方法
———2:。,。
第部分服務(wù)能力成熟度評估目的在于給出大模型服務(wù)能力成熟度等級及評估方法
———3:。。
第部分計算機(jī)視覺大模型目的在于定義計算機(jī)視覺大模型的概念和功能規(guī)定技術(shù)要求
———4:。,
和測試方法
。
第部分多模態(tài)大模型目的在于定義多模態(tài)大模型的概念和功能規(guī)定技術(shù)要求和測試
———5:。,
方法
。
Ⅳ
GB/T452883—2025
.
人工智能大模型
第3部分服務(wù)能力成熟度評估
:
1范圍
本文件給出了大模型服務(wù)能力框架和評估指標(biāo)描述了大模型服務(wù)能力成熟度等級劃分及評估
,
方法
。
本文件適用于服務(wù)提供方和需求方對大模型平臺模型定制及推理運(yùn)營服務(wù)的能力進(jìn)行全面評估
、,
也適用于指導(dǎo)大模型服務(wù)能力的規(guī)劃設(shè)計和實(shí)現(xiàn)
、。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款其中注日期的引用文
。,
件僅該日期對應(yīng)的版本適用于本文件不注日期的引用文件其最新版本包括所有的修改單適用于
,;,()
本文件
。
信息技術(shù)人工智能平臺計算資源規(guī)范
溫馨提示
- 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
- 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打印),因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
- 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。
最新文檔
- 商丘工學(xué)院《建筑安裝工程加工安裝草圖課程設(shè)計》2024-2025學(xué)年第一學(xué)期期末試卷
- 7篇2025年第六屆全國國家版圖應(yīng)知應(yīng)會知識競賽(中小學(xué)組)題庫及答案
- 貴州電子科技職業(yè)學(xué)院《體育志愿者服務(wù)與管理》2024-2025學(xué)年第一學(xué)期期末試卷
- 日照航海工程職業(yè)學(xué)院《數(shù)據(jù)挖掘I》2024-2025學(xué)年第一學(xué)期期末試卷
- 晉城職業(yè)技術(shù)學(xué)院《數(shù)學(xué)軟件選講》2024-2025學(xué)年第一學(xué)期期末試卷
- 血透的病人管理制度
- 機(jī)關(guān)宿舍管理制度
- 2025年健康管理師之健康管理師三級自我檢測試卷B卷附答案
- 廣場舞面試題目及答案
- 宣傳基礎(chǔ)知識培訓(xùn)課件
- 供應(yīng)商準(zhǔn)入管理制度及流程
- 一級建造師法律教學(xué)課件
- excel培訓(xùn)課件制作
- 2025至2030中國酶載體樹脂行業(yè)發(fā)展模式及前景規(guī)劃研究報告
- 物流園區(qū)安全管理制度
- (2025)事業(yè)單位考試(面試)試題附答案
- 生物信息學(xué)基礎(chǔ)知識與應(yīng)用考試題及答案2025年
- 2025年國際檔案日知識競賽試題庫300題(含答案)
- 特斯拉MODEL X用戶手冊
- 江蘇南通2025年公開招聘農(nóng)村(村務(wù))工作者筆試題帶答案分析
- 2025-2030中國太陽能電池板清潔系統(tǒng)行業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
評論
0/150
提交評論