人工智能 數(shù)據(jù)標注標準總體框架_第1頁
人工智能 數(shù)據(jù)標注標準總體框架_第2頁
人工智能 數(shù)據(jù)標注標準總體框架_第3頁
人工智能 數(shù)據(jù)標注標準總體框架_第4頁
人工智能 數(shù)據(jù)標注標準總體框架_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1DB14/TXXXXX—20XX人工智能數(shù)據(jù)標注標準總體框架本標準規(guī)定了機器學習中數(shù)據(jù)標注標準的總體框架、子標準及其定義、基本原則、基本要求和內(nèi)容。本標準適用于人工智能研究、開發(fā)、應用中需要進行數(shù)據(jù)標注標準化管理的有關機構。其他行業(yè)可參照執(zhí)行。2規(guī)范性引用文件下列文件中的條款通過本標準的引用而成為本標準的條款。凡是注日期的引用文件,其隨后所有的修改單(不包括勘誤的內(nèi)容)或修訂版均不適用于本標準,然而,鼓勵根據(jù)本標準達成協(xié)議的各方研究是否可使用這些文件的最新版本。凡是不注日期的引用文件,其最新版本適用于本標準。3術語和定義下列術語和定義適用于本文件。3.1數(shù)據(jù)本標準中的數(shù)據(jù)是指數(shù)字化的語音、文字、視頻、圖像信息。3.2數(shù)據(jù)標注數(shù)據(jù)標注是指在人工智能領域,為了滿足算法研究和測試的需要,對初始數(shù)據(jù)按照一定要求進行人工處理,轉(zhuǎn)化為算法所需的機器可識別信息的工作過程。3.3數(shù)據(jù)標注任務數(shù)據(jù)標注任務是按照需方要求或者合同、約定,在特定的時間、成本、質(zhì)量要求下完成特定初始數(shù)據(jù)的標注。3.4數(shù)據(jù)標注工具數(shù)據(jù)標注工具是數(shù)據(jù)標注中具有管理、標注、質(zhì)量控制、驗收等部分功能或全部功能的軟件統(tǒng)稱。2DB14/TXXXXX—20XX3.5數(shù)據(jù)標注規(guī)則數(shù)據(jù)標注規(guī)則是數(shù)據(jù)標注中對初始數(shù)據(jù)進行人工處理時所遵循的步驟、方法、質(zhì)量控制等要求的統(tǒng)稱。3.6數(shù)據(jù)標注合格率數(shù)據(jù)標注合格率是符合標注規(guī)則要求的數(shù)據(jù)量與需要標注的數(shù)據(jù)量的比值。3.7數(shù)據(jù)標注員數(shù)據(jù)標注員是在數(shù)據(jù)標注工作中,按照事先約定的標注規(guī)則對初始數(shù)據(jù)進行加工作業(yè)的人員。3.8數(shù)據(jù)標注質(zhì)量控制員數(shù)據(jù)標注質(zhì)量控制員是在數(shù)據(jù)標注工作中,按照事先約定的標注規(guī)則從事數(shù)據(jù)審核等質(zhì)量控制工作的人員。4基本原則4.1創(chuàng)新為先,引領發(fā)展數(shù)據(jù)標注標準框架的建立要與應用創(chuàng)新、科技創(chuàng)新相結合,提升標準制定實施的科學性、技術性、前瞻性,持續(xù)支撐數(shù)據(jù)標準的規(guī)范化管理。4.2全面系統(tǒng),科學嚴謹數(shù)據(jù)標注標準框架的建立應遵循社會發(fā)展的基本規(guī)律,科學規(guī)劃數(shù)據(jù)標注的各個方面和領域,能有效指導數(shù)據(jù)標注各個標準的制定。4.3層析分明,協(xié)調(diào)一致標準框架內(nèi)容應分清層次,各子標準應相互協(xié)調(diào)。4.4注重時效,持續(xù)改進標準框架應根據(jù)數(shù)據(jù)標注行業(yè)領域標準化建設的需求進行調(diào)整完善,優(yōu)化改進。5基本要求5.1應根據(jù)數(shù)據(jù)標注發(fā)展的需求構建和修訂數(shù)據(jù)標注標準框架5.2應根據(jù)社會經(jīng)濟發(fā)展形勢和行業(yè)發(fā)展需求進行擴充和刪減。6總體結構3DB14/TXXXXX—20XX數(shù)據(jù)標注標準框架共由十一個子標準組成。子標準主要包括:數(shù)據(jù)標注一般技術要求、數(shù)據(jù)標注專項技術要求、數(shù)據(jù)標注質(zhì)量控制技術要求、數(shù)據(jù)標注成本評估模型、數(shù)據(jù)標注成果評估規(guī)范、數(shù)據(jù)標注機構組織能力成熟度模型、數(shù)據(jù)標注人員技能分級模型、數(shù)據(jù)標注項目培訓規(guī)程、數(shù)據(jù)標注通用工作規(guī)程、數(shù)據(jù)標注軟件工具要求、數(shù)據(jù)標注安全規(guī)范。數(shù)據(jù)標注標準框架總體結構見圖1。圖1:數(shù)據(jù)標注標準框架總體結構圖7子標準7.1數(shù)據(jù)標注一般技術要求數(shù)據(jù)標注一般技術要求規(guī)定了機器學習進行數(shù)據(jù)標注的基本技術,包括預處理技術和數(shù)據(jù)標注技術。7.2數(shù)據(jù)標注專項技術要求數(shù)據(jù)標注專項技術要求是指人工智能行業(yè)專項領域的數(shù)據(jù)標注技術要求,包括自動駕駛行業(yè)、醫(yī)療行業(yè)等的專項技術要求。7.3數(shù)據(jù)標注質(zhì)量控制技術要求數(shù)據(jù)標注質(zhì)量控制技術要求規(guī)定了機器學習進行數(shù)據(jù)標注在保證質(zhì)量上所采取的技術控制手段。4DB14/TXXXXX—20XX7.4數(shù)據(jù)標注成本評估模型數(shù)據(jù)標注成本評估模型規(guī)定了機器學習進行數(shù)據(jù)標注的成本評估方法和模型要素。7.5數(shù)據(jù)標注成果評估規(guī)范數(shù)據(jù)標注成果評估規(guī)范是對所有標準的驗收評估規(guī)范,用于檢驗上述標準實行后的成7.6數(shù)據(jù)標注機構組織能力成熟度模型數(shù)據(jù)標注機構組織能力成熟度模型是對數(shù)據(jù)標注企業(yè)能力的衡量模型,通過多種維度的信息收集和判斷,確定企業(yè)在標注業(yè)務承接能力上的成熟情況。7.7數(shù)據(jù)標注人員技能分級模型數(shù)據(jù)標注人員技能分級模型是對數(shù)據(jù)標注從業(yè)人員的技能分級模型,從而確定標注人員的技能范圍并做級別分級。7.8數(shù)據(jù)標注項目培訓規(guī)程數(shù)據(jù)標注項目培訓規(guī)程是指在通用的數(shù)據(jù)標注項目過程中,對標注人員的篩選、培訓、考核的步驟和流程,用以指導通用項目的培訓。7.9數(shù)據(jù)標注通用工作規(guī)程數(shù)據(jù)標注通用工作規(guī)程規(guī)定了機器學習進行數(shù)據(jù)標注的通用工作規(guī)程,包括規(guī)劃、實施、監(jiān)控與驗收。7.10數(shù)據(jù)標注軟件工具要求數(shù)據(jù)標注軟件工具要求是指與數(shù)據(jù)標注任務相匹配的軟件工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論