人工智能研發(fā)運(yùn)營體系(MLOps)實(shí)踐指南(2023年)_第1頁
人工智能研發(fā)運(yùn)營體系(MLOps)實(shí)踐指南(2023年)_第2頁
人工智能研發(fā)運(yùn)營體系(MLOps)實(shí)踐指南(2023年)_第3頁
人工智能研發(fā)運(yùn)營體系(MLOps)實(shí)踐指南(2023年)_第4頁
人工智能研發(fā)運(yùn)營體系(MLOps)實(shí)踐指南(2023年)_第5頁
已閱讀5頁,還剩116頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1 1 2 3 6(一)MLOps發(fā)展過程 6 11 13 13 14 19 22 22 25 27 30 35 38 40 43 45 47 50 53 57 57 58 2 4 6 8 9 13 14 14 19 22 23 24 25 27 29 30 32 33 34 35 37 39 40 41 42 44 44 46 47 48 49 50 52 54 55 56 20 631一、MLOps概述過程中凸顯的管理問題,然后梳理MLOps概念和意義,并(一)AI生產(chǎn)過程管理問題凸顯2 ;456MLOps在國內(nèi)外得到了廣泛應(yīng)用,并在多個行業(yè)取得了實(shí)質(zhì)性(一)MLOps發(fā)展過程1.發(fā)展歷程7MachineLearning》3提出的開展持續(xù)交付(CD),并提出端到端的交付流學(xué)習(xí)技術(shù)成熟度曲線5。2021年,中國信息通信研究院牽頭開展3ContinuousDeliveryforMachineLearning,http82.發(fā)展現(xiàn)狀臺、騰訊太極機(jī)器學(xué)習(xí)平臺、九章云極DataCanvas6/Market-Repo97/mlops-case-study/#introducing-mlops-to-your-b縮短至天,將模型部署時間從小時級縮短至秒級9。高,以保證模型的穩(wěn)定性。某電信運(yùn)營商應(yīng)用MLOps型運(yùn)營階段的落地處于逐步規(guī)劃建設(shè)中。在這個漸進(jìn)式過程中,9數(shù)據(jù)來源:中國信息通信研究院行業(yè)調(diào)研訪談.MLOps實(shí)踐指南作為指導(dǎo),缺乏標(biāo)桿組織和案例作為參考,導(dǎo)致諸(一)機(jī)器學(xué)習(xí)項(xiàng)目生命周期1.需求分析與開發(fā)2.數(shù)據(jù)工程流水線3.模型實(shí)驗(yàn)流水線迭代訓(xùn)練將會停止。模型訓(xùn)練和模型評估任務(wù)可根據(jù)條件重復(fù)觸發(fā)。4.持續(xù)集成流水線5.持續(xù)部署流水線6.持續(xù)訓(xùn)練流水線7.持續(xù)監(jiān)控流水線員理師命周期過程化2.制定項(xiàng)目計(jì)劃,統(tǒng)籌把控和管理項(xiàng)目全流程的進(jìn)度、成3.管理和維護(hù)各條機(jī)器學(xué)習(xí)流水線,確保流水線的可擴(kuò)展2.跟進(jìn)數(shù)據(jù)準(zhǔn)備過程,確保數(shù)據(jù)的高質(zhì)量;3.模型開發(fā)過程中,選擇性能最佳的算法和超參數(shù),開展4.模型交付、運(yùn)營監(jiān)控過程中,配合問題定位和決策。有1.將數(shù)據(jù)科學(xué)家提供的模型轉(zhuǎn)化為模型服務(wù),開發(fā)服務(wù)代(一)數(shù)據(jù)處理對接入的源數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)增強(qiáng)等處理,括結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(例如文本、圖像、音頻等結(jié)構(gòu)化(二)模型訓(xùn)練核心步驟,訓(xùn)練過程的效率提升和訓(xùn)練結(jié)果的質(zhì)量提升,對MLOps2.資源的合理調(diào)度:訓(xùn)練任務(wù)資源調(diào)度存在明顯波峰波谷和多種資源百度智能云企業(yè)AI開發(fā)平臺提供No模、自動化建模、產(chǎn)線建模等多種建模方式,支持主流機(jī)器發(fā)框架,并能通過Docker鏡像的形式來支持其他框架和第三方內(nèi)置ERNIE等全面領(lǐng)先的NLP模型,并支持對大模型進(jìn)行訓(xùn)練加速。該平臺幫助不同建模水(三)構(gòu)建集成器學(xué)習(xí)算法工程師、工程開發(fā)人員、模型運(yùn)營人員等)的平滑協(xié)作、不同階段2.更新數(shù)據(jù)、模型衰減時觸發(fā)新的ML3.模型構(gòu)建:模型經(jīng)過離線評估后,通過集成騰訊智研CI/CD系統(tǒng)的驗(yàn)證算法相關(guān)指標(biāo)。沙箱驗(yàn)證不通過將會攔截模型線上實(shí)驗(yàn)和部署流程,沙箱驗(yàn)證通過后可經(jīng)主動觸發(fā)和批量調(diào)度將模型發(fā)布到生成環(huán)境進(jìn)行流量實(shí)驗(yàn)和放(四)模型服務(wù)2.模型調(diào)試:內(nèi)置多種模型優(yōu)化技術(shù)用于優(yōu)化模型推理性3.服務(wù)編排:通過服務(wù)組件編排,對一系列原5.發(fā)布上線:支持在線預(yù)測服務(wù)、離線預(yù)6.指標(biāo)監(jiān)控:自動監(jiān)控模型運(yùn)行狀態(tài),并在檢;;體系提供保障。實(shí)驗(yàn)原則使組織的改進(jìn)和創(chuàng)新成為日常工作的一部分。使用部署狀態(tài),所有合并到主干的代碼都可以安全地部署到生產(chǎn)環(huán)境。在源頭保障時銷毀構(gòu)建環(huán)境。整套持續(xù)集成、持續(xù)交付流程以開源工具或自主研發(fā)工具為(五)運(yùn)營監(jiān)控營監(jiān)控應(yīng)為持續(xù)訓(xùn)練提供強(qiáng)有力的支持,實(shí)現(xiàn)模型重訓(xùn)和在線更新。現(xiàn)的邏輯等問題進(jìn)行監(jiān)控。例如,邏輯加工(六)模型重訓(xùn)行監(jiān)控,當(dāng)相關(guān)指標(biāo)低于閾值時,觸發(fā)訓(xùn)練中心的訓(xùn)練任務(wù)進(jìn)行持續(xù)訓(xùn)練中心收到監(jiān)控中心發(fā)出的迭代請求后,從案件中心中獲取最新樣本集推送到測評中心,由測評中心對模型進(jìn)行性能、魯棒性、公平性、機(jī)密方位的測評,達(dá)到準(zhǔn)出條件后,產(chǎn)出測評報告,并推送到發(fā)布中心。在3.持續(xù)標(biāo)注與主動學(xué)習(xí),主要解決在沒有標(biāo)注的(七)實(shí)驗(yàn)管理是以實(shí)驗(yàn)對比找到關(guān)鍵影響因素,方便復(fù)現(xiàn)和調(diào)優(yōu);三是實(shí)現(xiàn)(八)流水線管理提供規(guī)范數(shù)據(jù),也具備并拓展了DevOps華為終端云MLOps平臺,支持以模型為中心的任務(wù)Pipeline,(九)特征管理),取與轉(zhuǎn)換能力。在面對推薦場景下的高頻特征獲特征血緣和下游影響分析能力,可配置特征計(jì)算邏輯,對特征數(shù)據(jù)進(jìn)行比對設(shè)時監(jiān)控;依據(jù)每個變量在訓(xùn)練時的分箱與上線后的分箱差異,判斷特征分布是(十)模型管理河南移動融智工場通過算法中臺對算法模型進(jìn)行統(tǒng)一管控,包括模型接2.模型視圖管理:對接入算法模型的版本信息、腳本信息、和環(huán)境信息進(jìn)為用戶提供更加精準(zhǔn)貼合需求的算法模型。目前算法中心沉淀了包括指標(biāo)異常4.模型泛型管理:將納入管理的算法模型拆解重組裝,形成和業(yè)務(wù)結(jié)合緊5.模型適配:根據(jù)多樣化的業(yè)務(wù)需求進(jìn)行算法模型、泛型推薦,使得模型統(tǒng)一管理。其中本平臺訓(xùn)練模型可來源于零代碼建模的圖像、文本、語音、視建模、自動化建模及智能產(chǎn)線建模。第三方導(dǎo)入模型支持從本地上傳或從存儲選擇,支持以模型文件或鏡像形式導(dǎo)入。其中,模型文件支持TensorFlow、5.模型加速:可在降低少量模型推理準(zhǔn)確性的情況下大幅壓縮模型復(fù)雜靈活迭代、持續(xù)監(jiān)控到退役下線的全生命周期模型管理閉環(huán)體系,打造適用于該商業(yè)銀行的完整模型生態(tài)。通過模型管理模塊注冊納管了平臺自訓(xùn)練及第三(十一)倉庫管理可視化解釋等,被管理的模型既可以是基于工作流或自動建模訓(xùn)練的模型,也(十二)模型安全完整性是為防止攻擊者通過操控訓(xùn)練數(shù)據(jù)或測試數(shù)據(jù)而引導(dǎo)模型輸模型訓(xùn)練階段和模型預(yù)測階段均采取對應(yīng)的防御措施保護(hù)數(shù)據(jù)、模型的安全,篡改數(shù)據(jù)或添加惡意數(shù)據(jù)影響模型性能。后門攻擊則通過植入觸發(fā)器影響模型過防御蒸餾、梯度正則化來修改模型結(jié)構(gòu)等。此外,攻擊者也可以通過逆向工監(jiān)控可迭代的全生命周期。其核心點(diǎn)在于全鏈路自動化執(zhí)行能力。在需求中心完成模型需求的對焦和立項(xiàng);在案件樣本中心完成樣本口徑確認(rèn)、樣本的生成發(fā)布中心對模型進(jìn)行一鍵部署,發(fā)布到生產(chǎn)環(huán)境;在預(yù)測中心提供模型推理服道的資金安全場景,二是與小程序、文本、圖片、音視頻打交道的內(nèi)容安全場多樣本的分布相似度、樣本獨(dú)立性、樣本多樣性進(jìn)行評估;二是對策略的效能個維度進(jìn)行測評(例如模型本身性能、模型穩(wěn)定性PSI、線上推理時性能(一)總結(jié)(二)展望通,與各資產(chǎn)倉庫有效銜接,與各信息系統(tǒng)高效調(diào)度,當(dāng)前諸多能化分析能力、自動化處置能力等;二是提升運(yùn)營的全面性,覆蓋11/top-10-mlops-trends-and-pre型和集成難的問題。而隨著模型越來越多、業(yè)務(wù)需求越來越復(fù)雜,MLOps平臺化需求將成為趨勢,幫助組織更體系化、更便捷、更靈新技術(shù)的落地應(yīng)用,MLOps應(yīng)持續(xù)優(yōu)化其技術(shù)架構(gòu),從低代碼或無12/sites/robtoews/2022/12/20/10-ai-predictions-for-2023/百度智能云企業(yè)AI開發(fā)平臺、華為云ModelArts、九章云極DataCanvasAPS機(jī)器學(xué)習(xí)平臺、Colossal-AIDataCanvasAPS機(jī)器學(xué)習(xí)平臺、華為云

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論