GPU資源管理平臺(tái)需求說明_第1頁
GPU資源管理平臺(tái)需求說明_第2頁
GPU資源管理平臺(tái)需求說明_第3頁
GPU資源管理平臺(tái)需求說明_第4頁
GPU資源管理平臺(tái)需求說明_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

GPU資源管理平臺(tái)需求說明指標(biāo)項(xiàng)指標(biāo)要求基礎(chǔ)配置1臺(tái)2U2路機(jī)架式服務(wù)器,含導(dǎo)軌電源線;CPU:1顆英特爾至強(qiáng)銀牌(2.0GHz/12-Core)CPU;內(nèi)存:2*32GB;硬盤:2*480GBSSD硬盤(RAID1);RAID卡:支持RAID0/1/10;網(wǎng)卡:2*GE電口,2*10GE光口(含光模塊);電源:冗余電源模塊;總體要求端到端AI平臺(tái)能力:平臺(tái)支持一站式端到端AI開發(fā)訓(xùn)練部署功能,包含數(shù)據(jù)管理、數(shù)據(jù)標(biāo)注、算法開發(fā)、模型管理、模型訓(xùn)練、模型部署等全流程功能;多數(shù)據(jù)類型支持支持本地新建數(shù)據(jù)集和導(dǎo)入數(shù)據(jù)集;支持圖片、視頻、文本、音頻、自定義等多種數(shù)據(jù)類型;大數(shù)據(jù)集后臺(tái)上傳○支持遠(yuǎn)程服務(wù)器共享路徑下的數(shù)據(jù)集大批量后臺(tái)靜默上,提供官方證明材料或Web頁面;預(yù)置數(shù)據(jù)集預(yù)置圖像分類、目標(biāo)檢測(cè)、目標(biāo)跟蹤、文本分類等多種類型數(shù)據(jù)集;數(shù)據(jù)標(biāo)注○支持手動(dòng)標(biāo)注和自動(dòng)標(biāo)注;支持圖像分類、目標(biāo)檢測(cè)、目標(biāo)跟蹤、語義分割,文本分類、中文分詞、音頻分類等多種標(biāo)注類型;使用自動(dòng)標(biāo)注可以快速完成數(shù)據(jù)標(biāo)注,為開發(fā)者節(jié)省70%以上的標(biāo)注時(shí)間,提供官方證明材料或Web頁面;數(shù)據(jù)增強(qiáng)提供了圖像層面的增強(qiáng)方法,基于原始數(shù)據(jù)集單張圖片進(jìn)行轉(zhuǎn)換操作,從而達(dá)成對(duì)數(shù)據(jù)集的擴(kuò)充效果;對(duì)接AI業(yè)務(wù)支持?jǐn)?shù)據(jù)集、算法、模型、鏡像從文件管理中導(dǎo)入導(dǎo)出;Notebook開發(fā)環(huán)境提供Notebook是一種交互式編程環(huán)境,用戶可以對(duì)Notebook實(shí)現(xiàn)創(chuàng)建、打開、停止、啟動(dòng)、刪除等操作;算法開發(fā)完成之后,還可以將其保存到「算法管理」的「我的算法」中,從而可以進(jìn)行后續(xù)的訓(xùn)練工作;內(nèi)置算法支持管理員內(nèi)置算法;算法創(chuàng)建支持上傳算法或Fork已有算法;算法管理對(duì)算法可進(jìn)行在線編輯、創(chuàng)建訓(xùn)練任務(wù)、下載、fork、刪除等操作;多種主流深度學(xué)習(xí)框架支持TensorFlow,Pytorch,MindSpore,PaddlePaddlle,Keras,Caffe等深度學(xué)習(xí)框架;分布式訓(xùn)練加速框架○支持DeepSpeed、AscendSpeed、Megatron-LM分布式訓(xùn)練框架,提供官方證明材料或Web頁面;多算力統(tǒng)一調(diào)度○支持X86CPU、NVIDIAGPU、NVIDIAMIG、華為昇騰NPU卡、vNPU,提供官方證明材料或Web頁面;任務(wù)模板支持通過模板創(chuàng)建訓(xùn)練任務(wù),支持編輯、刪除任務(wù)模板;支持將訓(xùn)練任務(wù)保存為模板;大模型訓(xùn)練○支持Mindformers大模型訓(xùn)練(X86/ARM+NPU),提供官方證明材料或Web頁面;大模型微調(diào)○支持LoRA/P-Turning微調(diào),支持Llama-Factory和MindFormers(X86/ARM+NPU、X86+GPU),提供官方證明材料或Web頁面;訓(xùn)練可視化支持TensorFlow和PyTorch框架下的可視化的TensorBorad應(yīng)用,可用于深度學(xué)習(xí)網(wǎng)絡(luò)模型訓(xùn)練查看模型結(jié)構(gòu)和訓(xùn)練效果;模型版本管理可對(duì)模型版本進(jìn)行下載、部署、轉(zhuǎn)預(yù)置、刪除等操作;推理服務(wù)支持在線推理部署服務(wù),包括在線服務(wù)和批量服務(wù),支持TensorFlow,PyTorch多種深度學(xué)習(xí)框架,支持大模型推理部署,支持自定義配置推理服務(wù)路徑和端口;節(jié)點(diǎn)類型○支持X86/armCPU、NVIDIAGPU、NVIDIAMIG、華為昇騰NPU卡、vNPU節(jié)點(diǎn)推理,提供官方證明材料或Web頁面;灰度發(fā)布○支持灰度發(fā)布,支持不同發(fā)布版本分流配置,提供官方證明材料或Web頁面;在線服務(wù)預(yù)測(cè)支持上傳圖片文件進(jìn)行在線預(yù)測(cè),支持預(yù)測(cè)JPG、JPEG、PNG、BMP格式的文件;節(jié)點(diǎn)類型○支持X86CPU、NVIDIAGPU、NVIDIAMIG、華為昇騰NPU卡、vNPU節(jié)點(diǎn)推理,提供官方證明材料或Web頁面;批量服務(wù)管理支持對(duì)圖片數(shù)據(jù)進(jìn)行批量推理;支持對(duì)批量服務(wù)任務(wù)進(jìn)行編輯、Fork、啟動(dòng)、停止、刪除、結(jié)果下載等操作;大模型推理支持部署大模型,對(duì)外提供推理服務(wù);支持公共鏡像支持對(duì)管理員對(duì)公共鏡像進(jìn)行上傳、刪除等操作,支持更改Notebook默認(rèn)鏡像,鏡像打包下載;鏡像管理內(nèi)置鏡像倉(cāng)庫(kù);支持鏡像創(chuàng)建、修改、刪除、查看,支持編輯鏡像描述和鏡像用途等信息,支持鏡像搜索;分布式訓(xùn)練鏡像預(yù)置○提供DeepSpeed、AscendSpeed、Megatron-LM等分布式訓(xùn)練加速框架可預(yù)置,提供官方證明材料或Web頁面;回收站支持算法文件、數(shù)據(jù)集、模型文件回收站管理;支持增強(qiáng)型調(diào)度器○支持Gang調(diào)度、binpack調(diào)度、Priority調(diào)度、Proportion調(diào)度等多種高階調(diào)度策略;支持調(diào)度隊(duì)列,支持不同任務(wù)優(yōu)先級(jí)設(shè)置,優(yōu)先級(jí)高的優(yōu)先調(diào)度資源;支持作業(yè)調(diào)度的節(jié)點(diǎn)親和性設(shè)置;支持調(diào)度器用于訓(xùn)練和推理作業(yè);以上提供官方證明材料或Web頁面;資源組管理○支持對(duì)納管的AI服務(wù)器劃分不同的資源組(節(jié)點(diǎn)組),支持用戶下發(fā)訓(xùn)練、推理、notebook作業(yè)可以選擇不同的節(jié)點(diǎn)組,支持租戶和節(jié)點(diǎn)組綁定實(shí)現(xiàn)節(jié)點(diǎn)組共享或獨(dú)享,提供官方證明材料或Web頁面;節(jié)點(diǎn)監(jiān)控支持查看節(jié)點(diǎn)狀態(tài)、CPU、內(nèi)存、GPU、NPU、MIG、vNPU總數(shù)和使用量;Pod監(jiān)控支持查看具體的每個(gè)POD的狀態(tài)和cpu、內(nèi)存、gpu、NPU、MIG占用情況;告警通知支持郵件、短信、釘釘和企業(yè)微信通知;告警管理支持告警搜索顯示,支持告警屏蔽、清除;內(nèi)存故障預(yù)測(cè)○服務(wù)器的內(nèi)存故障預(yù)測(cè)與自愈的統(tǒng)計(jì)和記錄,當(dāng)服務(wù)器發(fā)生內(nèi)存故障自愈時(shí),可通過WEBUI查詢到自愈結(jié)果;硬盤故障預(yù)測(cè)○支持查看系統(tǒng)管理的所有HDD/SSD硬盤的健康狀況、硬盤風(fēng)險(xiǎn)預(yù)測(cè)圖表以及硬盤風(fēng)險(xiǎn)和硬盤統(tǒng)計(jì)的詳細(xì)信息,以便更好地了解硬盤狀態(tài);加速卡大屏支持GPU大屏和NPU大屏;熱圖支持GPU使用率、內(nèi)存使用率、GPU使用率等指標(biāo)熱圖顯示;運(yùn)行日志支持在線查看搜索節(jié)點(diǎn)日志、AI平臺(tái)日志信息;資產(chǎn)管理統(tǒng)計(jì)設(shè)備資產(chǎn)、部件資產(chǎn)明細(xì)及變更記錄,部件信息包括硬盤、內(nèi)存、主板、CPU、電源、網(wǎng)卡、RAID卡等部件的詳細(xì)信息,包括類型、廠商、型號(hào)、序列號(hào)、關(guān)聯(lián)服務(wù)器等;能效管理支持服務(wù)器功耗、溫度統(tǒng)計(jì);負(fù)載優(yōu)化分析:統(tǒng)計(jì)出長(zhǎng)期低載服務(wù)器信息,并可以對(duì)低載服務(wù)器進(jìn)行批量操作;溫度風(fēng)險(xiǎn)分析:統(tǒng)計(jì)入風(fēng)口溫度過高的服務(wù)器信息,并可以對(duì)服務(wù)器進(jìn)行下電操作;租戶隔離租戶之間權(quán)限隔離、角色隔離、租戶之間資源和數(shù)據(jù)隔離、系統(tǒng)用戶和租戶數(shù)據(jù)和功能隔離;多種加速卡統(tǒng)一管理○支持GPU和NPU統(tǒng)一納管,支持一個(gè)系統(tǒng)統(tǒng)一管理GPU多個(gè)型號(hào)卡和NPU多個(gè)型號(hào)卡,支持作業(yè)選擇指定的GPU或NPU卡型號(hào),提供官方證明材料或Web頁面;集群支持X86和arm節(jié)點(diǎn)○支持X86管理節(jié)點(diǎn)統(tǒng)一管理X86和arm計(jì)算節(jié)點(diǎn),支持arm管理節(jié)點(diǎn)管理arm計(jì)算節(jié)點(diǎn),支持Ubuntu20.04.5、Ubuntu22.04.3、國(guó)產(chǎn)操作系統(tǒng)FusionOS23.0.1,提供官方證明材料或Web頁面;支持監(jiān)控、調(diào)度組件化○支持性能監(jiān)控組件、多算力調(diào)度組件可獨(dú)立被客戶AI平臺(tái)集成,包括增強(qiáng)資源調(diào)度器、exporter、device-plugin等,提供官方證明材料或Web頁面;加固軟件基本要求○10個(gè)Linux/WindowsServer客戶端防病毒功能授權(quán);至少支持WindowsXP、Windows7、Windows8、Windows10/11等32位/64位操作系統(tǒng),同時(shí)并支持Windows2003、Windows2008、Windows2012等32位/64位服務(wù)器操作系統(tǒng)及主流Linux系統(tǒng);輕量級(jí)部署○客戶端安裝后至多占用50M硬盤資源,日常內(nèi)存占用不到20M,有效節(jié)省PC/Server資源;加固軟件系統(tǒng)設(shè)計(jì)要求產(chǎn)品兼容主流國(guó)產(chǎn)系統(tǒng),至少支持中標(biāo)麒麟、銀河麒麟、中科方德等;○信息安全設(shè)備、系統(tǒng)軟件的開發(fā)、生產(chǎn)符合TL9000-HSV標(biāo)準(zhǔn);加固軟件管理控制支持遠(yuǎn)程控制,通過管理中心實(shí)現(xiàn)對(duì)客戶端的遠(yuǎn)程運(yùn)維;支持對(duì)全網(wǎng)進(jìn)行集中的管理和任務(wù)下發(fā),可以通過控制臺(tái)立即給客戶端發(fā)送命令,包括立即殺毒、立即升級(jí)、關(guān)機(jī)、重啟、顯示消息等,而不需要通過建立策略方式實(shí)現(xiàn),從而簡(jiǎn)化和方便了管理員的管理;管理控制臺(tái)支持通知客戶端立即升級(jí)、強(qiáng)制更新、客戶端主動(dòng)升級(jí)等更新方式;○支持對(duì)移動(dòng)存儲(chǔ)設(shè)備采用標(biāo)簽式注冊(cè)管理,可以區(qū)分內(nèi)外部介質(zhì)使用,定義禁用、啟用只讀、啟用(只讀_運(yùn)行)和啟用讀寫、啟用(讀寫_運(yùn)行)五種操作,按照文件類型審計(jì)在移動(dòng)存儲(chǔ)介質(zhì)上文件操作記錄,并可設(shè)置例外USB設(shè)備;支持客戶端未開機(jī)的全網(wǎng)查殺策略設(shè)置,在客戶端下次啟動(dòng)時(shí)策略補(bǔ)做功能;○支持定制安全防護(hù)策略:包括病毒防御(病毒查殺、文件實(shí)時(shí)監(jiān)控、惡意行為監(jiān)控、U盤保護(hù)、下載保護(hù)、郵件監(jiān)控);系統(tǒng)防御(瀏覽器保護(hù)、軟件安裝攔截、系統(tǒng)加固);網(wǎng)絡(luò)防御(黑客入侵?jǐn)r截、IP協(xié)議控制、惡意網(wǎng)站攔截、IP黑名單);文檔安全(文檔檢測(cè)、文檔跟蹤、USB存儲(chǔ));系統(tǒng)監(jiān)控(設(shè)備監(jiān)控、進(jìn)程監(jiān)控、軟件監(jiān)控、服務(wù)監(jiān)控、賬號(hào)監(jiān)控、外聯(lián)監(jiān)控);其他設(shè)置(心跳配置、管理員配置、升級(jí)配置、白名單、補(bǔ)丁配置、彈窗配置);支持分級(jí)管理及多管理員權(quán)限劃分,如:超級(jí)管理員,操作管理員;同時(shí)管理控制臺(tái)支持自定義管理員權(quán)限設(shè)定;為保證產(chǎn)品功能穩(wěn)定性,要求產(chǎn)品研發(fā)廠商通過軟件成熟度CS-CMMI5認(rèn)證;管理控制臺(tái)支持對(duì)客戶端的系統(tǒng)操作行為進(jìn)行記錄功能,便于管理員對(duì)用戶操作審查和分析;支持客戶端威脅日志信息上報(bào)統(tǒng)計(jì)功能,包含終端危險(xiǎn)排行統(tǒng)計(jì)、防御類型分布統(tǒng)計(jì)、病毒類型分布統(tǒng)計(jì)、病毒排行統(tǒng)計(jì)等,支持圖表顯示;報(bào)表應(yīng)該可以通過表格以及圖形方式進(jìn)行展現(xiàn),支持將生成的報(bào)表以Excel、word、HTML、PDF等通用格式輸出;○支持文檔檢測(cè)功能,針對(duì)終端存儲(chǔ)的word、pdf、ppt、Excel、rtf、txt等文檔的名稱、內(nèi)容進(jìn)行包含關(guān)鍵字檢查,對(duì)含有指定關(guān)鍵字的文檔進(jìn)行禁止發(fā)送、禁止拷貝等管控,消息提醒的同時(shí)將文檔違規(guī)信息上報(bào)管理平臺(tái);○支持文檔跟蹤策略,可按照不同文件、壓縮包類型跟蹤文檔內(nèi)到外、外到內(nèi)、外到外、內(nèi)到內(nèi)等流轉(zhuǎn)方向,并可跟蹤文檔包括拷貝、壓縮、解壓縮、修改、刪除、重命名、移動(dòng)等操作;○要求對(duì)流行病毒的檢測(cè)能力必須超過98%的檢出率,小于0.1%的誤報(bào)率;加固軟件客戶端防護(hù)至少支持對(duì)終端電腦內(nèi)部文件進(jìn)行全盤掃描、快速掃描,自定義掃描三種掃描能力;并具備空閑查殺、異步查殺、斷點(diǎn)查殺、后臺(tái)查殺等功能;支持掃描和清除各種廣告軟件、惡意插件、隱蔽軟件、黑客工具、風(fēng)險(xiǎn)程序等等;○對(duì)系統(tǒng)關(guān)鍵位置進(jìn)行防護(hù),阻止無文本攻擊、流氓、廣告程序?qū)ο到y(tǒng)的惡意篡改等行為;從系統(tǒng)文件保護(hù)、病毒免疫、進(jìn)程保護(hù)、注冊(cè)表保護(hù)、危險(xiǎn)動(dòng)作攔截、執(zhí)行防護(hù)等多個(gè)維度對(duì)系統(tǒng)進(jìn)行防護(hù);支持病毒自動(dòng)隔離功能,對(duì)于暫時(shí)無法清除的被感染文件或者可疑文件,防病毒軟件的客戶端能自動(dòng)將其隔離到本地隔離區(qū);○設(shè)置誘餌文件并實(shí)時(shí)監(jiān)控,當(dāng)勒索病毒對(duì)該文件進(jìn)行加密操作時(shí)進(jìn)行攔截;支持注冊(cè)表病毒、內(nèi)存或服務(wù)類病毒的查殺,提高終端安全防護(hù)等級(jí),對(duì)已經(jīng)運(yùn)行的病毒進(jìn)程可以執(zhí)行關(guān)閉;○支持對(duì)webshell后門進(jìn)行掃描檢測(cè),webshell后門庫(kù)數(shù)量大于1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論