T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標(biāo)注技術(shù)要求 第2部分:紋樣標(biāo)注_第1頁
T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標(biāo)注技術(shù)要求 第2部分:紋樣標(biāo)注_第2頁
T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標(biāo)注技術(shù)要求 第2部分:紋樣標(biāo)注_第3頁
T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標(biāo)注技術(shù)要求 第2部分:紋樣標(biāo)注_第4頁
T-CPRA 200.2-2024 文化資源數(shù)據(jù)與數(shù)字內(nèi)容標(biāo)注技術(shù)要求 第2部分:紋樣標(biāo)注_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ICS35.240.01CCSL70T/CPRA200.2—2024文化資源數(shù)據(jù)與數(shù)字內(nèi)容標(biāo)注技術(shù)要求第2部分:紋樣標(biāo)注TechnicalrequirementsforculturalresourcesdataanddigitalcontentannotationPart2:Patternannotation中國公共關(guān)系協(xié)會(huì)文化大數(shù)據(jù)產(chǎn)業(yè)委員會(huì)發(fā)布I 2規(guī)范性引用文件 3術(shù)語和定義 3.1文化元素 3.2文化數(shù)字內(nèi)容 3.3文化資源數(shù)據(jù) 3.4紋樣 3.5標(biāo)注 3.6紋樣標(biāo)注 4紋樣分類 5紋樣標(biāo)注流程 6標(biāo)注預(yù)處理 46.1預(yù)處理輸入數(shù)據(jù)要求 46.2預(yù)處理方法 47紋樣數(shù)據(jù)標(biāo)注 47.1紋樣數(shù)據(jù)標(biāo)注算法要求 7.2紋樣數(shù)據(jù)標(biāo)注功能要求 8標(biāo)注結(jié)果評(píng)價(jià) 8.1紋樣標(biāo)注結(jié)果質(zhì)量要求 8.2主觀評(píng)價(jià)方法 8.3客觀評(píng)價(jià)方法 本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專利的責(zé)任。本文件由中國公共關(guān)系協(xié)會(huì)文化大數(shù)據(jù)產(chǎn)業(yè)委員會(huì)提出并歸口。本文件起草單位:北京郵電大學(xué)、北京玖揚(yáng)科技有限公司、伏羲云(北京)文化科技有限公本文件主要起草人:徐坤、高凱、趙海英、薛曉鵬、侯小剛、尹暉、周月、徐鵬舉、王梓舟、于振明、崔義娜、陳磊、劉志軍、李媛媛。1文化資源數(shù)據(jù)與數(shù)字內(nèi)容標(biāo)注技術(shù)要求第2部分:紋樣標(biāo)注本文件規(guī)定了國家文化大數(shù)據(jù)體系中文化資源數(shù)據(jù)與數(shù)字內(nèi)容紋樣標(biāo)注的技術(shù)要求,包括紋樣分類、紋樣標(biāo)注流程、標(biāo)注預(yù)處理、紋樣數(shù)據(jù)標(biāo)注和標(biāo)注結(jié)果評(píng)價(jià)等技術(shù)要求。本文件適用于國家文化大數(shù)據(jù)體系中文化資源數(shù)據(jù)與數(shù)字內(nèi)容紋樣標(biāo)注工具的設(shè)計(jì)和研發(fā)。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T1.1—2020標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則T/CPRA1—2021國家文化大數(shù)據(jù)標(biāo)準(zhǔn)體系T/CPRA300—2023文化數(shù)字內(nèi)容分類與代碼T/CPRA301—2023文化資源數(shù)據(jù)分類與代碼3術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1文化元素culturalelement是組成文化的最小功能單元,具有獨(dú)特的文化內(nèi)涵,例如,一只茶杯、一張弓、一個(gè)動(dòng)作和一個(gè)符號(hào)等都是文化元素。由于最小功能單元的確定是相對(duì)的,故文化元素亦有可組合性、多樣性、不確定性等特征。在國家文化大數(shù)據(jù)體系下,文化元素特指文化資源數(shù)據(jù)和文化數(shù)字內(nèi)容等的最小數(shù)字化功能單元,體現(xiàn)了數(shù)字文化作品中組成內(nèi)容的獨(dú)特性,一般采用技法將文字、線稿、色彩、形態(tài)、聲音等文化要素進(jìn)行組合的方式存在,且意蘊(yùn)深遠(yuǎn),具有極強(qiáng)的符號(hào)性特征,它們不僅是傳統(tǒng)文化的象征,也是文化精神的凝聚。文化元素不僅能體現(xiàn)文化本體價(jià)值,更能展現(xiàn)文化元素發(fā)展演化規(guī)律。通過對(duì)文化數(shù)據(jù)重構(gòu),可提取這些凝結(jié)在文化中共性的、具有很強(qiáng)識(shí)別性的、能引起目標(biāo)群體感知和想象的視覺符號(hào)。各種文化元素之間經(jīng)過關(guān)聯(lián)、標(biāo)注、重構(gòu)等加工,可進(jìn)一步提升文化元素價(jià)值。[來源:T/CPRA3100.1—2022定義3.1.1]3.2文化數(shù)字內(nèi)容culturaldigitalcontent以數(shù)字形式存在的文化產(chǎn)品,一般以文字、圖片、音頻、視頻、多媒體和其他形式表現(xiàn)。通常包括傳統(tǒng)文化產(chǎn)品的數(shù)字化以及以數(shù)字形式存在的文化產(chǎn)品。國家文化大數(shù)據(jù)體系下文化數(shù)字2內(nèi)容主要涵蓋中華優(yōu)秀傳統(tǒng)文化、革命文化和社會(huì)主義先進(jìn)文化等。文化數(shù)字內(nèi)容作為數(shù)字化文化生產(chǎn)線的產(chǎn)出,由文化大數(shù)據(jù)服務(wù)平臺(tái)管理與分發(fā),并通過文化體驗(yàn)設(shè)施和設(shè)備消費(fèi)。通常情況下,文化數(shù)字內(nèi)容又稱為文化數(shù)字產(chǎn)品、文化數(shù)字內(nèi)容產(chǎn)品等。[來源:T/CPRA300—2023定義3.1.1]3.3文化資源數(shù)據(jù)culturalresourcesdata對(duì)人類文化中傳承下來并可以傳播利用的文化(包括物質(zhì)的和非物質(zhì)的)進(jìn)行數(shù)字化采集后,所得到的用于識(shí)別和展現(xiàn)文化的圖像、文字、聲音、動(dòng)畫、影片、三維全景、三維模型等數(shù)據(jù)。國家文化大數(shù)據(jù)體系下文化資源數(shù)據(jù)主要包括中國文化遺產(chǎn)標(biāo)本庫、中華民族文化基因庫、中華文化素材庫中的數(shù)據(jù)。[來源:T/CPRA301—2023定義3.1.1]3.4紋樣pattern紋樣是文化元素的子類,指主要被用作服飾、建筑、器皿等物體的裝飾,并具有語義、寓意、歷史發(fā)展軌跡、地域特點(diǎn)、民族特色的花紋、形狀等。[來源:T/CPRA3101.1—2022定義3.1.4]3.5標(biāo)注annotation對(duì)不同文化元素、文化要素標(biāo)示注記,不僅僅包括紋樣、色彩、構(gòu)型、風(fēng)格的標(biāo)注,還包括深層次的語義信息的打標(biāo)。在國家文化大數(shù)據(jù)標(biāo)準(zhǔn)體系中,標(biāo)注將實(shí)現(xiàn)數(shù)據(jù)底層的工作,并與采集、關(guān)聯(lián)、解構(gòu)、重構(gòu)等關(guān)鍵技術(shù)共同服務(wù)于上層應(yīng)用。3.6紋樣標(biāo)注patternannotation是對(duì)文化元素中的紋樣元素、紋樣要素或紋樣基因進(jìn)行標(biāo)注的過程。結(jié)合現(xiàn)代科技,克服手動(dòng)標(biāo)注的弊端,實(shí)現(xiàn)紋樣標(biāo)簽的自動(dòng)標(biāo)注,不僅僅實(shí)現(xiàn)對(duì)紋樣本身的標(biāo)注,也要對(duì)其語義等信息進(jìn)行打標(biāo)。4紋樣分類紋樣分類如下表所示:表1紋樣分類表序號(hào)類名描述1動(dòng)物紋是一種以各種動(dòng)物形象為基礎(chǔ),經(jīng)過藝術(shù)加工和變形而形成的裝飾性紋樣,常被運(yùn)用在陶瓷、織物、雕刻等傳統(tǒng)藝術(shù)形式中,反映了人們對(duì)動(dòng)物的觀察與想象,以及對(duì)美好生活的向往和寄托。2人物紋以人物的形象和活動(dòng)為主題,運(yùn)用細(xì)膩且傳神的線條刻畫人物的姿態(tài)、神情與動(dòng)作。33幾何紋幾何紋樣是一種以點(diǎn)、線、面等幾何元素為基本構(gòu)成單位,通過有規(guī)律或富有創(chuàng)意的組合、排列、變化而形成的裝飾性圖案。4植物紋是一種以各類植物的形態(tài)、花朵、枝葉等為創(chuàng)作素材,經(jīng)過藝術(shù)提煉和設(shè)計(jì),展現(xiàn)出植物的自然美與象征意義,廣泛用于傳統(tǒng)裝飾藝術(shù)彰顯生機(jī)與美好的紋樣。5敘事紋是一種以敘述故事、情節(jié)或事件為主要內(nèi)容,通過生動(dòng)的圖案和形象組合展現(xiàn)完整敘事過程,常傳遞特定文化內(nèi)涵和價(jià)值觀念,常見于傳統(tǒng)裝飾藝術(shù)承載歷史與文化記憶的紋樣。6是一種取材于自然界中的各種元素,如山石、水流、日月星辰、風(fēng)云雷電等,經(jīng)過藝術(shù)加工和構(gòu)思,展現(xiàn)大自然的神奇與魅力,常出現(xiàn)在傳統(tǒng)裝飾藝術(shù)中體現(xiàn)對(duì)自然敬畏與熱愛的紋樣。7器物紋是一種以各類傳統(tǒng)器物的形態(tài)和特征為靈感來源,經(jīng)過藝術(shù)加工和變形,展現(xiàn)獨(dú)特美感和文化內(nèi)涵,廣泛應(yīng)用于傳統(tǒng)裝飾藝術(shù)領(lǐng)域的紋樣。5紋樣標(biāo)注流程如圖1所示,紋樣標(biāo)注流程包括標(biāo)注預(yù)處理、紋樣數(shù)據(jù)標(biāo)注、標(biāo)注結(jié)果評(píng)價(jià)3個(gè)環(huán)節(jié)。各環(huán)節(jié)具體要求及相互關(guān)系如下:圖1紋樣標(biāo)注流程a)標(biāo)注預(yù)處理:該環(huán)節(jié)針對(duì)輸入圖像使用數(shù)字化、幾何變換、歸一化、平滑、復(fù)原、增強(qiáng)等方法,消除圖像中無關(guān)的信息,恢復(fù)有用的真實(shí)信息,增強(qiáng)有關(guān)信息的可檢測性,最大限度地簡化數(shù)據(jù),增強(qiáng)標(biāo)注的可靠性。b)數(shù)據(jù)標(biāo)注:對(duì)處理后的數(shù)據(jù),選擇適當(dāng)?shù)臉?biāo)注方法進(jìn)行標(biāo)注,輸出帶有標(biāo)注信息的紋樣c)紋樣標(biāo)注結(jié)果評(píng)價(jià):對(duì)已標(biāo)注的紋樣圖像結(jié)果,采用主觀評(píng)價(jià)、客觀評(píng)價(jià)方法對(duì)其質(zhì)量4進(jìn)行定性、定量分析,根據(jù)評(píng)價(jià)結(jié)果優(yōu)化標(biāo)注方法。6標(biāo)注預(yù)處理6.1預(yù)處理輸入數(shù)據(jù)要求輸入紋樣圖像數(shù)據(jù)應(yīng)滿足以下要求:a)宜使用TIF、JPG或PNG格式圖片;b)圖像分辨率應(yīng)大于256*256;c)應(yīng)使用RGB色彩模式存儲(chǔ)的數(shù)據(jù);d)應(yīng)大于8位或16位色彩存儲(chǔ);e)圖像應(yīng)完整記錄紋樣完整面貌、造型、結(jié)構(gòu);f)圖像清晰,色彩均衡,文化元素透視無畸變;g)應(yīng)具備基本的元數(shù)據(jù);h)應(yīng)保持原紋樣的完整性。6.2預(yù)處理方法6.2.1二維圖像噪聲去除二維圖像噪聲去除的主要功能包括:a)分析二維圖像噪聲源并進(jìn)行噪聲去除;b)支持各種類型圖像的噪聲去除,并且盡可能不對(duì)原始圖像內(nèi)容做改變;c)去除噪聲后二維圖像可以還原成原圖像。6.2.2二維圖像光照平衡二維圖像光照平衡應(yīng)符合以下技術(shù)要求:a)支持各種類型圖像的縮放,并且盡可能不對(duì)原始圖像內(nèi)容做改變;b)盡可能從原圖中消除光照不均勻的影響;c)光照均衡后的圖像能夠滿足各類測評(píng)指標(biāo)。6.2.3預(yù)處理結(jié)果數(shù)據(jù)要求預(yù)處理結(jié)果應(yīng)符合以下技術(shù)要求:a)光照平衡,宜采用能自適應(yīng)多種類別圖像的算法進(jìn)行處理;b)圖像清晰,宜采用圖像自適應(yīng)超分算法進(jìn)行預(yù)處理;c)信噪比SNR>20;d)峰值信噪比PSNR>30;e)均方誤差MSE<400。7紋樣數(shù)據(jù)標(biāo)注57.1紋樣數(shù)據(jù)標(biāo)注算法要求紋樣數(shù)據(jù)標(biāo)注算法具體應(yīng)符合以下技術(shù)要求:a)宜準(zhǔn)確地對(duì)每一個(gè)圖像紋樣元素名稱進(jìn)行標(biāo)注;b)宜進(jìn)一步對(duì)紋樣的文本特征(如紋樣周圍文本內(nèi)容)以及深層次的語義信息(如寓意)等進(jìn)行標(biāo)注;c)對(duì)于需要定位區(qū)域的標(biāo)注方法,定位區(qū)域應(yīng)在合理的位置,標(biāo)注內(nèi)容無冗余、無重疊;d)對(duì)于手工標(biāo)注數(shù)據(jù),專業(yè)人士標(biāo)注每張圖像所需時(shí)間應(yīng)≤5min;e)對(duì)于自動(dòng)標(biāo)注數(shù)據(jù),每張圖像所需時(shí)間應(yīng)≤100ms;f)對(duì)于不屬于原始數(shù)據(jù)集類別的紋樣種類或者非紋樣數(shù)據(jù),宜給出相應(yīng)的提示信息;g)標(biāo)注詞應(yīng)不少于5個(gè);h)標(biāo)注類別應(yīng)不少于3類;i)對(duì)于訓(xùn)練數(shù)據(jù)集不足的情況,宜采用數(shù)據(jù)增強(qiáng)的方法。7.2紋樣數(shù)據(jù)標(biāo)注功能要求紋樣數(shù)據(jù)標(biāo)注工具應(yīng)符合以下功能要求:a)標(biāo)注應(yīng)具有可視化界面;b)應(yīng)支持自動(dòng)標(biāo)注、半自動(dòng)標(biāo)注,宜對(duì)標(biāo)注結(jié)果進(jìn)行人工評(píng)判,并且能對(duì)自動(dòng)標(biāo)注結(jié)果與人工參與部分進(jìn)行區(qū)分;c)宜具有數(shù)據(jù)統(tǒng)計(jì)功能,支持對(duì)未標(biāo)注和已標(biāo)注數(shù)據(jù)的統(tǒng)計(jì)結(jié)果進(jìn)行圖表顯示,包括柱狀圖顯示、餅圖顯示等;d)標(biāo)注工具宜具有日志記錄功能;e)應(yīng)具備安全功能,譬如加密存儲(chǔ)數(shù)據(jù)、對(duì)用戶標(biāo)識(shí)并進(jìn)行相應(yīng)的訪問控制。8標(biāo)注結(jié)果評(píng)價(jià)8.1紋樣標(biāo)注結(jié)果質(zhì)量要求紋樣標(biāo)注后的結(jié)果應(yīng)滿足以下要求:a)紋樣標(biāo)注的內(nèi)容應(yīng)與實(shí)際內(nèi)容相一致;b)同一個(gè)算法對(duì)同一張紋樣圖像執(zhí)行相同操作之后得到的結(jié)果應(yīng)一致;c)圖像若發(fā)生變化,輸出的結(jié)果應(yīng)與未變化時(shí)保持一致。圖像內(nèi)容發(fā)生實(shí)質(zhì)變化的情況除d)對(duì)于單標(biāo)簽圖像的紋樣標(biāo)注,準(zhǔn)確率(Accuracy)應(yīng)>=90%;e)對(duì)于多標(biāo)簽圖像的紋樣標(biāo)注,平均準(zhǔn)確率(AveragePrecision)應(yīng)>=75%。8.2主觀評(píng)價(jià)方法以人的主觀感知來評(píng)價(jià)二維圖像標(biāo)注結(jié)果,宜采用以下指標(biāo):a)內(nèi)容準(zhǔn)確性:以人的主觀判斷來感知紋樣標(biāo)注內(nèi)容正確與否,為簡單起見,僅關(guān)注所標(biāo)注紋樣的名稱是否正確;6b)方法穩(wěn)定性:同一張紋樣圖像經(jīng)過同一種標(biāo)注方法前后兩次所得到的結(jié)果應(yīng)一致,不能出現(xiàn)兩次標(biāo)注結(jié)果不同的情況。譬如文件名稱發(fā)生變化等,輸出的結(jié)果不應(yīng)發(fā)生變化。紋樣圖像發(fā)生實(shí)質(zhì)性變化(如某個(gè)紋樣被剔除、增加了某種紋樣等)的情況除外;c)交互體驗(yàn)性:用戶的體驗(yàn)對(duì)于系統(tǒng)的設(shè)計(jì)和開發(fā)至關(guān)重要,一個(gè)紋樣標(biāo)注系統(tǒng)除了依托標(biāo)注算法實(shí)現(xiàn)最基本的功能以外,必須考慮用戶在使用過程中的體驗(yàn)感受。以紋樣數(shù)據(jù)標(biāo)注算法和標(biāo)注功能要求為主,考察系統(tǒng)的交互體驗(yàn)性,進(jìn)行分級(jí)量化打分;d)系統(tǒng)持久性:經(jīng)過標(biāo)注算法標(biāo)注的紋樣數(shù)據(jù)應(yīng)持久化的保存,標(biāo)注之后的結(jié)果應(yīng)契合持久化的需求。持久化模塊可作為標(biāo)注系統(tǒng)的重要組成部分,在主觀評(píng)價(jià)中可作為加分項(xiàng)。主觀評(píng)價(jià)方法采用人工打分表的方式,對(duì)一幅圖像標(biāo)注的結(jié)果進(jìn)行打分,打分后,首先依據(jù)表2計(jì)算加權(quán)值,去掉最低分和最高分,最后按照平均值排序(權(quán)重根據(jù)標(biāo)注需求取值0-1之間)。表2紋樣標(biāo)注效果指標(biāo)表描述詞內(nèi)容準(zhǔn)確性30方法穩(wěn)定性30交互體驗(yàn)性20系統(tǒng)持久性208.3客觀評(píng)價(jià)方法客觀評(píng)估使用數(shù)學(xué)模型給出紋樣標(biāo)注質(zhì)量的量化值??陀^評(píng)價(jià)作為評(píng)判標(biāo)注模型性能的主要工具,其中很多指標(biāo)并非人眼能夠直接的觀察得到,在這里通過量化指標(biāo)來計(jì)算出算法的優(yōu)劣,并作為反饋,用于進(jìn)一步優(yōu)化算法模型。對(duì)于單標(biāo)簽的紋樣標(biāo)注,宜采用準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1分?jǐn)?shù)(F1score)等作為評(píng)價(jià)方法;對(duì)于多標(biāo)簽的紋樣標(biāo)注,采用基于樣本的排序指標(biāo):平均精度(AveragePrecision)、1-錯(cuò)誤率(One-Error)、覆蓋率(Coverage)、排序損失(Ranki等作為評(píng)價(jià)方法。具體指標(biāo)計(jì)算要求如下:a)準(zhǔn)確率(Accuracy):正確分類的樣本個(gè)數(shù)占總樣本個(gè)數(shù),值越大越好。TP+TNTP+FN+FP+TNAccuracyTP+FN+FP+TN其中,TP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論