




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
I美國數(shù)字檔案長期安全保存的經(jīng)驗(yàn)及啟示分析概述目錄TOC\o"1-3"\h\u28333美國數(shù)字檔案長期安全保存的經(jīng)驗(yàn)及啟示分析概述 1146081.1美國OAIS參考模型 1121091.1.1OAIS的出臺背景 129651.1.2OAIS的模型介紹 2154111.1.3OAIS對數(shù)字檔案長期保存的價(jià)值 647741.2美國電子文件檔案館項(xiàng)目 7277341.2.1電子文件檔案館系統(tǒng)的簡介 7180091.2.2ERA2.0的系統(tǒng)架構(gòu) 7185701.2.3ERA2.0的重要成果 112551.3美國NARA保存項(xiàng)目 1229371.1.1NARA的目標(biāo)與任務(wù) 12157901.1.2NARA的檔案保存策略 13109001.1.3NARA保存策略與項(xiàng)目的優(yōu)點(diǎn) 14122891.4美國數(shù)字檔案長期安全保存啟示 14305421.4.1注重?cái)?shù)據(jù)保存標(biāo)準(zhǔn) 1499431.4.2重視系統(tǒng)技術(shù)策略 1590521.4.3關(guān)注風(fēng)險(xiǎn)評估機(jī)制 15如何保證數(shù)字檔案在長期的保存過程中的信息安全,一直以來是當(dāng)今世界范圍內(nèi)所有國家的檔案工作者及檔案科學(xué)理論研究者的重要問題和焦點(diǎn),他們已經(jīng)從理論與實(shí)踐兩個層面就所要求的數(shù)字檔案信息安全問題進(jìn)行了許多具有歷史性和現(xiàn)實(shí)意義的深入研究和探索。縱觀當(dāng)今世界范圍內(nèi)各國在此領(lǐng)域的研究和實(shí)踐,以美國為主要代表的發(fā)達(dá)國家已經(jīng)對數(shù)字檔案信息長期保存安全問題進(jìn)行了長期的探索,并積累了豐富的知識和經(jīng)驗(yàn),在不同的程度上,都給予了足夠的重視,有力地維護(hù)了數(shù)字檔案的信息安全。這些成功經(jīng)歷對我國開展數(shù)字檔案長期安全保存工作至關(guān)重要。為此,本章比較系統(tǒng)地分析了其在數(shù)字檔案信息長期保存安全管理領(lǐng)域的典型經(jīng)驗(yàn),并據(jù)此進(jìn)行了總結(jié)和提出對于我國的影響與啟示。1.1美國OAIS參考模型1.1.1OAIS的出臺背景1995年,在國際標(biāo)準(zhǔn)化組織(ISO)的請求下,美國國家航空和航天局的空間數(shù)據(jù)系統(tǒng)咨詢委員會(ConsultativeCommitteeforSpaceDataSystems,CCSDS)開始開發(fā)的一個旨在對數(shù)字資源的存取標(biāo)準(zhǔn)和長期保存的規(guī)定概念和參考框架。CCSDS的這一工作導(dǎo)致1999年5月開放檔案信息系統(tǒng)(OpenArchivalInformationsystem,OAIS)參考模型的雛形公布,這一參考模型針對數(shù)字信息的長期保存和維護(hù)的檔案系統(tǒng)提供一個概念性的框架,描述了一個檔案系統(tǒng)存在的環(huán)境、檔案系統(tǒng)的功能組織以及支持檔案信息管理的基礎(chǔ)結(jié)構(gòu),適用于圖書館、檔案館及其它文化傳承機(jī)構(gòu)、政府部門和私有機(jī)構(gòu)。這一參考模型作為ISO的推薦草案得到了廣泛的評閱,經(jīng)過擴(kuò)充修改后的新的OAIS參考模型于2001年7月正式發(fā)布。自O(shè)AIS發(fā)布以來,很多數(shù)字檔案的研究和開發(fā)的項(xiàng)目都以O(shè)AIS作為一個優(yōu)先遵守的標(biāo)準(zhǔn)規(guī)范。在OAIS參考模型中,提供了一個完整的檔案信息保存功能,它包括信息攝入(接收)、檔案存儲、數(shù)據(jù)管理、存取和分發(fā)。OAIS同時論述了數(shù)字信息從一種媒體或格式到另一媒體或格式的移植、信息表示的數(shù)據(jù)模型、信息保存中軟件的作用、檔案系統(tǒng)之間數(shù)字信息的交換等。OAIS還確立了各項(xiàng)功能的內(nèi)部聯(lián)系和與外部的接口,以及一系列在這些接口之上的高層服務(wù)。在CCSDS和ISO的推動下,OAIS參考模型成為了數(shù)字檔案系統(tǒng)普遍遵從的標(biāo)準(zhǔn)規(guī)范,來自圖書館、檔案館、科學(xué)數(shù)據(jù)、文化傳承等領(lǐng)域的相關(guān)項(xiàng)目和系統(tǒng)都紛紛以其為準(zhǔn),進(jìn)行系統(tǒng)的規(guī)劃和設(shè)計(jì)。屠躍明,黃永文.對OAIS參考模型的研究[J].檔案學(xué)研究,2007(02):45-47.屠躍明,黃永文.對OAIS參考模型的研究[J].檔案學(xué)研究,2007(02):45-OAIS的模型介紹OAIS參考模型具體可分為:功能模型、信息模型、信息包在各功能模塊之間的轉(zhuǎn)換三部分內(nèi)容。1.OAIS功能模型OAIS系統(tǒng)包括以下6個功能模塊:(1)攝取:從信息生產(chǎn)者那里接收或收集按照一定格式組織的信息(SIP)。這些信息經(jīng)過檢驗(yàn)后建立相應(yīng)元數(shù)據(jù),元數(shù)據(jù)交給數(shù)據(jù)管理模塊,信息被轉(zhuǎn)換成長期保存規(guī)定格式組織的AIP,然后傳遞給長期存儲模塊保存。(2)長期存儲:實(shí)際存儲AIP、負(fù)責(zé)建立具體存儲與存取系統(tǒng),并在獲取功能模塊提出請求時將AIP提供給該模塊。(3)數(shù)據(jù)管理:存儲關(guān)于數(shù)字信息單元的元數(shù)據(jù)和關(guān)于長期保護(hù)處理政策、程序、技術(shù)和系統(tǒng)的元數(shù)據(jù),并提供對這些元數(shù)據(jù)的檢索與管理。(4)獲?。禾峁┯脩魴z索元數(shù)據(jù)和索取數(shù)字信息單元的界面,提供檢索機(jī)制,并將AIP轉(zhuǎn)換為適合用戶利用的發(fā)布信息(DIP),還可能承擔(dān)身份認(rèn)證和授權(quán)管理責(zé)任等。(5)管理:通過有關(guān)政策、規(guī)范、程序、工作流等來監(jiān)測和控制整個長期保存系統(tǒng)的運(yùn)行和各個模塊的運(yùn)行。(6)保存規(guī)劃:監(jiān)控OAIS環(huán)境,并為保證在技術(shù)過時等環(huán)境下OAIS系統(tǒng)仍長期可用而提供建議的服務(wù)和功能模塊。具體包括評估存檔內(nèi)容和定期建議存檔信息遷移、就存檔機(jī)構(gòu)標(biāo)準(zhǔn)和政策提出建議、監(jiān)控技術(shù)發(fā)展及用戶服務(wù)需求和知識儲備的變化、制定具體的遷移計(jì)劃、軟件原型、測試計(jì)劃以保證管理遷移目標(biāo)的實(shí)施等。除上述功能外,系統(tǒng)還提供各種各樣的通用服務(wù),如操作系統(tǒng)服務(wù)、網(wǎng)絡(luò)服務(wù)、安全服務(wù)等。OAIS參考模型中各個功能的要素、要素間的關(guān)系、功能的具體實(shí)現(xiàn)等如圖1.1所示。圖1.1OAIS的功能模型章燕華,劉霞.OAIS參考模型:數(shù)字資源長期保存的概念框架[J].浙江檔案,2007(03):38-42.章燕華,劉霞.OAIS參考模型:數(shù)字資源長期保存的概念框架[J].浙江檔案,2007(03):38-42.2.AIS信息模型(1)信息對象(InformationObject)信息對象(InformationObject):指由數(shù)據(jù)對象(DataObject)組成,通過與表征信息(RepresentationInformation)結(jié)合為用戶理解的信息。數(shù)據(jù)對象(DataObject):指實(shí)體數(shù)據(jù)(physicalobject)或者數(shù)字對象(digitalobject)。表征信息(RepresentationInformation):將數(shù)據(jù)對象以一種有意義的方式呈現(xiàn)給用戶的信息,包括對ASCII的定義、數(shù)字格式等。數(shù)據(jù)對象、表征信息、信息對象的關(guān)系如圖1.2所示:圖1.2數(shù)據(jù)對象、表征信息、信息對象的關(guān)系章燕華,劉霞.OAIS參考模型:數(shù)字資源長期保存的概念框架[J].浙江檔案,2007(03):38-42.章燕華,劉霞.OAIS參考模型:數(shù)字資源長期保存的概念框架[J].浙江檔案,2007(03):38-42.(2)信息包(InformationPackage)信息包是OAIS信息模型中的核心概念,也是功能模型中各模塊之間傳遞的基本對象。從信息包的構(gòu)成來看,它包括:內(nèi)容信息(ContentInformation):是被保存的原始信息對象。保存描述信息(PreservationDescriptionInformation,下簡稱PDI):描述內(nèi)容信息的特征并使其得以完全保存的必要信息,具體包括來源信息(ProvenanceInformation)、背景信息(ContextInformation)、參考信息(ReferenceInformation)、固化信息(FixityInformation)。打包信息(PackagingInformation):將內(nèi)容信息和保存描述信息聯(lián)系、封裝和識別的信息。內(nèi)容信息、保存描述信息通過打包信息構(gòu)成一個信息包,三者綁定成一個整體。描述信息(DescriptiveInformation)是描述信息包的特性和屬性并幫助定位和檢索用戶所需信息包的信息。它們之間的關(guān)系如圖1.3所示:圖1.3信息包之間的關(guān)系章燕華,劉霞.OAIS參考模型:數(shù)字資源長期保存的概念框架[J].浙江檔案,2007(03):38-42.章燕華,劉霞.OAIS參考模型:數(shù)字資源長期保存的概念框架[J].浙江檔案,2007(03):38-42.從信息包的種類來看,它可以分為三大類:提交信息包(SubmissionInformationPackage,簡稱SIP):由信息生產(chǎn)者提交給OAIS的信息包,它的形式和具體內(nèi)容通常由信息生產(chǎn)者和OAIS協(xié)商決定。存檔信息包(ArchivalInformationPackage,簡稱AIP):由OAIS保存的符合永久或長期保存屬性的信息包。發(fā)布信息包(DisseminationInformationPackage,簡稱DIP):OAIS基于信息用戶需求請求而傳遞給用戶,從一個或若干個AIP從提取出來的信息包。SIP又分為存檔信息單元(ArchivalInformationUnit,AIU)和存檔信息集合(ArchivalInformationCollection,AIC)兩類。SIP、AIP、DIP共同描述了信息在攝取、保存、管理、獲取整個過程中的變化過程,其中AIP是長期保存的關(guān)鍵和中心點(diǎn),使OAIS完成了保存和存取的責(zé)任。在OAIS參考模型中,對AIP及其關(guān)鍵組成和類別進(jìn)行了詳細(xì)的說明。(3)數(shù)據(jù)管理信息(DataManagementInformation):存檔機(jī)構(gòu)執(zhí)行業(yè)務(wù)所需的由數(shù)據(jù)管理模塊產(chǎn)生和儲存的信息,它包括政策信息、請求追蹤信息、安全信息、基于事件的需求信息、統(tǒng)計(jì)信息、保存過程歷史信息、信息用戶基本信息、審計(jì)信息等。1.信息包轉(zhuǎn)換這部分介紹了信息包及其相關(guān)對象如何實(shí)現(xiàn)從信息生產(chǎn)者經(jīng)由OAIS到信息用戶這個生命周期過程中在邏輯上或物理上的相互轉(zhuǎn)換。(1)信息生產(chǎn)者實(shí)體中的數(shù)據(jù)轉(zhuǎn)換:首先當(dāng)生產(chǎn)者做出將信息存儲在OAIS的決定后,他需要與檔案工作者就SIP的內(nèi)容、格式、儲存時間等問題達(dá)成提交協(xié)議。在信息生產(chǎn)者和OAIS之間,SIP定期向OAIS提交數(shù)據(jù)。盡管從物理上來說,描述對象和元數(shù)據(jù)既可以包括在數(shù)據(jù)對象中,也可以分散在許多獨(dú)立的描述對象中。但是從邏輯上來說,數(shù)據(jù)提交過程必須被看成數(shù)據(jù)內(nèi)容對象和描述對象的集合。(2)攝取功能模塊中的數(shù)據(jù)轉(zhuǎn)換:OAIS不需要保持SIP中的信息與原來完全一致,SIP在OAIS中的形式和內(nèi)容都可能發(fā)生變化。因此SIP與AIP的映射關(guān)系并不是一一對應(yīng)的。攝取過程首先將從數(shù)據(jù)接收環(huán)節(jié)得到的SIP轉(zhuǎn)換成能為長期存儲和數(shù)據(jù)管理功能模塊接收的AIP和包描述。攝取過程的復(fù)雜程度因不同的OAIS和信息生產(chǎn)者而異;其次,它將接收來的信息對象分類,判斷它們屬于現(xiàn)存的哪個集合,在AIP中作為檔案存儲時產(chǎn)生相關(guān)集合描述更新的提示信息;最后,攝取功能協(xié)調(diào)數(shù)據(jù)管理模塊與長期存儲模塊之間的更新,同時適時提供協(xié)調(diào)和錯誤恢復(fù)。(3)長期存儲和數(shù)據(jù)管理功能模塊中的數(shù)據(jù)轉(zhuǎn)換:長期存儲功能模塊將AIP轉(zhuǎn)換成長久保存的檔案信息,數(shù)據(jù)管理功能模塊接收由攝取功能模塊產(chǎn)生的包描述并且補(bǔ)充現(xiàn)存的集合描述以囊括新接收的包描述信息。在這一過程中,OAIS有責(zé)任維護(hù)軟件拷貝的可用性或者通過內(nèi)部格式的仔細(xì)記錄以保證將來數(shù)據(jù)能夠轉(zhuǎn)移到其他系統(tǒng)中而不造成信息丟失。(4)獲取功能模塊中的數(shù)據(jù)轉(zhuǎn)換:當(dāng)信息用戶者需要使用信息時,檢索工具能夠提供給用戶關(guān)于OAIS中儲存所有信息的全景,幫助用戶定位查找信息;當(dāng)用戶確認(rèn)需要查找OAIS中的信息時,用戶使用請求工具提出獲取數(shù)據(jù)請求;獲取功能模塊在數(shù)據(jù)管理模塊中記錄下用戶的請求并確認(rèn)是否能夠滿足,并且與長期存儲和數(shù)據(jù)管理模塊聯(lián)系請求AIP和相關(guān)的包描述;將AIP和相關(guān)的包描述轉(zhuǎn)換成DIP集合并且將這些DIP存儲在物理上分散的介質(zhì)上,通過數(shù)據(jù)發(fā)布過程傳遞給用戶,這一轉(zhuǎn)化過程的復(fù)雜性因OAIS和用戶的請求不同而異。章燕華,劉霞.OAIS參考模型:數(shù)字資源長期保存的概念框架[J].浙江檔案,2007(03):38-42.章燕華,劉霞.OAIS參考模型:數(shù)字資源長期保存的概念框架[J].浙江檔案,2007(03):38-OAIS對數(shù)字檔案長期保存的價(jià)值為數(shù)字信息的長期保存提供了最基本的功能描述。OAIS參考模型認(rèn)為負(fù)有長期保存數(shù)字信息職責(zé)的檔案館應(yīng)該履行最基本的六大功能:接收、數(shù)據(jù)管理、檔案存儲、存取、行政管理和保存計(jì)劃。在接收數(shù)據(jù)之前,“行政管理”要與信息生產(chǎn)者簽訂“提交協(xié)議”,規(guī)定好數(shù)據(jù)移交的內(nèi)容、移交的格式、程序和方式。這可以說是把住了信息長期保存的“源頭關(guān)”。在接收信息生產(chǎn)者移交的數(shù)據(jù)時,“接收”功能要嚴(yán)把質(zhì)量鑒定關(guān)。除鑒定移交的數(shù)據(jù)是否有媒體讀寫錯誤、是否符合規(guī)定的移交格式外,還要檢測數(shù)據(jù)的完整性及真實(shí)性。對鑒定不合格的數(shù)據(jù)要進(jìn)行修復(fù)或重新移交。對合格的數(shù)據(jù)才打包成“檔案信息包”移交給“檔案存儲”?!皺n案存儲”負(fù)責(zé)存儲“檔案信息包”,為其選擇恰當(dāng)?shù)拇鎯γ襟w,并判斷存儲級別,按級別的不同采取不同的安全保管措施。并對“檔案信息包”進(jìn)行復(fù)制且異地存儲。該功能還履行錯誤檢測及災(zāi)難恢復(fù)等職責(zé)。“保存計(jì)劃”專門負(fù)責(zé)監(jiān)控技術(shù)的變化,監(jiān)控指定用戶群的知識庫的變化及其對服務(wù)需求的變化,并制定詳細(xì)的保存策略和遷移計(jì)劃。而“行政管理”則負(fù)責(zé)具體的遷移活動。遷移的目的是為了使保存的數(shù)據(jù)不因技術(shù)的過時而無法存取利用。長期保存的最終目的是為了利用,否則將數(shù)據(jù)保存得再完好也徒勞無功。“存取”功能負(fù)責(zé)將“檔案信息包”加工成“分發(fā)信息包”而發(fā)送給用戶利用。而“數(shù)據(jù)管理”功能管理“檔案信息包”的描述信息,這些信息是為用戶查找、檢索信息服務(wù)的。李明娟.OAIS參考模型與數(shù)字信息長期保存[J].圖書情報(bào)知識,2007(05):65-69.李明娟.OAIS參考模型與數(shù)字信息長期保存[J].圖書情報(bào)知識,2007(05):65-69.1.2美國電子文件檔案館項(xiàng)目1.2.1電子文件檔案館系統(tǒng)的簡介電子文件檔案館(ElectronicRecordsArchives,ERA)是美國國家檔案與文件署(NARA)建設(shè)的專門用來接收、管理、保存和利用美國聯(lián)邦政府永久性電子文件的綜合數(shù)字檔案館系統(tǒng)。從1997年立項(xiàng)開始,經(jīng)過14年的開發(fā)和6年的運(yùn)營,ERA系統(tǒng)(ERAbasesystem,本文稱之為ERA1.0)已具備支持聯(lián)邦機(jī)關(guān)向NARA提交審核保管期限表、移交電子文件以及電子文件接收、處理、長期保存和開放利用等基本功能,擁有超200個NARA用戶和800個聯(lián)邦機(jī)關(guān)用戶,收錄超過500TB的數(shù)據(jù),是美國聯(lián)邦政府最核心的數(shù)字檔案管理系統(tǒng)。為更好地履行其法定職責(zé),2015年NARA正式啟動ERA2.0項(xiàng)目,建設(shè)新一代聯(lián)邦政府?dāng)?shù)字檔案館系統(tǒng),計(jì)劃于2018年上線核心功能模塊,并在2020年實(shí)現(xiàn)全部系統(tǒng)功能開發(fā)。目前已基本實(shí)現(xiàn)系統(tǒng)功能,取得了重大進(jìn)展。NationalArchives.AboutERA[EB/OL]./era/about.1.2.2ERA2.0的系統(tǒng)架構(gòu)1.功能架構(gòu)在總體功能架構(gòu)設(shè)計(jì)上,ERA2.0與ERA1.0一樣,基于開放檔案信息系統(tǒng)(OAIS)的功能模型。ERA1.0的設(shè)計(jì)者基于OAIS參考模型設(shè)計(jì)了九大功能模塊,并從整體上將這些系統(tǒng)功能定義為三大虛擬工作區(qū):“存取工作區(qū)”“存儲工作區(qū)”和“查詢工作區(qū)”,分別對應(yīng)OAIS模型中的“接收(Ingest)”“存儲(Storage)”和“利用(Access)”功能,這三大虛擬工作區(qū)的開發(fā)并未完成。ERA2.0的設(shè)計(jì)者基于這三大虛擬工作區(qū),針對九大功能模塊中的數(shù)字檔案資源的移交審批、進(jìn)館處理和長期保存三大功能,設(shè)計(jì)了三大核心模塊:“業(yè)務(wù)對象管理(BusinessObjectManagement,BOM)”“數(shù)字處理環(huán)境(DigitalProcessingEnvironment,DPE)”和“數(shù)字對象倉儲”(DigitalObjectRepository,DOR),作為ERA2.0系統(tǒng)開發(fā)的核心任務(wù)。從BOM對聯(lián)邦機(jī)關(guān)原生電子文件和紙質(zhì)檔案數(shù)字化轉(zhuǎn)化版本實(shí)施的進(jìn)館準(zhǔn)備,到DPE對數(shù)字檔案(本文數(shù)字檔案是指由聯(lián)邦機(jī)關(guān)移交至ERA的原生電子文件和紙質(zhì)檔案數(shù)字化轉(zhuǎn)化版本)的進(jìn)館接收和批量處理,最終到DOR對數(shù)字檔案資源的可信長期保存與開放利用,ERA2.0實(shí)現(xiàn)了對數(shù)字檔案的自動化管理,如圖1.4所示。其中,每個模塊的功能通過多種微應(yīng)用集成實(shí)現(xiàn),即每個模塊都是不同功能組件的模塊化整合結(jié)果。與ERA1.0整合已有系統(tǒng)而形成的“關(guān)于系統(tǒng)的系統(tǒng)”不同,ERA2.0系統(tǒng)建立了一個更加具有靈活性的功能組合體系。BOM、DPE和DOR這三個模塊相互獨(dú)立,任何一個模塊的更新或調(diào)整,都不會對ERA的整體功能造成決定性的影響,因此ERA系統(tǒng)的可拓展性得以充分保障。圖1.4ERA2.0三大核心功能模塊(1)業(yè)務(wù)對象管理(BOM)BOM是專門面向聯(lián)邦機(jī)關(guān)用戶的自動化應(yīng)用,主要支持聯(lián)邦機(jī)關(guān)在線提交文件保管期限表、NARA對保管期限表的在線審核與反饋,以及根據(jù)審批通過的保管期限表移交永久文件。無論是物理移交還是法律移交,機(jī)關(guān)用戶都必須在BOM中在線填寫移交表格,在通過審批流程后方可移交數(shù)據(jù)。現(xiàn)階段BOM還只實(shí)現(xiàn)了一個針對聯(lián)邦政府原生電子文件移交的工作流,其他例如總統(tǒng)辦公室的電子文件、聯(lián)邦法院電子文件、轉(zhuǎn)化型電子文件和社會捐贈檔案的移交工作流尚未實(shí)現(xiàn),這也是未來BOM的功能研發(fā)目標(biāo)。(2)數(shù)字處理環(huán)境(DPE)DPE是指數(shù)字對象自動化處理的功能模塊,其中包含的軟件和工具能夠?qū)崿F(xiàn)電子文件的自動接收、批量識別和元數(shù)據(jù)編輯等處理流程。DPE具有很高的可擴(kuò)展性與靈活性,能夠容納任何數(shù)字檔案資源管理所需的軟件和工具,并可根據(jù)實(shí)際工作需要,隨時進(jìn)行增減和調(diào)整。DPE最早包含約15個軟件工具,包括格式描述(Formatcharacterization)、批量文件格式轉(zhuǎn)化(Bulkfilereformation)、圖像處理(Imagemanipulation)、旨在提高生產(chǎn)率的商業(yè)通用軟件(Commonbusinessproductivitysoftware)、個人信息識別(PIIrecognition)和編校(Redaction)等。到目前為止,DPE中的工具已經(jīng)超過了100個,功能范圍更廣,從數(shù)字保存領(lǐng)域常用的工具,如DROID和BulkExtractor等,到商業(yè)桌面應(yīng)用程序,如AdobePhotoshop和MicrosoftOffice等,一應(yīng)俱全。DPE工具管理框架已經(jīng)能夠支持簡單的工具添加和替換,以及為文本處理和音視頻處理的特殊需要定制多種虛擬工作區(qū)圖像等。經(jīng)過DEP處理的符合長期保存和利用要求的電子文件,進(jìn)入到DOR接受長期保存或通過NARA國家檔案目錄(NationalArchivesCatalog,NAC)為公眾提供利用。(3)數(shù)字對象倉儲(DOR)。DOR的主要功能是數(shù)字檔案資源的長期保存和檢索查詢,NARA所有的數(shù)字館藏管理與長期保存功能都在DOR中實(shí)現(xiàn),包括固化信息的記錄(Recordingoffixities)、數(shù)字對象的版本控制(Versioning)、檢索(Searching)、審計(jì)(Auditing)和報(bào)告(reporting)等。DOR的管理單元與DPE不同,DPE針對批量數(shù)字對象進(jìn)行處理,DOR則確保每一份數(shù)字檔案可靠、完整并長期可用。當(dāng)數(shù)字檔案需要批量轉(zhuǎn)換格式或者創(chuàng)建公眾利用版本時,會從DOR回傳至DPE中,經(jīng)過處理后再將符合長期保存或利用需求版本的數(shù)字檔案傳至DOR。DOR依據(jù)可信數(shù)字倉儲(TrustedDigitalRepository,TDR)標(biāo)準(zhǔn)和OAIS參考模型建立,旨在為數(shù)字檔案提供貫穿可信內(nèi)容管理與利用。在確保數(shù)字檔案內(nèi)容可信的同時,DOR還負(fù)責(zé)審計(jì)跟蹤在其數(shù)據(jù)庫中發(fā)生的所有自動或手動操作,確保數(shù)字檔案管理與利用過程可信。2.技術(shù)架構(gòu)ERA基于面向服務(wù)的體系結(jié)構(gòu)(SOA),構(gòu)建了一個能夠提供一系列檔案服務(wù)的集成化管理系統(tǒng)。ERA1.0采用的是傳統(tǒng)SOA架構(gòu)中比較重視的企業(yè)服務(wù)總線(ESB),即通過統(tǒng)一的服務(wù)接口整合不同的子系統(tǒng),最終形成一個大型復(fù)雜系統(tǒng)。ERA2.0仍然遵循SOA基本框架,但突破了ESB架構(gòu)方案,采用了微服務(wù)架構(gòu),強(qiáng)調(diào)對數(shù)字檔案館系統(tǒng)進(jìn)行徹底的組件化和服務(wù)化,原有的子系統(tǒng)被劃分為多個可以獨(dú)立開發(fā)、設(shè)計(jì)、運(yùn)行和維護(hù)的微小應(yīng)用,不同應(yīng)用之間通過服務(wù)接口進(jìn)行交互和集成。1.2.3ERA2.0的重要成果1.敏捷式開發(fā)模式NARA在ERA2.0項(xiàng)目設(shè)計(jì)之初就認(rèn)識到瀑布式開發(fā)方式的局限,而改用敏捷式開發(fā)模式。敏捷方法也被稱為輕量級方法(Lightweightmethodology),其開發(fā)理念從瀑布式的“大而全”轉(zhuǎn)向靈活的“剛剛好”(Justenough),其特點(diǎn)是高度重視軟件生產(chǎn)率,盡可能減少開發(fā)制品和活動,主要適用于需求模糊或快速變化下小型項(xiàng)目組的開發(fā)。開發(fā)小組通過頻繁且持續(xù)地交付高質(zhì)量的工作軟件、測試軟件功能并獲取用戶反饋,繼而不斷更新軟件性能。這種輕量級開發(fā)方法一方面專注于對現(xiàn)有軟件的集成,利用已有工具實(shí)現(xiàn)不同的系統(tǒng)功能,能夠大量縮減系統(tǒng)開發(fā)成本。而軟件的集成意味著靈活的工具取舍,任何一個軟件的增、減都不會對整個系統(tǒng)功能有決定性的影響,可有效保護(hù)既有開發(fā)投資。另一方面通過與用戶的充分互動獲取充足的系統(tǒng)功能需求信息,以制定詳盡的系統(tǒng)功能規(guī)劃,使得系統(tǒng)設(shè)計(jì)有足夠的靈活性和可拓展性,不僅能夠滿足當(dāng)下的管理需求,也為未來ERA2.0系統(tǒng)正式上線后可能面臨的新需求留下了空間。在敏捷式開發(fā)方式中,預(yù)先明確功能需求和規(guī)劃系統(tǒng)體系結(jié)構(gòu),比單一的功能研發(fā)更加重要。2.微服務(wù)理念系統(tǒng)在開發(fā)之初就堅(jiān)持SOA模塊化設(shè)計(jì)的理念,從企業(yè)服務(wù)總線到微服務(wù),這種模塊化理念更加徹底和深入。ERA2.0基于微服務(wù)架構(gòu),在不同系統(tǒng)功能模塊內(nèi)實(shí)現(xiàn)對現(xiàn)有軟件工具的整合,即從系統(tǒng)層的模塊化深入到了工具層的模塊化。基于微服務(wù)的模塊化組合方式是將系統(tǒng)的不同功能分配給若干個獨(dú)立的、可互操作的模塊,每種模塊專門負(fù)責(zé)一種系統(tǒng)功能的實(shí)現(xiàn),由若干個軟件和工具集合而成。ERA2.0模塊化工具集對現(xiàn)有軟件和工具保持了極為開放的態(tài)度,任何商業(yè)化、開源或者自主設(shè)計(jì)的軟件和工具,只要能夠滿足ERA技術(shù)變革要求以及新的各類數(shù)字檔案資源管理業(yè)務(wù)需求,都有機(jī)會被納入到ERA2.0中。在微服務(wù)架構(gòu)下,工作流不再固化,而是可以根據(jù)數(shù)據(jù)流隨時調(diào)整和重組,為不同的數(shù)據(jù)處理流程提供更加靈活的工具支持。特別值得一提的是,ERA2.0為非涉密數(shù)字檔案提供了云服務(wù)應(yīng)用,而正因?yàn)槲⒎?wù)架構(gòu)中應(yīng)用的相互獨(dú)立,這種云服務(wù)掛接并不會影響其他類型數(shù)字檔案資源的安全存儲,從而為NARA規(guī)劃更為細(xì)致的云遷移戰(zhàn)略提供了技術(shù)支持。當(dāng)然,微服務(wù)也對未來ERA2.0與NARA其他系統(tǒng)的元數(shù)據(jù)互操作提出了更高的需求。1.開發(fā)依據(jù)用戶故事在敏捷方法論和微服務(wù)技術(shù)框架的指導(dǎo)下,與ERA1.0不同,ERA2.0系統(tǒng)開發(fā)的依據(jù)不再是功能需求書(RequirementsDocument),而是一系列用戶故事(UserStories)。系統(tǒng)功能需求書是從系統(tǒng)開發(fā)者的視角,對系統(tǒng)應(yīng)滿足的業(yè)務(wù)和管理需求的描述,與最終系統(tǒng)用戶需求的滿足不一定匹配。用戶故事是指用戶通過系統(tǒng)完成的一件對其有意義的事情,它描述了對用戶、系統(tǒng)和相關(guān)利益者有價(jià)值的功能,它是從軟件用戶的視角對系統(tǒng)可發(fā)揮功能的描述,有利于系統(tǒng)開發(fā)者在充分理解用戶需求的前提下研發(fā)系統(tǒng)。從2014年秋開始,NARA與IBM合作,每四周開展一次用戶反饋調(diào)查,記錄那些利用ERA開展電子文件處理工作的聯(lián)邦機(jī)關(guān)用戶的系統(tǒng)使用情況、滿意度和新的功能需求等,這些用戶數(shù)據(jù)為ERA2.0研發(fā)人員提供了明確的功能研發(fā)方向和準(zhǔn)確的系統(tǒng)升級路徑。此外,為了對系統(tǒng)自動操作和用戶人為操作進(jìn)行風(fēng)險(xiǎn)管理,NARA對所有利用ERA開展數(shù)字資源長期保存的用戶,根據(jù)OAIS和TDR框架進(jìn)行用戶需求記錄,并根據(jù)TRAC和DRAMBORA等標(biāo)準(zhǔn)對這些需求進(jìn)行風(fēng)險(xiǎn)分析。4.應(yīng)用云計(jì)算技術(shù)NARA對云計(jì)算技術(shù)的應(yīng)用,一方面是為了遵守美聯(lián)邦政府“云優(yōu)先”戰(zhàn)略的要求,另一方面也是為了解決海量數(shù)字館藏的存儲難題。隨著NARA接收電子文件范圍的不斷擴(kuò)大,高容量與高吞吐量數(shù)據(jù)中心的研發(fā)、配置、維護(hù)和升級等都給NARA帶來了巨大的經(jīng)濟(jì)壓力,盡管如此,電子文件的體量、格式與內(nèi)容也已經(jīng)超乎本地管理能力。在此情況下,云服務(wù)不只是提供便捷性、經(jīng)濟(jì)性的工具,而且是對電子文件處理和存儲能力擴(kuò)展有著核心助力的關(guān)鍵技術(shù),為正面臨著變革需求的數(shù)字檔案長期保存獲取強(qiáng)大的數(shù)字存儲和處理能力。NARA認(rèn)為,云具備強(qiáng)大災(zāi)備能力和多備份機(jī)制,有助于電子文件的長期保存。數(shù)據(jù)中心遷移到云里之后,NARA可以更為專注于自己的核心業(yè)務(wù)。因此,至少對非涉密數(shù)字檔案,可以通過云服務(wù)實(shí)現(xiàn)其管理和存儲。1.3美國NARA保存項(xiàng)目1.1.1NARA的目標(biāo)與任務(wù)NARA的使命是使公眾能夠訪問其所保存的聯(lián)邦政府檔案,公開獲取政府記錄可以保障美國公民維護(hù)自身權(quán)利,對政府工作進(jìn)行監(jiān)督,了解國家的歷史,從而有效加強(qiáng)國家的民主建設(shè)。公民高效訪問和獲取檔案的前提是所藏檔案完整、安全,因此NARA開展保存項(xiàng)目,主要目標(biāo)是確保美國政府的檔案得到適當(dāng)?shù)谋4?,以便所有檔案能夠?yàn)槿藗兯?。為?shí)現(xiàn)這一目標(biāo),NARA的保存項(xiàng)目需要采取積極的保存措施,其中首要的就是設(shè)計(jì)預(yù)防策略,盡可能避免檔案損壞。為此,保存項(xiàng)目工作人員需要對威脅檔案安全的各種風(fēng)險(xiǎn)進(jìn)行預(yù)測,優(yōu)先對損失風(fēng)險(xiǎn)較大的檔案實(shí)施具體的保存行動,并做好應(yīng)對突發(fā)緊急情況的準(zhǔn)備;對檔案儲存、加工以及展覽的環(huán)境條件提出規(guī)定,并對環(huán)境進(jìn)行監(jiān)控和評估;采用具有較高效益的尖端技術(shù)和工作流程,并負(fù)責(zé)開展檔案加工和防止損壞的培訓(xùn)等。除了預(yù)防策略之外,保存項(xiàng)目的工作人員還需要開展一系列其他工作,包括:針對已遭受破壞的檔案進(jìn)行修復(fù),搶救在意外火災(zāi)中被燒毀的軍事檔案;為各種展覽活動順利開展,準(zhǔn)備必要的、類型豐富的歷史文件;為檔案存儲庫房和展覽空間的設(shè)計(jì)提供建議,為館藏各類型檔案的保存活動提供指導(dǎo)。1.1.2NARA的檔案保存策略NARA發(fā)布了四份針對2017—2022年度檔案保存的策略文件,構(gòu)建了一個從傳統(tǒng)紙質(zhì)檔案資源到數(shù)字資源保存,從檔案保護(hù)延伸到遺產(chǎn)保護(hù)和研究的策略框架。這四份文件分別是《2019—2022保存戰(zhàn)略》(PreservationStrategy2019—2022)、《2018—2021遺產(chǎn)科學(xué)研究戰(zhàn)略》(HeritageScienceResearchStrategy2018—2021)、2017《數(shù)字檔案資源長期保存戰(zhàn)略》以及2020《數(shù)字保存框架》,如圖1.6所示。圖1.6NARA保存策略文本主要內(nèi)容鄭曉丹,蔣東明.美國NARA檔案保存策略框架及其項(xiàng)目研究[J].蘭臺世界,2021(01):29-34.鄭曉丹,蔣東明.美國NARA檔案保存策略框架及其項(xiàng)目研究[J].蘭臺世界,2021(01):29-34.作為指導(dǎo)美國檔案保存工作的系列策略文件,它們之間相互促進(jìn)、共同協(xié)作,以實(shí)現(xiàn)保存目標(biāo)。在數(shù)字資源保存方面,2020《數(shù)字保存框架》是對2017《數(shù)字檔案資源長期保存戰(zhàn)略》的吸收和延伸。2017《數(shù)字檔案資源長期保存戰(zhàn)略》具體內(nèi)容包括六項(xiàng)策略和四項(xiàng)數(shù)字保存活動,六項(xiàng)策略要求制定標(biāo)準(zhǔn)及程序文件、確定數(shù)字資源風(fēng)險(xiǎn)優(yōu)先級、在可信數(shù)字倉儲中進(jìn)行檔案管理、確保檔案真實(shí)性、保存元數(shù)據(jù)、完善合作關(guān)系,四項(xiàng)數(shù)字保存活動則包括建設(shè)數(shù)字保存基礎(chǔ)設(shè)施、保障數(shù)據(jù)完整性、維護(hù)格式和媒體的可持續(xù)性、保障信息安全,以數(shù)字保存活動推動策略實(shí)施,進(jìn)而實(shí)現(xiàn)其目標(biāo)。而2020《數(shù)字保存框架》則是在吸收2017《數(shù)字檔案資源長期保存戰(zhàn)略》部分內(nèi)容的基礎(chǔ)上進(jìn)行的延伸,針對保存風(fēng)險(xiǎn)的評估和管理提出建立“風(fēng)險(xiǎn)優(yōu)先級矩陣”(theRiskandPrioritizationMatrix),要求數(shù)字保存工作人員回答與保存能力和維護(hù)文件格式相關(guān)的問題,來確定文件相對風(fēng)險(xiǎn)水平,同時列出了對文件格式風(fēng)險(xiǎn)水平產(chǎn)生影響的各方面因素,針對數(shù)字資源文件格式管理細(xì)化出文件格式保存行動計(jì)劃(FileFormatPreservationActionPlans)。該計(jì)劃主要包括兩類文件:一是電子文件的基本特征文件(theEssentialCharacteristicsdocumentation)?!盎咎卣鳌币卜Q“重要屬性”,它標(biāo)識了文件外觀、文件反映的機(jī)構(gòu)行為、背景和結(jié)構(gòu)等特征,這些特征有利于確保格式遷移最大程度保真。二是文件格式保存行動計(jì)劃表。該表格要求:說明與電子文件有關(guān)的格式類型;列出說明書、標(biāo)準(zhǔn)和證據(jù)資料;對NARA是否應(yīng)采取保存遷移行動提出建議;推薦適用于保存行動的處理工具。1.1.3NARA保存策略與項(xiàng)目的優(yōu)點(diǎn)NARA通過保存策略框架的構(gòu)建和相關(guān)項(xiàng)目的實(shí)施,推動了自身記憶、文化和教育等職能的實(shí)現(xiàn)。在記憶職能方面,NARA保存了大量有價(jià)值的檔案,是美國的國家記憶寶庫。NARA通過建立保存項(xiàng)目,由四個單位各司其職,協(xié)同工作,保證了各類型檔案的完整與安全;《2019—2022保存戰(zhàn)略》以及《2018—2021遺產(chǎn)科學(xué)研究戰(zhàn)略》都首先重視對檔案資源保存風(fēng)險(xiǎn)的管理和防范,強(qiáng)調(diào)提高保存部門風(fēng)險(xiǎn)防范的能力,盡可能避免檔案損毀。在文化和教育職能方面,NARA致力于通過自身的研究和成果,使機(jī)構(gòu)內(nèi)保存的檔案為社會的文化發(fā)展作出貢獻(xiàn)。NARA的保存項(xiàng)目要求對現(xiàn)有的檔案資源進(jìn)行數(shù)字化或制作縮微膠卷,這樣不僅能使珍貴的檔案更易獲取,還能夠保護(hù)原件免于因過度使用造成的損壞;《2019—2022保存戰(zhàn)略》也要求通過文物保護(hù)、展覽和數(shù)字化支持對NARA藏品的訪問,并要求NARA員工提高支持藏品保護(hù)和數(shù)字化的能力。鄭曉丹,蔣東明.美國NARA檔案保存策略框架及其項(xiàng)目研究[J].蘭臺世界,2021(01):29-34.鄭曉丹,蔣東明.美國NARA檔案保存策略框架及其項(xiàng)目研究[J].蘭臺世界,2021(01):29-34.1.4美國數(shù)字檔案長期安全保存啟示1.4.1注重?cái)?shù)據(jù)保存標(biāo)準(zhǔn)標(biāo)準(zhǔn)不僅是經(jīng)濟(jì)活動和社會發(fā)展的技術(shù)支撐,而且是國家治理體系和治理能力現(xiàn)代化的基礎(chǔ)性制度,不論是對國家建設(shè)而言,還是對社會發(fā)展而言都具有非凡的意義。因此,數(shù)字檔案風(fēng)險(xiǎn)管理標(biāo)準(zhǔn)體系的建立,對于促進(jìn)數(shù)字檔案安全保存管理十分關(guān)鍵。美國在此方面就圍繞數(shù)字檔案的全生命周期建立了許多數(shù)據(jù)保存標(biāo)準(zhǔn),有些標(biāo)準(zhǔn)甚至被國際標(biāo)準(zhǔn)委員會采納成為國際標(biāo)準(zhǔn),實(shí)現(xiàn)了更大層面的數(shù)字檔案安全保存。就我國而言,盡管我國已經(jīng)圍繞數(shù)字檔案安全保存出臺了一系列標(biāo)準(zhǔn),但是這些標(biāo)準(zhǔn)更關(guān)注數(shù)字檔案的前端管理,主要是信息系統(tǒng)和軟件標(biāo)準(zhǔn)、元數(shù)據(jù)標(biāo)準(zhǔn)、載體標(biāo)準(zhǔn)、術(shù)語
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年品質(zhì)巡檢考試試題及答案
- 2025廣西欽州市欽南區(qū)住房和城鄉(xiāng)建設(shè)局招聘工程質(zhì)量安全監(jiān)督員1人模擬試卷附答案詳解(模擬題)
- 2025年福建省南平閩延電力建設(shè)有限公司建陽分公司招聘2人考前自測高頻考點(diǎn)模擬試題附答案詳解
- 廣東語文面試真題及答案
- 市場調(diào)研與分析數(shù)據(jù)化模板
- 2025年丙肝知識培訓(xùn)試題和答案
- 甘肅編導(dǎo)聯(lián)考試題及答案
- 露營安全協(xié)議書7篇
- 生物基因高考真題及答案
- 2025年北京市安全員-B證復(fù)審考試題庫含答案
- 新入團(tuán)團(tuán)課培訓(xùn)
- 挖掘機(jī)安全培訓(xùn)教程
- 2024年度云南省高校教師資格證之高等教育心理學(xué)真題練習(xí)試卷A卷附答案
- 2024年廣東省清遠(yuǎn)市清城區(qū)事業(yè)單位招聘23人歷年高頻難、易錯點(diǎn)500題模擬試題附帶答案詳解
- 高中語文++《兼愛》課件+統(tǒng)編版高中語文選擇性必修上冊
- 學(xué)術(shù)論文文獻(xiàn)閱讀與機(jī)助漢英翻譯智慧樹知到答案2024年重慶大學(xué)
- (初級)航空油料特設(shè)維修員(五級)理論考試題庫-上(單選題)
- 醫(yī)療質(zhì)量醫(yī)療安全十八項(xiàng)核心制度培訓(xùn)模板
- 預(yù)應(yīng)力混凝土管樁(L21G404)
- 2023年山西省普通高中學(xué)業(yè)水平考試真題物理試題(含答案解析)
- JJG 291-2018溶解氧測定儀
評論
0/150
提交評論