1000部丰满熟女富婆视频,托着奶头喂男人吃奶,厨房挺进朋友人妻,成 人 免费 黄 色 网站无毒下载

首頁 > 文章中心 > 檔案數字化的關鍵技術

檔案數字化的關鍵技術

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇檔案數字化的關鍵技術范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

檔案數字化的關鍵技術

檔案數字化的關鍵技術范文第1篇

面對網絡時代城市建設迫切需要遠程、公開、快捷的城建檔案信息,面對館藏日益增多的案卷,傳統的城建檔案保存方式已明顯難以適應迅速發展的新趨勢。以往一直采用的柜架式紙張保存和目錄式管理,不僅占用了大量庫房空間,管理成本高,而且易黃、易蛀,保管時易損壞;同時,城建檔案數據庫中分類信息復雜,靠手工查詢速度慢。由于城建紙質檔案量大,查閱起來耗時、耗力。傳統城建檔案使用的種種局限給城建檔案管理提出了更高的要求,信息技術的日新月異也給城建檔案工作帶來了新的研究課題。這一切,都使城建檔案數字化建設提上了議事日程。

2000年12月,國家檔案局、中央檔案館印發的《全國檔案事業發展“十五”計劃》,把“加快檔案信息化建設”、“加快現有檔案的數字化進程”列入其中,同月國家檔案局在中國檔案管理現代化建設研討會上宣布:十五期間,我國將加快數字化檔案館的建設。由此,城建檔案數字化建設的問題引起了人們的關注。

城建檔案信息數字化就是把紙質檔案通過掃描、錄入信息到計算機數據庫中,以計算機存儲城建檔案信息。城建檔案的數字化并非一蹴而就,而是一個循序漸進的過程。我們有必要對這個過程的各個環節進行深入的分析和研究,只有在有了清楚認識的基礎上,才能規劃好城建檔案管理的數字化之路,為今后的城建檔案數字化建設打好基礎。

1.確定城建檔案數字化指導思想與原則

城建檔案數字化指導思想是:以需求為導向,以利用為目的,充分利用計算機軟硬件功能,最大限度發揮人力資源和數字化加工設備能力,保護館藏城建檔案原件完好,保證數字化城建檔案真實準確,更好地發揮城建檔案信息資源的作用。

城建檔案數字化原則是:遵循重要城建檔案數字化的價值性原則、常用城建檔案數字化的實用性原則、開放城建檔案數字化的開放性原則、褪跡城建檔案數字化的搶救性原則、解密城建檔案數字化的及時性原則、目錄數字化與全文數字化分步的時效性原則、城建檔案數字化加工與利用同步的一致性原則。

2.城建檔案數字化建設的步驟

城建檔案數字化建設需要投入,特別是建設初期軟硬件配置投入較大,建成后也要保持一定的運行成本。因此,要按照成本效益最大化理論,細化城建檔案數字化建設的步驟,同時優化城建檔案數字化的各種資源配置,根據不同的情況,進行城建檔案專業人員和數字化技術人員、計算機和掃描設備的合理搭配,構建城建檔案數字化投入小收益大的新模式。

2.1建立城建檔案數據庫

第一步,輸入文件級目錄。在建立數據庫的過程中,可邊輸入邊打印,一方面補齊卷內文件目錄,另一方面檢驗輸入的正確性,從而確保城建檔案數據庫的真實性、完整性和有效性。第二步,采用掃描儀、數碼相機等設備,實現原文件信息數字化。

2.2加強電子文件的收集和積累工作

電子文件包括電子文件內容、電子文件載體和電子文件顯示、修改的電子計算機軟硬件平臺的組合,是未來數字城建檔案最主要的來源。為了確保所形成的電子文件不被丟失,保證電子文件是可存取、可利用和可理解的,必須及時對所形成的電子文件進行收集積累。電子文件的收集積累,不僅保證電子文件的真實性,還維護了它的系統性、完整性,同時,也防止了存有信息內容的載體在個人手中發生丟失、損壞,從而保護電子文件的安全,為電子文件的歸檔打下基礎。

電子文件的收集積累范圍,應嚴格按照國家有關規定執行。用載體傳遞的電子文件,要按規定進行登記、簽署,對于更改處,要填寫更改單,按更改審批手續進行,并存有備份件,防止出現差錯。

2.3城建檔案數字化與上網利用同步

城建檔案數字化及管理流程重組是一個管理思想不斷地變化的過程,城建檔案數字化與上網利用同步即是新技術和新理念相互融合的表現。

數字化城建檔案分開放與不開放兩種,開放城建檔案即上互聯網,建立城建檔案資料網站,實施資源共享,在互聯網上向政府和社會提供城建檔案信息查閱。

3.不斷增強城建檔案數字化管理的技術含量

城建檔案數字化的建設過程重在管理,貴在控制。利用計算機進行城建檔案數字化,任何一個邏輯錯誤,都會給數據的管理和使用帶來麻煩或隱患。在互聯網上公開不真實、不準確的檔案,將在社會上產生不良影響。特別是在網絡環境下的流水作業,上一道工序一定要為下一道工序負責,各道工序工作量的對等與匹配同樣重要。實踐證明,建立數字化進度數據庫、數字化質量反饋庫、城建檔案利用登記數據庫,通過技術手段將全面質量管理思想引入城建檔案數字化建設,實現全程管理、適時控制,才能達到強化數字化城建檔案質量保證體系的目的。

4.著力提高數字化城建檔案的系統整體水平

檔案數字化的關鍵技術范文第2篇

[關鍵詞]地籍檔案;管理;數字化

[中圖分類號]G237 [文獻標識碼]A [文章編號]1005-6432(2010)49-0096-03

1 當前地籍檔案數字化的形勢和要求

2006年國土資源部《金土工程一期建設方案》中推進信息化建設的要求和《地籍管理“十一五”發展規劃綱要》中都明確指出:“要建立統一配置、管理各類數據的數據集成管理平臺,實現數據的可視化管理和服務”、“地籍檔案管理要實現數字化、可視化。”

長期以來,地籍檔案管理采用計算機輔助與手工操作相結合的方式,采用的載體都是傳統的紙質檔案材料和相關電子表格、文檔,按照新時期檔案信息化的技術要求,要實現城市地籍檔案管理數字化、可視化,還應該通過數字化加工處理,將紙質檔案內容轉換成計算機能夠存儲和識別的可視圖像文件。

延吉市國土資源局于2008年2月起結合全國第二次土地調查關于“建立四級土地利用數據庫和建立市縣地籍信息系統”的要求,開始進行檔案的掃描錄入工作。委托長春市某航遙信息技術公司承擔檔案數字化掃描加工,預計掃描加工檔案約10萬宗,約200萬頁,數據容量3.5~5T,工期預計為4個月。主要步驟是:①將每一卷檔案的所有卷內內容,即權屬資料、身份證明等申請材料、地籍調查表、審批表、相關圖紙、變更記錄等所有內容,經過掃描,以圖片格式存入計算機。②為掃描生成的圖片編制以地籍號為主的十級目錄文件名,并根據圖片文件名中的關鍵字段和現有的檔案信息系統實現鏈接。

對于今后接待的登記申請,將直接在辦證大廳窗口用掃描儀進行相關材料的掃描錄入,在完成土地登記后,可以直接生成地籍數字圖片檔案,同時形成紙質和電子兩套檔案數據。圖片數據按文件名中的關鍵字段和現有的檔案信息系統實現鏈接。該系統是延吉市國土資源局于2004年研發并開始應用的,是以JSP技術和B/S模式,以Appache和Tomnet開發服務器為平臺建立的地籍檔案查詢系統。

2 檔案數字化與數據處理的具體方法

地籍檔案與一般檔案相比,最突出的特點是圖文并茂和地理位置相關性,既有報告、批文、合同等文本性質的檔案,也有宗地草圖、地籍圖、宗地圖等圖形、圖像的檔案。掃描和錄入時除選擇合適的硬、軟件設備外,還必須針對不同類別的檔案材料數字化的要求、采用不同的工作流程和技術方法進行數據轉換與壓縮處理,以保障數字檔案材料的清晰、準確和便于存儲與應用。

3 文本類檔案的數字化與數據處理

地籍檔案的文本類檔案的數字化方法此次一概采用掃描錄入法(包括地籍檔案原件的文頭、手跡、圖表、印鑒等信息)。

3.1 掃描方式

針對檔案的清晰度采用不同的掃描方式,主要是黑白、灰度、彩色三種方式。對于比較清楚的紙質檔案可采用黑白方式掃描,對于模糊的紙質檔案采用8bit灰度方式掃描,對于有彩色圖章的紙質檔案采用16bit彩色方式掃描,這樣既可以滿足檔案數字化的要求,又能減少存儲空間。

3.2 分辨率

確定掃描的分辨率是檔案掃描的關鍵環節之一。掃描的分辨率過高,掃描文件占據存儲空間大、使用不方便;掃描的分辨率太低,掃描圖像不清晰,滿足不了數字化管理的要求。經多次試驗研究,我們認為,對于負載量不重的文件材料,選擇“200dpi”像素分辨率掃描比較合適、對負載量重的文件材料,載荷大的頁面,當字跡看不清楚或者很難看清時,采用更高的分辨率,直到能看清楚為止。分辨率以“50dpi”為步進遞增。

3.3 存儲格式

掃描文件的格式有很多,其中最常用的有BMP、GIF、JPEG、PNG、TIFF和PCX等格式。BMP位圖格式的特點是包含的圖像信息較豐富,幾乎不進行壓縮,缺點是占用磁盤空間過大。GIF格式的特點是壓縮比高,磁盤空間占用較少,其缺點是不能存儲超過256色的圖像。JPEG格式用有損壓縮方式去除冗余的圖像和彩色數據,能獲得極高的壓縮率。TIFF格式的特點是圖像格式復雜、存儲信息多,且支持LZW無損壓縮方式,它存儲的圖像細微層次的信息非常多,圖像質量高,故而非常有利于原稿的復制。此次我們選擇的是無損壓縮的TIFF格式作為掃描文件的存儲格式。

3.4 掃描后的技術處理

對掃描圖像的處理主要包括糾偏、旋轉、去黑邊、亮度和對比度的調整、色階調整、去雜點、消藍去污、拼接等。局部消藍能夠對字跡褪變的檔案進行修復,一般情況下通過調整亮度,一頁檔案的大部分文字都會掃描出來,但有些地方會因太淺或太濃而看不清楚甚至看不出來,這時就需要根據不同情況,對灰度掃描后形成的圖像分別設置不同的亮度比較值,然后轉換成實際黑白二值文件進行存儲,從而使全篇檔案都能清晰地顯示出來。這對于修復歷史檔案具有十分重要的意義。

4 圖形檔案的數字化與數據處理

與文本檔案材料相比,圖形檔案材料最大的特點是空間定位性和可量測性。圖形檔案材料的掃描主要有兩種方法,一是掃描成圖像格式;二是數字化成矢量格式。后者要在掃描后,對掃描圖像進行屏幕矢量化或通過特殊的軟件自動矢量化,對于矢量化形式的數字化,還應該對圖形要素進行分類、分層和編碼。我局現有的檔案管理系統已經和地籍圖庫實現鏈接,所以此次采用的是前者。

4.1 圖形材料的掃描

地籍檔案的圖紙資料一般圖幅較大,大多是A1、A0幅面,A3、A4幅面的較少。因此,圖形掃描采用大幅面的掃描儀。對于1∶500、1∶2000比例尺的圖紙,圖面負荷不重,一般采用300dpi的掃描分辨率。對于1∶10000或更小比例尺的圖紙,由于圖面負荷較重,采用600dpi的掃描分辨率。

4.2 圖形數字化的精度

圖形數字化的精度要求較高,而且與圖紙的比例尺有很大關系。一般要求不大于原圖的0.3~0.5毫米。

5 掃描錄入的圖片文件名及目錄名命名格式和具體規范

5.1 文件名總體上采用定長編碼加上前綴的方式

5.3 具體規范的補充

第一,獨立宗地無棟號、戶號,應在相應位置補零。第二,原舊土地使用證的證號,在字頭補零處理。第三,自治州一級的批件,使用證號末尾加Z,如果不滿11位,在S后、證號前加零補齊,如州件證號為“2002009”,則先變為“S2002009Z”,因為位數為9位,不足11位,需在S后和“2002009Z”前補零,變為“S002002009Z”,最終變成了11位。第四,抵押檔案(包括多證抵押)中裝在同一檔案袋中的檔案袋文件,保存的目錄應在其原來應有的目錄下,而不是抵押檔案目錄中,文件名仍按“12.文件命名規則”制定。第五,關于版本修改歷史:版本1.1修改了文件名稱最后的頁號表示前添加“_”。版本1.1.1修改了“12.文件命名規則如下”例2中棟號位數的錯誤。版本1.1.2的修改內容:①在“檔案類別”后增加了檔案變更次數內容。②對州批件的使用證號做了詳細的命名規定。③對抵押檔案件的目錄命名和文件名命名規則做了規定。

6 檔案數字化存在的問題

6.1 數字檔案的憑證價值問題

第一,由于一系列技術和立法問題還未解決,數字化檔案目前還不具備法律憑證效力,所以數字檔案只有參考價值而無憑證價值。

第二,技術上的問題。①數字檔案具有易復制、修改、刪除的特點,使得檔案“原件”的概念變得難以確認。②計算機硬、軟件技術不斷更新換代,因而無法通過載體、格式的鑒定來判定其原始性。

6.2 數字檔案信息的長期存取問題

第一,存儲的介質材料。數字介質,無論磁盤還是光盤的壽命都遠遠無法和紙質檔案相提并論。

第二,機讀語言格式。計算機語言平均每3個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現行的機器語言描述的數據,還能100%的還原。

第三,對設備的依賴。數字檔案必須依賴于計算機設備才能讀出,如設備發生故障、系統癱瘓,電子文件就讀不出來;電子文件對其他設備環境的不兼容性,使其只能在某種設備上處理,而不能在其他設備上處理;不同軟件環境形成的電子文件存儲在載體上,有時難以互換;電子文件加密后,不解密就無法識別;技術設備更新時,不及時解決格式轉換問題,也無法讀取等。

6.3 數字檔案的失真問題

此次檔案數字化的主要方式是掃描加工,在這一過程中造成數字檔案失真的原因還有以下幾個方面:其一,技術參數選擇不當。針對不同色調、紙質和字跡,有時需調整不同的技術參數,如分辨率、明暗度、對比度等,選擇不當會直接影響掃描的質量,造成信息丟失、圖像模糊或產生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復勞動,難免有時失誤。如掃錯檔案或打錯順序,或存錯,或在建索引時鏈接錯誤等,如不及時發現,將直接導致數字化檔案失真。其三,轉換過程中的失真。在進行數字檔案的遷移或在提供利用時,往往需要將掃描后形成的圖像文件轉換成另一種格式的文件,如果格式選擇不當,同樣會導致數據發生變化。

6.4 數字檔案信息的安全問題

主要表現為:其一,計算機病毒。網絡病毒的泛濫已對計算機網絡系統構成嚴重的威脅。其二,計算機黑客。黑客對信息資源的攻擊,程序設計高手可以篡改系統控制參數。其三,有竊取行為的間諜活動,窺視其機密信息進行復制或擴散。其四,有意破壞,摧毀系統的信息處理功能或破壞電子通信裝置。其五,人為或偶然事故造成的威脅。如工作人員操作失誤而產生的不可預知的事件、網絡系統軟件硬件的故障、電子系統故障引發的系統問題等,所有這些,都使數字檔案信息的安全變得十分“脆弱”。

6.5 技術過時問題

在飛速發展的IT業中,電腦硬件、操作系統、應用軟件及存儲載體等不斷地被新產品所替代,雖然絕大多數新產品承諾向下兼容,但其兼容的“代”數在跨越若干年后,舊的數字信息就很難被新的硬件設備和軟件系統讀出。“技術過時”的陰影一直會籠罩著數字信息。也有專家們提出的解決方案是數據遷移,但遷移卻存在著一個致命弱點,就是每次遷移總會丟失一定的相關信息,這些丟失的信息積累起來會造成數字檔案信息無法準確恢復原貌。

6.6 數字檔案建設的標準化問題

地籍檔案數字化建設提出只是近十年的事,在全國開展的情況也各有差異,而且受信息技術發展速度的影響,檔案信息系統至今沒有相應的具體標準可遵循。此次延吉市國土資源局掃描錄入地籍檔案也是全州八個縣市的第一家,在吉林省也是名列前茅,具體的技術規程和方法還在實施中逐步研究探討。還遠不能達到信息標準化建設和實現檔案信息資源共享。

7 結 論

在新時期地籍檔案數字化在可視化查詢和統計等方面具有以往檔案管理無可比擬的優越性,但是也存在著由于自身的技術特點和介質特點等原因造成的不可避免的缺陷和弱點。今后的檔案數字化建設的最重要環節即是實現國際標準化。在選擇的硬、軟件設備和選擇標準的數字化與數據處理方法時,制定的數字化與數據處理工藝流程在兼顧標準化的同時一定要有前瞻性,盡可能和信息技術發展保持同步。減少信息資源和物資資源的浪費,實現階段性的可持續的發展。

參考文獻:

檔案數字化的關鍵技術范文第3篇

隨著企業辦公引入互聯網,運用計算機參與企業檔案工作也是當前要做的工作。目前企業檔案的數字化建設存在著不足之處,下文將對企業檔案數字化建設的認識表述相關觀點以及提出相關措施。

一、企業檔案數字化建設的重要性

檔案是企業重要信息的存儲倉庫,同時又是信息利用的源頭,因此檔案管理工作對企業具有舉足輕重的作用。隨著國民經濟的發展,檔案的管理和利用受到了越來越多的關注,并在企業單的發展中發揮著越來越重要的作用。做好檔案數字化將給企業檔案工作注入新的動力,提高檔案管理和利用水平。有效提升檔案管理工作的效率,激活蘊藏在檔案中的信息能量,使檔案信息能夠在更大的范圍內得到更充分的利用。隨著當前檔案信息的數量越來越龐大,企業工作人員信息、企業業務狀況等信息需要被詳細存儲,紙質檔案記錄已經無法滿足現代社會的要求。和過去紙質檔案相比,數字化檔案具有瀏覽方便、容量大、不占空間等優勢。

二、企業檔案數字化建設的現狀與問題

(一)缺乏企業檔案數字化建設標準化規范體系

當前企業檔案數字化建設還存在著較多的不足。例如企業檔案數字化管理體系沒有統一的標準,當前信息數字化管理的模式較多,對信息的分類、整理等均未實現統一。此外,當前企業對檔案數字化管理的工作人?T的擇選沒有一套標準的選拔標準,沒有專業的操作檔案數字化建設的工作人員,存在存儲操作失誤導致信息丟失的風險。

(二)缺少整體數字化建設流程的規劃與設計

當前檔案的數字化建設屬于實踐的初期階段,并未形成系統的操作程序。在信息收集、整合、歸類、存儲等環節,各個企業間的操作方式存在差異。企業同一部門內的信息存儲方式不同,影響企業內部工作人員的工作效率;就不同企業間的合作而言,信息的存儲程序不同,在一定程度上阻礙信息的交流與共享,阻礙企業間的進一步合作與發展。

(三)企業檔案數字化建設的關鍵技術不成熟

企業檔案數字化建設的關鍵技術不夠成熟。企業檔案數字化管理的核心技術即存儲信息的技術,廣義上的數字化信息存儲技術包括處理信息的全過程-----對獲取信息的分類、信息整合以及信息的存儲設備的擇選。實現信息數字化管理是整個過程最核心的環節是信息的存儲設備。當前我國企業還屬于信息數字化建設道路上的初學者,信息存儲設備還有較大的發展空間。

(四)數字化建設中的信息安全和保密技術問題

我國企業信息數字化建設面臨的難題是對于存儲信息的安全問題以及保密措施。保證信息的安全以及相關的保密措施是存儲信息、實現信息數字化的重要環節。存儲的信息的安全得不到保障,信息保密措施得不到完善,信息的泄露和丟失,不僅花費的存儲信息的人力、物力資源浪費,還存在給企業造成經濟損失的風險。因此,保證信息的安全問題以及信息的保密措施是當前企業需要重視的重要環節。

三、新時期企業檔案數字化建設策略

(一)加強檔案數字化的軟、硬件設施建設

加強檔案數字化建設的設備是加快企業信息數字化管理的重要途徑之一。優化人力資源、物力資源的配置,為企業檔案管理部提供必要的信息存儲設備。根據信息管理部分的實際操作需要,為信息管理部門提供相應的工作電腦、復印機、掃描儀、互聯網以及從事信息管理的專業人員,保障企業檔案數字化建設順利實現。此外,隨著企業的需求以及電子設備的更新換代,企業管理者也應當注意為相關信息存儲設備升級,提高信息存儲部門的工作效率。

(二)加強電子文件的收集、積累和歸檔管理工作

隨著電腦辦公的普及,以電子文件形式為主的信息載體越來越多,電子文件成為了實現檔案數字化管理需要重視的問題。注重電子文檔類型信息的收集、積累和歸檔,是保證企業大部分信息能夠實現存儲、安全妥善保管的重要方式。此外,電子文檔的收集、歸檔也值得企業信息管理部門的重視。電子文檔具有占地面積小,隨時可進行閱讀的優勢,重視電子文檔類信息的存儲是推動企業實現檔案數字化管理的有力方式。

(三)建立和完善檔案數據庫

建立并逐漸完善企業信息檔案數據庫是推動企業實現信息數字化管理的重要環節。建立信息數據庫,將信息集中存儲,按照相關的類別對信息進行分類存儲,能夠方便信息的快速查找和使用,提供企業工作人員的工作效率。此外,構建信息數據庫,大量信息的集中,對于推動企業信息實現系統化管理具有積極意義。信息數據庫的建立使各項信息一目了然,能夠幫助信息管理部門剔除無用、存在誤差的信息,保證信息的準確率。

(四)加強培訓,提高檔案管理人員的素質

提高檔案管理工作人員的工作素質是推動實現檔案數字化建設的重要途徑。信息管理部門的工作人員是信息的直接處理者,因此要求工作人員具有一定的工作素質。例如工作過程需要使用操作性復雜的設備或者工作程序繁雜等情況,均是對工作人員耐心以及仔細程度的考驗,提高檔案管理人員的工作素質是工作完成質量和效率的保障。

檔案數字化的關鍵技術范文第4篇

一、檔案基礎數據庫建設的緊迫性

今天,我們處于信息技術快速發展的知識經濟時代,國家、城市綜合服務資源庫的建設是社會發展的需要,是加強政務公開、實現便民服務的一項基礎性工作。我國已經在人口、法人、自然資源與宏觀經濟四大數據庫的建設方面取得較大成效,檔案作為人類社會活動的歷史記載,檔案資源的開發利用和檔案基礎數據庫的建設已經成為國家信息資源建設的重要組成部分。可以說,檔案基礎數據庫的建設已經成為各級各類檔案館面向社會提供檔案資源利用服務的基本職能,成為我國整合檔案信息資源、弘揚民族文化、提高民族素質的歷史性課題,同時也是我們檔案工作者采用現代化手段記憶當今社會改革、建設、發展真實過程,支撐社會經濟發展的歷史性責任和義務,更是政務公開,提高辦事效率和促進科學決策的依據。

美國、加拿大、澳大利亞、德國、韓國等一些發達國家已經在檔案數字化、文檔一體化、數字資源長期保存、數字檔案館等方面開展了一些預言性、前瞻性和應用性研究,相繼制定了電子文件管理的元數據格式與規范,研究開發檔案管理信息系統、檔案資源共享的網站系統的建設思路和方法。2003年2月國際檔案理事會檔案著錄標準特別委員會正式公布了新修訂的第二版《規范記錄著錄規則》,于2004年第十六屆國際檔案大會上正式頒布修訂后的第二版《規范記錄著錄規則》,該檔案著錄規則對規范檔案目錄數據庫的檢索服務,建立高質量的目錄中心具有重要的參考價值。發達國家的經驗告訴我們,建設基礎數字資源庫的宗旨是遵循國際標準,構建跨區域的開放檔案的共享資源庫,針對公眾對檔案資源的利用需求提供高效率的查準、查全服務機制。

目前在我國,也有一些省市級檔案館開展數字檔案館建設,制定了符合各地區自己需求的數字檔案的元數據格式規范,建立了檔案目錄中心,提供部分開放檔案信息的檢索服務功能,具有典型示范作用的有福建省檔案基礎數據庫建設,它是基于分布式數據庫,在原來單機和局域網絡的基礎上開發完成,它連接了若干分布式數據庫,并建立了檔案目錄數據庫,檔案內容數據庫,等。但是多數檔案館還沒有真正建立全面的、系統的、面向公眾查檔需求的檔案基礎數據庫,而只是建立了一些專門的特定主題的檔案數據庫,只能滿足一些局部的特定的用戶需求,特別是開放的檔案信息資源沒有實現集成,信息結構不統一,檔案數據不系統、不完整、不共享,更為嚴重的是沒有形成一個統一的能夠描述數字檔案資源的格式規范和建設檔案基礎數據庫的標準方法、實現檔案資源的整合、組織與存儲的技術方案和行之有效的建設思路;另外,還由于建設檔案基礎數據庫的關鍵技術,如海量、非結構化的數據存儲解決方案,基于知識管理的數據倉庫和數據挖掘等技術尚未在檔案信息化領域得到廣泛應用,這些因素都大大降低了檔案基礎數據庫建設的速度和質量,致使各類檔案資源難以形成一個統一的資源庫整體,限制了檔案資源的深層次挖掘和廣泛化利用。

因此,研究檔案基礎數據庫的元數據標準集、數字化檔案信息的格式規范以及檔案基礎數據庫建設的思路和方法、各類結構化和非結構化檔案數據的組織、存儲和檢索利用的關鍵技術及整合應用方案,以及提供檔案信息檢索服務的有效機制將成為當前檔案館基礎數據庫建設的重要的基礎性工作。

二、檔案基礎數據庫建設的工作內容

建設檔案基礎數據庫是一個長期的、復雜的系統化工程,它包括各類標準規范的制定、檔案信息的組織與存儲、檔案資源的整合與集成、數據存儲服務器和提供數據檢索服務的軟硬件平臺的建設以及開展基礎數據庫建設的組織與團隊及其長效服務機制的形成。而在眾多的數據庫建設工作中,標準規范與數據資源的滾動建設則是最基本的也是最重要的內容。

1.標準規范體系建設。包括元數據格式規范、管理規范和業務工作制度三大方面。制定數字化檔案的存儲標準與格式規范,明確檔案數據庫的存儲與訪問方法。包括各門類數字化檔案元數據的組成、結構、描述方式、著錄規則與要求;各種類型檔案內容(包括文本、圖形、圖像、音頻、視頻以及非結構化信息)的描述方法、格式要求、存取方式、訪問機制等;檔案內容與檔案元數據之間關聯模型的定義、檢索方式的確定;檔案目錄數據庫和內容對象的分級存儲、統一管理、集成共享方式和要求。

制定檔案基礎數據庫建設的管理規范和制度,明確數據庫建設過程中的程序化和規范化操作方法。主要包括數字化數據庫的建設步驟、方法和要求;數字化檔案信息的網絡存儲、離線備份和災難備份與恢復的功能、性能、技術規范和管理規定;數字化檔案信息的安全管理規范、備份方式與要求;備份的數字化檔案信息的管理方法等;檔案基礎數據庫的原始性保障措施,規定如何采用身份認證、數據加密、電子簽名等技術確保檔案的真實、完整、有效和憑證性作用;數字化檔案信息的授權訪問制度,定義開放檔案、控制使用檔案、檔案的分類存儲和授權管理與訪問制度。

制定檔案基礎數據庫建設的業務規范和制度,明確接收數字化檔案信息和開展館藏檔案數字化加工的工作要求。主要包括數字化檔案的歸檔、移交、接收的工作制度和內容、范圍、方式、方法及安全保障要求;開展館藏數字化加工的全過程工作方法、安全制度、保密措施、人員要求等;檔案基礎數據庫的滾動建設與完善制度和工作要求。

2.檔案信息資源滾動建設。主要包括數據庫平臺的建設以及數據著錄、數據處理、數據整合與數據備份系統的建設。數據庫平臺是指存儲檔案數據的軟硬件存儲系統,包括網絡存儲設備的選型、安裝、調試和使用,數據庫管理系統,存取數據的軟件平臺,多門類檔案數據存儲方案的確定和實施,以及數據存儲系統的升級、維護與持續服務的計劃和工作要求等。檔案數據存儲系統的建設主要涉及到需求分析、方案確定、設備的購買及其與服務器的連接等內容,網絡存儲設備一般應與服務器的購買同步考慮。多數服務器供應商提供存儲解決方案,并提供服務器與存儲設備之間的集成與互聯。

數據著錄系統是獲取檔案信息的門戶應用,包括檔案內容信息、檔案目錄和標引等的錄入、修改、保存以及電子文件的上傳等內容,著錄系統的建設主要是要將標準規范加以實施,在數據入口處將不合規范的數據進行預處理,真正將符合檔案管理和保存要求的數據捕獲到數據庫存儲系統中。

數據處理系統是實現批量數據導入、導出、掛接和規范性校驗的自動化數據著錄系統,一般由技術支持人員來完成,系統的建設需要根據檔案業務工作的需求,總結和預先定義數據處理的標準和自動處理規則。

數據整合系統是在數據處理之前,根據檔案資源管理的需要,對檔案信息資源進行分門別類的整理與規范化處理,以方便實現檔案信息資源的集成與共享。

數據備份系統建設的目的是提高數據的安全性,根據備份方案的不同,可以采取在線備份、脫機備份兩種方式。建設數據備份系統,一方面要建立實施備份的軟硬件支撐平臺系統,一方面要制定備份的策略和計劃,并在工作中實施和維護,同時還需要對備份的數據實行全面的管理,這三方面內容缺一不可。

三、檔案基礎數據庫建設是實現檔案資源共享、開展社會化服務的基石

社會信息化使檔案信息資源面臨著一個全新的生存環境與發展空間。美國檔案學者杰拉爾德?漢姆先生曾指出:檔案應該記載“人類生活的方方面面”,檔案工作者要“創造一個反映普通百姓生活喜好、需求的全新的文獻材料世界”,檔案館藏是反映“人類生活的廣闊領地” ①。因此,檔案資源唯有回歸社會,得到最大限度的利用,才能體現檔案保管的價值和作用。事實告訴我們,實現檔案信息資源的集成化管理和共享化利用是檔案貼近公眾、服務社會的最佳解決方案。

要實現檔案信息資源的共享化利用,首先必須在檔案基礎數據庫的建設上下功夫,而檔案基礎數據庫的建設必須在檔案的形成、存儲和提供利用的各個環節加以重視。檔案的形成是一個從個體知識到組織知識,再到社會知識轉換的文化積累、動態跟蹤和滾動發展的歷史記憶過程,檔案的開發與利用則是人類傳承文明、創新發展的進步與成長的歷史形成過程。如圖1所示。這兩個相互銜接、彼此推動的過程,循環往復、推陳出新構成了人類社會的知識化動增長(Adaptive)和社會化自適應的檔案資源形成過程模型。這表明了檔案文化通過“傳―承―積累―發展―傳”這樣一種類似于文化加工廠的生產工序,隨人類自身的代代繁衍而形成民族文化的生生不已、無始無終的傳承環鏈②。

圖1檔案資源的知識化共享和社會化服務過程模型

進入21世紀,我國的電子政務與各行各業的信息化已經進入了以知識管理為核心的快速提升和綜合運營的重要發展階段,信息技術的發展也把知識管理推到了一個核心重要的位置,“以知識為基礎的經濟社會” 的提法更表明了人們對知識和技術在經濟增長中的作用有了更充分的認識。可以想象,未來的互聯網是一個豐富多彩的“知識網”,是一個儲存綜合知識的文化資源大倉庫。檔案作為人類社會活動的原始記錄者和忠實承載者,記錄了人類的社會成果的同時也揭示著人類文化,它是民族文化遺產的重要組成部分。同時檔案在文化傳承中占據著舉足輕重的地位,發揮著不可替代的作用, 正如張輯哲在其《維系之道―檔案與檔案管理》著作中所談:“正是由于有了檔案與檔案管理,人類才能夠不斷地在繼承中存在、發展,在存在、發展中延續,不斷使自己真正成為一個連續的時空整體。檔案與檔案管理是人類社會時空統一性和連續性的維系之道……”。

檔案信息資源必將會成為未來“知識網”中不可或缺的重要組成部分,因此,在開展檔案信息化建設過程中,首要重要的事情是建設高質量的檔案基礎數據庫,充分利用數據挖掘、數據分析工具提供快速檢索與服務,實現檔案信息資源的社會化共享,才能真正體現檔案保存的價值和意義。

注釋:

①.F.杰拉爾德,漢姆,劉越南譯,檔案邊緣,《山西檔案》,1999年第1期.

檔案數字化的關鍵技術范文第5篇

關鍵詞:數字圖書館;信息數字化;存儲技術;發展對策

數字圖書館是一個將信息資源以數字化方式存貯并通過網絡提供即時服務的信息系統,因而信息資源數字化是實現數字圖書館的根本條件,也是數字圖書館正常運轉的關鍵步驟。但目前高校信息數字化中由于種種原因還存在許多問題,如重復建設、知識產權、技術應用和標準與規范等問題,這些都嚴重阻礙了我國數字圖書館的健康發展。因此,高校在實施信息數字化建設過程中,不僅需要更新觀念、統籌建設,還要規范標準、加強立法、提高館員素質,更要加強適合我國國情的技術創新。

一、數字圖書館中的信息數字化

(一)信息數字化的內涵

從社會信息化環境來說,數字圖書館是運用計算機技術、網絡技術、通信技術等多種信息技術,對不同載體和類型的信息資源進行搜集、選擇和規范化處理,使之以數字化的方式存儲,建立分布式的館藏信息資源庫和虛擬信息資源庫,并通過網絡向世界各地用戶提供無時空限制服務的信息系統。數字圖書館的主要職能是搜集、保存和傳遞數字化信息,可以稱之為數字化信息的存儲和傳遞中心,因而信息數字化建設無論從質量還是從數量上都是數字圖書館發展的關鍵環節。

(二)信息數字化的關鍵技術

信息數字化技術包括數字化信息的生成技術、存儲技術和壓縮技術等,其關鍵技術是數字化信息的生成技術和存儲技術。1.數字化信息的生成技術包括有鍵盤錄入和非鍵盤錄入兩種方式,目前使用較多的是第二種方式。鍵盤錄入是一種手工轉換的文本模式;非鍵盤錄入包括手寫識別技術、印刷文稿掃描識別技術、語音識別技術。在信息數字化實際工作中,高校許多數字圖書館都采用兩者相結合的方式來規避鍵盤錄入的較高錯誤率和掃描方式對硬件的較高要求。2.數字化信息的存儲技術包括直接存儲技術和網絡存儲技術。直接存儲技術是目前大多數數字圖書館的數據存貯技術,主要包括光盤塔技術、磁盤陣列技術和磁帶庫技術;網絡存儲技術包括直接附加存儲(DAS)、網絡附加存儲(NAS)、存儲區域網絡(SAN)、小型計算機系統接口(ISCSI)技術和內容尋址存儲(CAS)[1](P.20-21)。

二、信息數字化中存在的主要問題

雖然我國數字圖書館建設中的信息數字化工作取得了一定的進步,但由于觀念和技術的落后,信息數字化建設整體上呈現出數字信息資源重復建設嚴重、版權保護立法不健全、缺乏有力的技術支撐、標準和規范化建設滯后等問題[2](P.13-14)。

(一)重復建設問題

由于國內各地區、各系統以及各館之間無一個權威的協調機構,也無規劃布局和分工實施計劃,數字圖書館建設缺乏全局性的統一規劃和政府權威部門的協調,相當多的所謂數字圖書館建設仍處于各自為政、貪大求全和相對分散的無序狀態,信息資源重復現象的問題嚴重。近年來,我國各級政府投入了大量資金,各級各類數字圖書館都在進行數字信息資源建設,甚至引進CNKI等數據庫,這種現象在各大高校數字圖書館的信息數字化中也非常普遍,在相當廣的范圍內存在著潛在的數字信息資源重復建設問題。

(二)知識產權問題

隨著數字圖書館的開通,數據庫的利用將越來越廣泛,由此產生的知識產權問題就不可避免,其中爭論的焦點是關于網絡作品的制作、傳播和使用的版權保護問題,讓一些數字圖書館在實踐中遭遇法律尷尬。著作權人公開指責圖書館界濫用權利,嚴重損害了著作權人的利益;出版界也有人認為文獻信息的數字化是復制出版界的出版物,在網上出現了成千上萬的復制本、使出版界的經濟利益受到損害;而圖書館界則認為信息獲取的主動權完全掌握在版權人手里,這樣會嚴重地影響知識的創造和傳播。因而制定網上數字化文獻的著作權法律法規已成當務之急。

(三)技術應用問題

隨著電子出版物的收藏和網絡數字化資源的采集,圖書館越來越多的信息一入館就是數字化的,而傳統館藏,進行數字化轉化所使用的技術主要是光學字符識別(OCR)掃描錄入方式。一般的OCR錄入系統能夠實現對各種現代書籍、簡繁體書籍、報刊雜志、公文檔案的錄入識別,且識別率高,還能實現各種校對,然而,對于傳統館藏文獻的數字化,特別對含有繁體手寫漢字的古籍文獻、簡繁混排的中文文獻、專業性強的中文文獻以及難于機檢的漢字文獻,OCR技術目前還存在很大的誤識率和拒識率,為此,需要對OCR系統進行深入的研究和改進,提高其應用的全面性,并要引入中文校對、錄入。

(四)標準與規范問題

目前主要有:1.缺乏對標準規范重要性的認識;2.缺乏普遍接受和廣泛應用的關鍵標準規范;3.缺乏對標準規范建設的系統化把握;4.缺乏對標準規范的開放描述和開放應用;5.缺乏開放、聯合、共享的標準規范建設與應用機制。例如圖書館在信息資源建設過程中所采用的軟件系統差異很大,如ILAS系統、圖書館集成系統等,其標準和格式都不一致,導致開發的數據庫不能兼容,檢索界面不一,檢索途徑也不同,檢索語言也無統一的規范控制,無法在網上實現資源共享。

三、信息數字化發展對策

(一)加強特色數字館藏建設

只有具有特色的數據才能贏得較高的網絡訪問頻率,才具有資源共享的價值,也是各大數字圖書館以最小投入換取最大效益的文獻信息共享模式。因此,在進行本館的信息數字化建設時,除了需要全面考慮文獻價值、用戶需求、載體形態、技術可行性和著作版權等一般因素外,還需要科學而系統地考慮館藏內容、館藏特色,尤其是館藏結構和館藏級別。館藏級別一般可以劃分為永久保存級、服務級、鏡像級和鏈接級4個基本層次。永久保存級館藏是指具有確定的保存價值和用途,并具有惟一性的特色文獻;服務級館藏是指十分有用和必須的虛擬館藏;鏡像級館藏是指其他數字圖書館館藏的拷貝,與永久保存級相同的是它們都是現實館藏,與之不同的是它缺乏惟一性;鏈接級館藏則是貯存于其他數字圖書館中的數字化信息資源,其內容較為廣泛,與服務級館藏相比,它與用戶的相關性要低一些。只有通過這些特色數字館藏的建設,才能真正優化館藏文獻的結構,加快館藏信息利用,最大限度地避免重復建設,從而提高整個社會文獻資源的保障水平和信息資源的開發利用效率。

(二)從信息源頭加快信息數字化建設

文獻信息資源的源頭在出版社和出版商,每年都有數以萬計的文獻資源被出版系統數字化,這個資源如能加以利用,將是一筆巨大的財富。據2001年統計,全國530家出版社的圖書總量是154 526種[3](P.32-33),一年的文獻資源總量就相當于一個中型圖書館文獻資源的全部館藏總量,而且還在逐年遞增。如果把信息數字化的生產重任交給出版商,將會帶來很大的經濟效益和社會效益:一方面可以大量減少信息資源重復數字化帶來的人力、物力、財力的浪費;另一方面,信息資源數據庫的建設者可以通過與出版社合作取得授權來解決信息資源建設、傳播中的知識產權問題,既能保護作者的知識產權,又能照顧到出版商利益,同時還能讓各類文化、科技的文明成果納入數字圖書館,使其能為更多的人服務,創造出更大的價值。

(三)開發和利用先進技術

無論是從數字圖書館建設,還是從文獻信息數字化技術來說,技術問題仍然是制約著信息資源共享的主要問題。數字圖書館是采用現代高新技術的系統工程,不僅需要立項研究開發新的應用技術,而且還需要各種高新技術成果的及時轉化和應用。目前,信息資源數字化的關鍵技術在發達國家已趨于成熟,他山之石、可以攻玉,加強技術研發工作可以從以下幾個方面進行:1.從高校數字圖書館建設項目的實際出發,組織專人對信息數字化關鍵技術進行跟蹤、研究、攻關;2.借鑒引進適合國情的國外先進技術和先進產品;3.集成和采用以國家“863”計劃為代表的國內已有的科技成果;4.開發適合我們自己的先進技術,如電子信息處理技術、指引庫技術、語音識別技術及信息媒介技術,同時規范有關技術標準[4](P.55-56)。

(四)促進信息數字化建設的規范化和標準化

信息數字化涉及文獻描述、組織和檢索多個方面,各個數字圖書館之間想共建共享信息資源,就必須統一標準。因此,圖書館數字化建設要走資源共享的道路,必須打破各自為政的局面,各圖書館文獻分類編目不統一,對資源共享造成很大的障礙,在書目數據方面,數據不標準就不能保證用戶從各個角度迅速、準確地檢索資料。因此必須有一個數字圖書館全國中心,建立和健全全國數字圖書館使用的各種標準規范,協調規范資源庫建設,解決信息數字化建設的標準化問題。根據標準,再由地區內、地區間各館合作建庫或由地區文獻信息中心統一建庫,各館錄用,最終達到全國的標準化。

(五)提高館員的信息處理技術與研究人員的素質

隨著信息資源概念的發展,文獻信息數量和類型的增加,信息工作方式和手段的改進,圖書館的工作對象已不再局限于對傳統紙質文獻和某些縮微資料或視聽資料的一般性收集、整理、組織、管理等工作,數字圖書館面臨更多的信息載體和信息服務方式。例如,各種電子圖書、網絡信息資源、CD-ROM和其他電子資料已成為數字圖書館采訪和處理的主要對象,這對于長期熟悉紙質文獻的傳統圖書館員來說就是一個巨大的挑戰,同時,數字圖書館還會帶來一系列需要解決的新問題,如知識產權歸屬品種和復本的比例、購書經費的分配等。在書刊分類和編目工作上,館員的技術性處理工作會迅速減少,但會被賦予需要更多知識的技能才能完成的新任務。也就是說,他們可能參與更多的信息技術工作、文獻信息研究和用戶研究工作。總之,現在圖書館工作者應當是信息專家和信息工程師,是信息系統的設計者,也是信息用戶的導航者。鑒于此,在提升數字圖書館館員的素質上,一方面可以通過吸收一批計算機、通訊、外語方面有特長的人才充實圖書館人員隊伍;另一方面應加強在職人員的培訓,提高其計算機、英語和專業綜合技能與素質,及時調整和優化他們的知識結構,以適應信息資源數字化建設的要求。

參考文獻

[1]陳柯明.談網絡環境下數字圖書館信息存儲技術應用 發展[J].圖書館界,2004,(6).

[2]梁平.我國數字圖書館建設中的幾個問題[J].中華醫學 圖書情報雜志,2004,(13).

主站蜘蛛池模板: 咸阳市| 鄂托克前旗| 牡丹江市| 囊谦县| 镇坪县| 樟树市| 会宁县| 大竹县| 凤城市| 英德市| 萝北县| 潍坊市| 双流县| 东城区| 余姚市| 桃江县| 马尔康县| 孟村| 桦南县| 鄱阳县| 孟州市| 渝中区| 青岛市| 集贤县| 鄂伦春自治旗| 墨脱县| 吴忠市| 剑河县| 元江| 青河县| 合作市| 高陵县| 丘北县| 都兰县| 汕尾市| 龙口市| 扬中市| 辽阳县| 额敏县| 西畴县| 滨州市|