計畫總覽 數位技術研發與整合計畫 亮點成果介紹-共研發26項核心技術包含多媒體管理、聯合目錄、影音處理、後設資料檢索、
                                   中文缺字與斷詞系統、數位典藏資料庫以及時空資訊整合系統等。
發表73篇期刊論文
國內外重要期刊(SSCI、SCI等)
重要國內外研討會中發表161篇會議論文
26項核心技術
共研發26項核心技術
包含多媒體管理、聯合目錄、影音處理、後設資料檢索、中文缺字與斷詞系統、數位典藏資料庫以及時空資訊整合系統等
44項資料庫開發
計有44項資料庫開發
47項網站與系統建置
8個前瞻研究分析小組
數位學習
數位學習領域中已輔導成立8個前瞻研究分析小組
76件技術支援
影音、資料庫典藏技術
共計76件技術支援件數
40件技術移轉
已完成40件技術移轉
包含中文構字與分詞系統、數位影音與多媒體典藏系統等
  亮點成果主題

 

共研發26項核心技術包含多媒體管理、聯合目錄、影音處理、後設資料檢索、中文缺字與斷詞系統、數位典藏資料庫以及時空資訊整合系統等。
  亮點成果介紹
1.數位典藏後設資料技術

後設資料(Metadata)是一組結構化與標準化的背景資料,用以描述每個數位典藏品的內涵與特徵,以便數位典藏品能夠在數位化環境或系統中,達到最佳化資源探索(Resource Discovery)的效能,進而有效而精準地被檢索、呈現、管理、控制與執行相關功能,及資源的互通與共享與長期保存目的。後設資料發展組(MAAT)主要提供服務項目包括:物件識別碼編碼設計、後設資料國際標準導入應用與標準接軌、後設資料分析服務、聯合目錄匯入服務協助及對照與品質檢測。

數位典藏後設資料技術

 

2.數位典藏資料庫製作工具

「數位典藏資料庫製作工具」是Web介面資料庫應用系統的速成工具,它支援管理、查詢、條列、報表四類網頁的製作。此工具採用DBMS中立設計,配有XML匯出器,又整合了Lucene全文檢索引擎。

3.圖像典藏管理技術

「圖像典藏管理技術」可進行數位化與後製作的處理工作,結合本計畫自行開發的多媒體中心平台實作數位化檔案、多媒體檔案Metadata 的管理,轉換數位化圖檔為適合網路觀賞的格式。此技術具備原始媒體檔案備份管理、多媒體檔案瀏覽介面、電子書製作等功能,以滿足多媒體管理與應用上的需求。

4.數位典藏系統建構技術

此技術是將各個數位典藏系統裡共用的、重要的模組予以元件化,以便於後續開發類似系統時再利用,這些模組化與元件化技術開發共用性之模組,可降低系統重複開發工作,並提高系統的可維護性。
目前已開發的元件包括:字串處理、XML文件處理、日期時間處理、中文缺字處理、HTML動態網頁處理、權限控制處理、多媒體影像處理、資料庫存取、檔案傳輸處理等多個處理元件並包含權限管控模組、代碼管理模組、日誌管理模組等。
上述的核心元件亦可依據典藏單位的需求,整合DAAL組提供的服務平台與資源,如:MoZop(地理資訊系統)、VCenter(影音分享平台)、iPicBox(圖片分享平台)、缺字處理技術、多媒體中心(多媒體檔案管理系統)等,提供更完整的建置數位典藏系統服務。
目前已將此技術已提供給研院史語所:善本古籍、印記、人名權威、考古發掘、拓片與古文書、漢代簡牘等典藏單位相關使用。

5.數位典藏聯合目錄系統建置技術

提供使用者檢索本國家型計畫之典藏成果,查詢系統主要功能包括:以主題、時代、地區與典藏單位等功能整合瀏覽各單位數位化資料,並可利用簡單檢索及精確查詢資料。此技術已提供給中研院史語所:善本古籍、印記、人名權威、考古發掘、拓片與古文書、漢代簡牘等典藏計畫使用。(此技術原為DAAL小組開發,已轉至三分項,本計畫亦可提供服務)

6.漢字構形網路應用技術

本計畫以「漢字構形資料庫」為核心,發展出適合數位典藏系統上的缺字解決方案及相關工具。遵循漢字構形原理,直接將構字式著錄在資料庫,在網頁呈現時,則利用轉換程式將構字式還原成圖形方式顯示,使缺字能夠符合網路上的各種應用。

漢字構形網路應用技術

 

7.數位影音自動化轉檔技術

數位影音自動轉檔技術,可經由Mpeg格式的檔案轉出MP2、WMV、RM等適宜網路播放的檔案格式。目前市面上雖有可以轉換多媒體檔案格式的軟體,但多數仍無法處理多重頻寬的格式,通常同一次操作中只能轉換出一種檔案格式。而DAAL小組發展的多媒體轉檔程式則是依TELDAP的需求,可以處理多重頻寬的格式,可以在同一次的操作中,轉出多種不同的檔案格式,節省轉檔時間。本技術已提供給台北藝術大學、行政院新聞局等單位使用。

8.可視化知識關聯全文檢索平台

「可視化知識關聯全文檢索平台」,主要利用Lucene索引核心技術,結合了布林、萬用字元,同音字、同義字等多樣化檢索能力,可以快速尋找到相關檔案或文字格式資料,亦可針對檢索詞進行語意拓展,找出關聯詞彙以知識地圖呈現方式展示檢索結果。此外,此一平台並具有使用者回饋機制,系統經過人工建立關鍵字或關聯詞字庫改善系統檢索正確率,達到系統自我成長功能。系統亦可隨著時間資料增減,以增量索引方式更新索引檔,保有最新檢索結果。

9.影音數位典藏技術

影音數位典藏系統的建立包含了:影片取得、數位影音內容擷取、影音內容分析處理、資料庫建置、加值應用等處理流程。使用者可透過此技術,對影音數位檔案建立內容之快速索引,亦可將內容進行加值應用。本技術發展及整合了影音資料格式轉換、分鏡偵測、精華影片與畫面粹取、metadata資料管理、全文檢索、語音檢索、串流影音格式、非線性線上剪輯等技術,成為一個完整的影音數位典藏環境。此技術已提供台北藝術大學、行政院新聞局等單位使用。

影音數位典藏技術

10.MoZop摸索舖

MoZop摸索舖透過Web Mining技術,將網路上豐富多元卻雜亂無章的生活資訊與GIS做整合,經過分群分類,以友善且新穎的使用者介面提供使用者快速取得各式各樣的生活資訊。並配合TELDAP計畫,利用空間資訊及分群的概念,提出一空間分群演算法,能有效減少標示於地圖上的地標點數量,一方面降低系統負荷,並且不至於因標點太多而讓擁擠的畫面混淆了使用者的視覺。為典藏內容提供一地理數位化平台傳播數位典藏成果,目前已展示中研院生物多樣性研究中心之數位典藏魚貝類分布及VCenter影音典藏平台等,未來將與更多典藏單位合作,加入更豐富典藏資源。

MoZop摸索舖

11.VCenter

「VCenter」是展示與發佈本國家型計畫數位影音內容的平台。主要是以使用者為中心的概念設計,並融入Web 2.0的精神,用來增添影音內容與使用者之間的互動,其中的嵌入播放器功能,便利典藏機構和一般民眾,將存放在VCenter的影音內容連同播放器,內嵌在其他的展示平台或部落格。
VCenter具有幾項新穎的應用服務,包含(1)提供線上影音編輯工具,讓使用者能在影音內容上添加浮水印、編輯字幕和設定影音書籤;(2)整合地理資訊系統,提供整合影音地圖的服務,讓使用者更容易地記錄影音內容的拍攝地點,同時也方便瀏覽者透過地圖來檢索影音內容。(3)行動裝置上的應用,允許使用者透過行動裝置上傳影音檔案,並且提供簡訊通知與影音下載等服務。

VCenter

12.iPicBox

2010年建置相簿分享服務網站iPicBox,提供一般大眾上傳拍攝的照片,並透過分享機制,可將所上傳的照片發布於Facebook、Plurk等社群網站,上傳方式除了透過網頁之外,也可使用Picasa相片管理工具,以及匯入Flicker上的圖像。iPicBox.tw提供相簿共享的功能,讓使用者與好友共享相簿;也提供多項新穎的服務,例如多樣式的相簿瀏覽形式、全景瀏覽等等。

iPicBox

13.技術需求分析服務

由DAAL小組透過深度訪談方式,引導使用者(內容典藏建置計畫)提出明確的數位典藏系統需求,並考慮使用者既有工作流程,協助擬定軟體需求規格書(SRS),並根據需求規格書,整合DAAL相關服務平台與資源,進行著錄、查詢、列表、代碼、權限、異動紀錄等相關功能分析,撰寫軟體設計規格書(SDS),進行系統開發。若使用者決定委外(廠商)開發典藏系統,DAAL小組亦可提供協助擬訂相關技術需求文件,並協助招標與驗收。

14.數位典藏系統保存技術

 本技術可應用於保存及備份數位典藏系統。本技術以虛擬化(Virtualization)技術為基礎,整合技術團隊的系統開發與維運技術,為典藏單位提供備份、網站託管和保存等服務。服務內容包括將數位典藏網站及資料庫,備份與移轉到技術分項提供的實體機器上,並快速的重建相同的平台。

15.中文缺字技術

本計畫採用字形的結構來表達缺字,徹底解決缺字的編碼及檢索問題。目前中文缺字技術已提供TELDAP計畫與中研院等進行古籍數位化的機構相關技術支援。

中文缺字技術處理

16.影片分鏡偵測技術

影片分鏡偵測技術透過流體力學中的雷諾定理(Reynolds’ transport theorem),藉由連續偵測固定區間中進出影像畫面(frames)的色彩分佈差異,找出因換景而形成的色彩分佈落差,進而標定出各分鏡(shot)的位置與範圍。另一方面藉由統計原理針對溶解式(dissolve)慢換景作更準確偵測。同時有效降低影片中因物體、攝影機運動所造成的大量誤判情況發生。

17.以局部運動軌跡為基礎之MPEG視訊檢索技術

「以局部運動軌跡為基礎之MPEG視訊檢索技術」藉由MPEG影片中的運動向量(motion vector),自行針對影片中的局部物體運動進行分析與註解,提供以內容為主(content-based)的自動化視訊檢索方案。

18.影像版調重現技術

影像版調重現技術目的是為了增加影像畫面的可辨識對比以及細節還原,提供一般數位照片亮度對比上的還原跟增強,除了能加強影像的明暗呈現,去除不良的陰影,並能有效還原曝光不佳的細節,無須手動參數設定即可得到相當優異之結果,亦提供手動微調之功能。相關技術處理之照片,請見數位典藏多媒體成果展示

19.影像修補技術

本計畫研發半自動的影像修補技術,藉由自動預測可能的修補區域,再由使用者快速選擇欲修補之範圍,可以很方便地對老舊影像或一般影像中的小範圍損壞內容,進行修補處理。

20.語音文件檢索技術

針對國語錄音資料有檢索需求的單位,本計畫開發語音文件檢索技術,整合在SoVideo中文影音新聞檢索系統作技術展示,該系統以瀏覽器為介面,使用者可以輸入關鍵詞來搜尋相關影音新聞。本技術已提供給台灣社會人文電子影音數位博物館。

21.包含未知詞的斷詞標記系統

斷詞標記系統包含一個約十萬詞的詞彙庫及附加詞類、詞頻、詞類頻率、雙連詞類頻率等資料,斷詞依據為此一詞彙庫及定量詞、重疊詞等構詞規律及線上辨識的新詞,並解決斷詞歧義問題。除了基本詞彙庫外,使用者可依需要附加領域專屬詞庫,斷詞系統採用之詞典具可擴充性,使用者可依據不同領域文件,補充以領域詞典做為斷詞之用。此系統為各項自然語言處理問題之基礎建設,例如搜尋引擎、文章分類、自動摘要、語音合成、機器翻譯等,其重要性顯而易見。

中文斷詞標記系統

22.中文剖析系統

「中文剖析系統」採用機率式無語境規律的模型(Probabilistic Context-free Grammar)為基本剖析架構並加入結構中詞彙搭配關係機率解決結構歧義。在結構決定之後,可選擇是否對結構進行語義角色的指派。

中文剖析器

23.強韌型數位指紋技術

數位簽章技術除了用於數位內容鑑定,由於可以另存於資料庫中而不需實際隱藏於媒體資料裡,這種具非侵入性(non-invasive)的數位簽章技術已逐漸受到重視,並開始使用於一些原本使用數位浮水印技術的應用上。與數位簽章同義,包括強健式/視覺式赫序 (robust/visual hash),數位指紋 (digital fingerprint) 與被動/非侵入性浮水印 (passive/non-invasive watermark) 等。我們的研究成果顯示已能大幅提升一個非資料隱藏技術的影像指紋系統在資料的保護、識別與追蹤等應用之強健性。從技術面而言,我們的方法在Stirmark驗證下,展現最強強健性(robustness)。本技術提供給對圖像版權保護有需求的數位典藏計畫單位。

24.時空資訊整合及應用系統

本系統為具有處理「時間-空間資訊」4個維度(4D)資訊整合與應用系統。時間與空間資訊是符合人類思考模式的資訊整合應用方法與環境,本研究提供針對空間資訊處理的專屬資料架構、軟體模組(如空間資訊分析與圖層處理等)及使用和呈像介面。
透過時間與空間的資訊橋樑,將各種類型、不同時空下數位內容作最有效的整合與應用,進而多面向地展現資料的意涵與價值,系統包含呈現(visualization)、邏輯關聯(logical relationship)、以及座標參考系統三個層次,分別透過空間視算與圖象化使用者介面、地名與詞彙(glossary and thesauri)、以及時空座標系統等整合而成。時空資訊整合及應用系統曾協助NDAP計畫項下計畫開發超過30個主題WebGIS系統,為具有處理「時間-空間資訊」4個維度(4D)資訊整合與應用系統。

時空資訊整合及應用系統

25.地圖影像發佈及應用軟體工具

GIS技術主要針對具有地理座標大圖影像資料(例如:地圖、航照影像或GIS向量資料),透過影像分割預處理技術及各式GIS 軟體擴充模組開發,提供在網際網路上巨量影像高速存取之解決方案。後續預計將擴充支援:網頁透明度瀏覽功能、資料分類目錄、浮水印加註、不同版本影像管理及大型圖檔(大於350MB)處理等功能。本技術已提供給群立科技股份有限公司、中興工程顧問股份有限公司、漢珍數位圖書股份有限公司、中華民國航空測量及遙感探測學會等等,GIS應用系統開發廠商或GIS顧問公司。

地圖影像發佈及應用軟體工具

 

26.中華文明之時空基礎架構系統

「中華文明之時空基礎架構系統」起源於跨領域的學術研究應用需求,期望建構以中國為空間範圍,並以原始社會迄今的中國歷史為時間縱深,以中國文明為內涵的整合性資訊應用環境。主要對象除了以學術研究與教育為主的學者、專家、與教師外,亦希望能兼顧一般性的,以時間及空間為主的資訊管理、分析、整合與呈現等應用。最終目的則冀望建立持續蒐集研究與應用成果之回饋機制,以不斷充實資訊內涵,發揮資料整合價值並分享予使用者。此系統已提供給崧旭資訊股份有限公司、互動國際數位股份有限公司等等。

 

前往下一成果
關於我們 2011數位典藏與數位學習國際會議 數位典藏與數位學習國家型科技計畫年度成果展