網路教室 常見問題 留言版
全文檢索 專卷查詢 我的剪報 自動剪報系統 影像圖庫
庫藏資料明細
首頁-> 關於udndata
 
首頁 關於udndata
 
aa
緣起
聯合知識庫為聯合線上公司於2000年4月籌備,2001年2月19日正式成立的新媒體。聯合報系所發行的聯合報、經濟日報、民生報(民生報資料至2006/11/30止)、聯合晚報及星報(星報資料至2006/10/31止)等五大報在過去五十年來共發行了一百卅萬個報紙版面、一千多萬則新聞、七十餘億個字。這些新聞資產正是台灣民眾過去五十年生活的共同記憶,它不止是文字資料,而是歷史的軌跡與驗證。

如何將這些重要的社會資產與全體華文社會共享,一直是聯合報系長期以來認真思考的議題,當網際網路普及後藉由數位化的科技,這個理想得以實現。聯合知識庫的成立不僅提供了新聞資料的檢索更衍生了數位典藏歷史的社會責任,活化報系五十年的新聞資料,完整而翔實地呈現台灣近代珍貴史料,累積社會事實,傳遞文化變遷的軌跡,成為新世紀知識的庫藏中心,並提供完善的知識管理工具,落實打造知識社會的基礎工程。
a
報紙數位化工程

當聯合報系政策決定執行報系五十年來報紙數位化的跨世紀工程時,首先面臨的問題是五十年來報紙的紙質、排版、印刷歷經多次技術革新,且擁有非常龐大的資料量,目前市場上並沒有單一自動化的技術可以滿足報系數位化工程的需求。聯合知識庫整合了多種技術開發出高效率的資料回溯系統,首先委託毅欣公司進行整版掃瞄,再將字體、字型變化較多,電腦不易辨識的標題用人工輸入,接著以圖文切割的方式將報紙版面上的內容分區切塊透過全景軟體公司為聯合知識庫打造的多核心光學影像辨識系統(OCR)將影像檔轉換為文字檔儲存,在此階段文字的正確率已可達到百分之九十八以上,為了提高正確率全景公司還提供集字校對與逐字校對工具,透過兩次「半人工、半自動」的循環校對後正確率提高到百分之九十九點九一。此項龐大的數位化工程除了藉助以上各技術來源外,並由聯合報系印務部及校對中心同仁支援完成。

聯合知識庫在正式上線時將提供聯合報系近兩年七十餘萬則新聞,並計畫在四年內回溯完成聯、經、民(民生報資料至2006/11/30止)、晚、星(星報資料至2006/10/31止)五報自創刊日迄今的一千多萬則新聞的數位化工程。

 
影像圖片儲存
在多媒體發達的時代,電腦的儲存、記憶體設備,已趨向便宜普及化,使用者的資訊需求也由單純的文字,進而發展至更精緻的圖片,聯合知識庫除了致力於文字資料的回溯之外,也於2004年2月推出影像圖庫的服務,由多位專業的編輯將報系珍貴的照片資料數位化,重新整理分類,提供使用者更多的資訊。未來,影像圖庫的目標則是將聯合報系五十年來的珍貴史料照片,以人工掃描重新整理的方式將之數位化,用圖像的方式更具體呈現出台灣社會、歷史人物的原貌。
 
主要功能、關鍵技術
在資訊爆炸的時代裡建置資料庫的主流方向為「Metadata」意指「詮釋資料」或「超資料」它的基本理念是「data about data」,也就是說要將資料重新分析組織整理,以提升資料的附加價值讓使用者容易消化吸收便能轉換為知識。聯合知識庫除了擁有聯合報系五十年的新聞資料外更要提供各種先進的技術來活化這些資料,讓使用者能夠很方便的詮釋資料、擷取知識。為了成為完美的知識管理工具,聯合知識庫供應以下五大主要功能與服務。
 
會員類型與服務
聯合知識庫為一收費型網站,「知識有價,使用者付費」的觀念逐漸為網路使用者所接受,聯合知識庫提供各種會員不同的服務內容,並依不同的會員身份贈送不同的儲值點數,使用者在閱讀30天以前的新聞內文時系統就自動扣除一點儲值點數。
各類型會員的服務與收費如下表:
 
全文檢索
專卷查詢
我的剪報
影像圖庫
自動剪報系統
非會員
近10年的標題檢索
近7天的新聞全文
無法使用
無法使用
無法使用
無法使用
免費會員
近10年的標題檢索
近30天的新聞全文
無法使用
無法使用
無法使用
無法使用
學生會員
600元
聯合報系全部的資料
200點儲值點數
可使用
可使用
可使用
無法使用
菁英會員
2,000元
聯合報系全部的資料
400點儲值點數
可使用
可使用
可使用
無法使用
企業會員
20,000元
聯合報系全部的資料
4000點儲值點數
可使用
可使用
可使用
可使用
*另不定期推出各項優惠的合購案,請注意聯合知識庫首頁的活動內容!
 
基本資料
網址:
http://udndata.com
地址:
110 台北市忠孝東路四段555號
傳真:
00886-2-2768-6020
客服專線:
00886-2-2763-1000 ext. 6109 或 6110
電子信箱:
service@udndata.com

| | | | | | |

著作權所有、轉載必究