當前位置:一號簡歷網 >

熱點 >黨建文案 >

基於資料探勘的高校圖書館個性化服務研究

基於資料探勘的高校圖書館個性化服務研究

(新鄉醫學院, 河南 新鄉 453003)
摘 要:文章簡述了資料探勘技術應用到高校圖書館個性 化服務中的幾種關鍵技術,並通過分析其在高校圖書館工作中的應用,來說明資料探勘對高 校圖書館發展的重要性。
關鍵詞:資料探勘;
高校圖書館;
個性化服務
中圖分類號:G250.74  文獻標識碼:A  文章編號:1007—6921(2008)17—0200—02

基於資料探勘的高校圖書館個性化服務研究

隨著資料庫和網路技術應用的不斷深入發展,Internet技術和Web技術的日益成熟,個性化 服務逐漸成為現代高校圖書館發展的重要趨勢之一。個性化服務是根據對讀者行為習慣、文 化層次和資訊需求等資訊的分析而主動地向用戶提供可能需要的資訊或服務。由此可見,如 何自動識別使用者的資訊、目標和計劃是實現個性化服務的關鍵所在。

資料探勘技術是資訊識別、資料採集和資料處理技術的典型代表,能對圖書館所存在的潛在 資訊以及讀者的個人資訊進行高效的分析並比較準確的預測其發展趨勢,對於圖書館個性化 服務工作的發展和完善具有重要作用。因此,資料探勘技術在高校圖書館個性化服務方面的 應用已經成為一種必然要求。
1 應用到圖書館個性化服務中的關鍵技術
1.1 關聯分析

每個資料庫中的資料之間都存在著一種潛在關聯,關聯分析的目的是從資料庫中發現隱藏在資料間的關聯,從而發現規則並應用到其他資料庫中,在不知道 資料庫中的關聯函式或者不確定的情況下,通過關聯分析抽取的規則便具有了一定的可信度 。例如:通過對讀者借閱檢索資料進行關聯分析,可以發現讀者在借閱文獻時的其他借閱行 為。
1.2 聚類分析

聚類是根據一定規則將資料庫中未分類的資料集劃分為一系列有意義的集合。集合中的資料 具有共同趨勢和模式。如果對同一個資料庫採用的不同的聚類方法進行劃分,則可能得到不 同的集合。在同一集合中,資料之間的差別較小,不同集合中資料之間差別較大。通過聚類 建立了巨集觀概念, 增強了人們對客觀現實的認識[1]。
1.3 分類分析

分類是通過對樣本資料庫的資料進行分析,準確找出每個類別的概念描述或者建立分析模型 ,即這類資料庫的分類規則或者決策樹模式,然後用這個分類規則或決策樹模式應用到同類 資料庫中。是一種有指導的學習。分類方法可用於圖書館讀者借閱日誌資料的分析,從而得 出讀者的借閱需求、借閱特徵等資訊。
1.4 預測分析

預測是通過對大量歷史資料的分析,找出資料的變化規律,建立模型,並用此模型來預測未 來資料的種類、特徵等。[1]典型方法是迴歸分析。例如,利用迴歸分析結合時間 序列分析對歷史流通流量日誌進行分析,可以推算出與往年相同時期的當前流通數量變化數 據。
2 資料探勘在圖書館個性化服務方面的應用

隨著網路和資料庫技術的飛速發展和廣泛應用,高校圖書館正在向資訊化和數字化的方向 轉變,近年來,我國高校加大了對圖書館的投資力度,圖書館的資料庫和儲存裝置不斷得到 擴充和擴容,網路和伺服器得到進一步普及和升級。在這種自動化的網路環境下,資料探勘 技術可以更好的完善高校圖書館個性化服務工作。
2.1 圖書推薦工作中的應用

圖書推薦工作是高校圖書館個性化服務的一個重要組成部分,是圖書館個性化服務的重要體 現之一。通過資料探勘技術的應用,圖書推薦工作可以做的更加有效和快捷。下面簡單介紹 資料探勘在圖書推薦中的應用流程。
2.1.1 資料準備

資料的準備是資料探勘的最基礎的工作,沒有資料,資料探勘將無用武之地。通過對讀者基 本資訊資料庫、讀者借閱日誌資料庫以及其他涉及到讀者各種資訊的資料庫進行選樣、整理 、資料轉換和預處理等資料處理,剔除無效和錯誤的資料,從而建立挖掘資料庫,為資料探勘做好資料準備。


2.1.2 資料探勘和建立模型

對挖掘資料庫應用關聯分析等資料探勘技術,得到讀者的借閱習慣、興趣模式和閱讀趨勢等 ,從而建立讀者借閱行為模型。例如:通過對讀者的借閱日誌進行關聯分析,可以發現讀者 借閱一類圖書同時的其他借閱行為和圖書文獻之間的關聯。然後,計算這種關聯規則的支援 度和置信度,從而建立借閱模式。需要強調的是:挖掘資料庫是動態的,它是根據讀者行為 或興趣的改變而自動進行資料修改。
2.1.3 模型的測試

建立讀者借閱模型以後,就需要測試模型的實用性和有效性。從原始資料庫中選出一定比例 的資料對模型進行測試。通過讀者模型得出的結果與原始資料進行比較,如果模型的準確率 大於既定的標準,說明模型有效,否則,就需要重新進行挖掘,建立新的讀者借閱模型,直 到找到有效的模型為止。
2.1.4 結果的輸出

通過測試以後,需要把有效的讀者模型直觀的表現在讀者或者資料庫管理者面前,這就需要 結合視覺化技術,在讀者或者圖書管理者輸入查詢條件時,通過網頁或者專門的資料探勘系 統直觀地輸出查詢結果。同時,也有利於資料庫管理員或則決策者對資料庫進行直接的資料 分析和操作,及時瞭解使用者需求,發現使用者的訪問習慣和模式以及週期性行為特徵,利用推 送服務通過圖書館網頁為讀者提供個性化服務。同時為優化資料庫資源的管理和合理分配提 供決策支援。
2.2 採訪工作中的應用

圖書採訪是館藏建設和文獻資源佈局的首要內容,是高校圖書館重要的基礎業務工作。目前 ,很多高校圖書館的採訪工作是通過採訪工作人員自己擬定然後交館領導或者專業人員審閱 修改後進行採購,或者徵集各個院系部分學科專家的意見進行採購,這樣不可避免的帶有很 大的主觀意識和片面性。而且近年來國內外文獻資源數量巨增,各種載體形式複雜多樣,再 加上圖書文獻的購置經費有限,要在有限的購置經費下保證各個學科間的科學分配和各種文 獻載體的均衡以及購書的質量是一個令人頭痛的問題。

利用資料探勘技術指導採訪工作,可以輕鬆解決這些問題。例如,利用關聯分析,對歷史採 購資料和圖書管理系統資料庫的讀者借閱日誌進行分析,可以發現各類所藏文獻間的潛在關 系和比例關係,以及讀者的借閱習慣和興趣模式,把資訊及時反饋到採訪部門,可以有效避 免採訪書刊的比例失衡,而且可以根據讀者個人需求進行採訪工作;
利用分類分析,對圖書 管理系統資料庫的文獻流通記錄進行分析,可以輕易找出借閱頻繁的圖書類別和利用率較低 的圖書類別;
利用聚類分析,對適合各類讀者的圖書進行分析,可以比較精確地得出採購的 書目,為採訪工作提供有力的決策支援。
2.3 期刊工作中的應用

近年來,國內外期刊的種類逐年遞增,載體多種多樣,為期刊的採購增加了難度。再加上高 校各個層次的閱讀者都有,要滿足每個層次讀者的閱讀要求也是一個難題。資料探勘技術提 供瞭解決這些問題的方法。利用分類分析對使用者的借閱和查閱特徵進行完全分類,找出潛在 的借閱模式,然後再利用這些模式通過網頁或者檢索介面為讀者提供個性化服務,對潛在用 戶進行推薦性服務;
基於資訊理論的決策樹演算法也可以應用到期刊工作中,決策樹演算法可以自 動從期刊讀者每日的訪問日誌等資料中收集有用資料,通過分析建立決策樹模型,從中可以 發現讀者的訪問模式和借閱習慣,瞭解讀者的資訊需求,掌握讀者的個性化資訊,從而為讀 者提供個性化服務。利用Web資料探勘技術對分佈在網際網路上的一些期刊資訊進行採集、處 理和分類。建立自己的特色資料庫,既減輕了期刊經費方面的壓力,又豐富了圖書館期刊的 資訊資源。
2.4 情報諮詢工作中的應用

作為為高校廣大師生以及學科專家提供及時有用情報資訊的情報部門,在圖書館中佔有至關 重要的地位。知識資訊提供的是否及時有效是衡量情報部工作的一個標準。在當今網路化、 數字化的時代,高校圖書館情報部門與網際網路的“親密”接觸,為情報部從網路上採集和分 析 有用資訊和資料提供了方便。但是網際網路上Web頁面綜合多樣,所含資訊浩如煙海,要想快 速而高效地檢索到自己想要的知識是一個難題。

利用資料探勘技術可以為情報工作部門提供了先進的資訊資源管理工具,通過對全校不同學 科領域的有用資料和資訊進行分類分析,可以自建特色資料庫;
利用分類分析和聚類分析技 術結合人工智慧的一些演算法,對從網際網路上檢索的相關資訊按照學科建設和科研方向等類別 進行分類,從而實現自動資訊檢索;
利用決策樹演算法建立模型,實現專業學科資料和資訊的 完全分類。使用者可以在很短的時間內檢索到所需的資訊和資料;
利用Web挖掘對網際網路的Web 網頁進行挖掘,Web挖掘可以根據需求自動從網際網路上搜索相關網頁,對這些海量資料進行 深層次分析,並保證資料的完整性和安全性。然後對檢索結果進行聚類和分類分析。把從互 聯網上檢索的相關資訊按照學科建設和科研方向等類別進行分類,然後根據專業類別、研究 方向或者其他分類要求動態直觀地呈現到讀者面前。這樣,就大大節省了使用者的時間,而且 也豐富了圖書館的館藏資源。
2.5 網路技術工作的應用

高校圖書館的網路技術部門是資料庫和網路技術運用最深入和廣泛的部門。為了更加方便、 有效的為廣大師生和有關科研人員服務,圖書館會購買國內一些大型資料庫,例如:中國期 刊網、萬方資料等綜合資訊服務商的全部或部分資料庫;
根據本校的一些科研工作和發表論 文自建小型資料庫;
或者從WWW上的有效資料鏈接下載與本校 學科建設有關的資料自建特色 資料庫。利用資料探勘技術可以對這些資料庫的資料進行有效的資訊組織和管理,並對資訊 和資料進行深層次的分析、加工和處理,使之更好的為使用者服務。例如,利用Web挖掘技術 可以對網路上的資料進行有效的導航和整合,從而使使用者得到更加精確和有效的資訊和資料 ,為優化資料庫資源的管理和合理分配提供決策支援。
3 結語

隨著資料庫的不斷擴容和網路技術在高校圖書館應用的不斷深入,高校圖書館傳統的工作方 式已經遠遠不能適應讀者日漸增長的需求,個性化服務方式將正式登上高校圖書館這個舞臺 。隨著資料探勘技術研究的發展和在高校圖書館的不斷深入應用,相信不久的將來,高校圖 書館個性化服務將會得到不斷完善和更快更好的發展!同時,也將推動高校圖書館的快速發 展,大大縮短高校圖書館的數字化程序。
[參考文獻]
[1] 陳文偉,黃金才,趙新昱著.資料探勘技術[M].北京:北京工業大學出版社 ,2002:3~4.
[2] 何少卓.淺談資料探勘及其在圖書館的應用[J].圖書館界,2004,9(3):52 ~54.
[3] 朱理達.圖書館資訊管理與資料探勘技術[J].河南圖書館學刊,2002,5(3) :60~61.
[4] 劉小東.資料探勘在圖書館工作中的應用[J].情報雜誌,2005,(8):63~65. 
[5] 李志明,胡森樹.資料探勘及其在現代化圖書館中的應用[J].圖書館學研究, 2006,(6):39~41.

  • 文章版權屬於文章作者所有,轉載請註明 https://yhjlw.com/zh-tw/redian/dangjianwenan/v1k7ke.html
專題