網(wǎng)絡讀者訪問流量統(tǒng)計分析的論文
1系統(tǒng)的實現(xiàn)
訪問量的多少是衡量網(wǎng)站是否成功的重要標準,但對于圖書館網(wǎng)站是遠遠不夠的,圖書館需要獲取完整的讀者訪問流量統(tǒng)計數(shù)據(jù),來對圖書館信息資源的使用情況進行分析,網(wǎng)絡信息計量學方法是目前網(wǎng)絡界普遍采用的網(wǎng)站績效評估計量法,被認為是可以用科學的方法檢驗網(wǎng)站訪問數(shù)據(jù)的一種工具。它的目的包括了解網(wǎng)絡讀者的行為、確定網(wǎng)站是否吸引適當?shù)淖x者來訪、評定網(wǎng)站建設策略是否得當。其實施步驟可分為三個階段:
(1)記錄網(wǎng)站的訪問數(shù)據(jù);
(2)分析記錄數(shù)據(jù);
(3)為網(wǎng)站建設策略的改進提供依據(jù)。
1.1系統(tǒng)原理
由于網(wǎng)絡發(fā)布站點和數(shù)據(jù)庫本身具備了訪問計量功能,各自的信息資源收藏狀況便于人們掌握,并且能自動記錄讀者訪問的登錄情況,如登錄名、登錄時間、瀏覽文件、讀者的來源地址等,這些數(shù)據(jù)資料能夠準確反映讀者訪問信息和來源分布等情況,所以依據(jù)圖書館網(wǎng)絡讀者訪問統(tǒng)計的工作內(nèi)容,制定相應的分析指標,并收集網(wǎng)絡讀者訪問圖書館信息資源發(fā)布站點形成的日志文件,然后利用日志統(tǒng)計工作軟件定時對日志文件進行處理,得到統(tǒng)計數(shù)據(jù),并動態(tài)生成各種表達形式的能滿足圖書館各項統(tǒng)計分析工作的報表。最后把生成的分析報表導入到發(fā)布數(shù)據(jù)庫中發(fā)布出去。
圖書館各個網(wǎng)絡資源站點建設人員可通過瀏覽網(wǎng)絡讀者訪問流量統(tǒng)計分析報告,分析和了解讀者的訪問需求,從而做好網(wǎng)絡信息資源的建設工作。
讀者行為分析研究則可通過對分析報告進行質(zhì)化研究,并結(jié)合一般調(diào)查法、咨詢研究法對讀者的信息尋求行為進行研究。
本系統(tǒng)還可利用統(tǒng)計分析的結(jié)果來對系統(tǒng)自身工作進行評估和調(diào)整。
1.2分析指標
傳統(tǒng)圖書館的分析指標和計量方法,雖然和數(shù)字化圖書館有很多不同,但使用的目的及計量的準則并沒有太大實質(zhì)性差異[4]。
參考傳統(tǒng)圖書館的分析指標以及國內(nèi)外類似的研究結(jié)果選定了下列10個分析指標:
(1)讀者到訪人數(shù)和潛在讀者人數(shù)的百分比;
(2)到訪讀者表現(xiàn)了閱讀的興趣的百分比(采取明顯的閱讀行動);
(3)可能的讀者轉(zhuǎn)為經(jīng)常的讀者的百分比(經(jīng)常閱讀、下載資料);
(4)讀者的持續(xù)度(重復到訪讀者);
(5)讀者的忠誠度(網(wǎng)頁瀏覽次數(shù)、再度到訪的次數(shù)及時間長度);
(6)讀者停止閱讀行為的百分比(閱讀行為半途中止);
(7)讀者耗損率(現(xiàn)有讀者中停止閱讀行為者的百分比);
(8)讀者動搖率(耗損的讀者/到訪讀者的總數(shù));
(9)讀者最近到訪時間(據(jù)上次到訪的間隔時間);
(10)讀者到訪頻率(多久到訪一次)。
就此參數(shù),我們可以從一個客觀的角度來觀察和評估圖書館網(wǎng)絡讀者訪問情況。
1.3系統(tǒng)框圖
網(wǎng)絡讀者流量統(tǒng)計分析系統(tǒng)功能框圖
1.4工作方法
本系統(tǒng)工作方法主要是采集網(wǎng)絡讀者訪問過程日志進行量化分析法,它的優(yōu)缺點見表1。
讀者訪問過程日志分析法優(yōu)缺點
量化分析法重視量的分析,本系統(tǒng)通過對訪問過程日志以量的方法加以統(tǒng)計分析,首先根據(jù)為了研究讀者需求分布和需求增長情況這一目的將研究內(nèi)容歸類成若干分析單元,接著將分析單元以數(shù)量的方式加以表達,進而以此為解釋讀者信息尋求行為的依據(jù)。
1.5技術實現(xiàn)
(1)系統(tǒng)結(jié)構(gòu)
本系統(tǒng)是以瀏覽器/服務器/數(shù)據(jù)庫體系結(jié)構(gòu)作為基本架構(gòu),通過ASP方式實現(xiàn)交互式、動態(tài)的讀者訪問日志統(tǒng)計分析系統(tǒng)。系統(tǒng)結(jié)構(gòu)框架如圖2所示:
讀者訪問日志統(tǒng)計分析系統(tǒng)結(jié)構(gòu)框圖
(2)系統(tǒng)組成模塊
本系統(tǒng)有六個模塊組成:訪問日志入庫、訪問流量分析、被訪頁面分析、來訪讀者分析和統(tǒng)計分析圖表。
(3)系統(tǒng)運行環(huán)境與開發(fā)平臺
本系統(tǒng)運行環(huán)境和開發(fā)平臺如表2。
讀者訪問日志統(tǒng)計分析系統(tǒng)模塊
表2系統(tǒng)運行環(huán)境及開發(fā)平臺一覽表
軟件類別軟件名稱
數(shù)據(jù)庫SQLServer2000+FastTrendsDatabase
操作系統(tǒng)Windows2000SP4Server+Aix4.3.3
Web服務器軟件IIS5.0+Apache3.0
瀏覽器軟件IE5.5
網(wǎng)頁制作Frontpage2000+javascript
ASP工具EditplusTextEditor
編程語言VisualBasic6.0
圖表軟件Excel2000
(4)程序流程與代碼實現(xiàn)
該系統(tǒng)由main.asp(主界面程序)、flux.asp(小時、日、星期流量分析)、target.asp(被訪頁面分析)、visitor.asp(來訪讀者分析)、chart.asp(統(tǒng)計分析圖表)五個組成。
我們以“被訪頁面分析”模塊的程序流程和代碼說明系統(tǒng)組成模塊的實現(xiàn)過程,該模塊程序流程圖如圖4。
“被訪頁面分析”程序流程圖
相應代碼:
。紅able
。紅dclass=定義的表格形式及表頭>
Setconn=server.creatobjectl("adodb.connection")
conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"
Setre=server.creatobject("adodb.recorderset")
re.activeconnection=conn
dbname=Application("logtime")——數(shù)據(jù)表名稱
re.open“QL語句”
dowhilenotre.eof
執(zhí)行Recordset操作,服務器進行統(tǒng)計計算
response.write——寫入統(tǒng)計表
re.movenext
loop
re.close
程序中一些代碼說明:
、賀ecordset的Open方法:允許用戶向數(shù)據(jù)庫發(fā)出請求,通常是運行sql命令。如:Sqlquery="selectlogtimefromintemetlogwhereday(logtime)=day(getdate())andmonth(logtime)=month(getdate())andyear(logtime)=year(getdate())"Dbrs.opensqlquery,dbconnection,3,3
②Recordset的RecordCount屬性:可以取得當前在Recordset對象中的記錄條數(shù)。如:setdbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount
③Recordset的MoveNext方法:移動指針到Recordset對象的下一條數(shù)據(jù)。如:Dbrs.movenext
、躌esponse的Write方法:負責將字符串信息輸出的用戶端。如:Response.write“頁面總訪問量:“&amount&”<br>
、軷ecordset的Close方法:可以用來關閉指定的Recordset對象。如:Dbrs.close
1.6系統(tǒng)運行過程
下面以西安交通大學圖書館網(wǎng)站為統(tǒng)計分析對象說明該系統(tǒng)運行過程。
首先我們用FTP工具抓取網(wǎng)址為的服務器,時間段為2003/01/01到2003/12/31的訪問日志導入到數(shù)據(jù)庫中,該服務器完成圖書館網(wǎng)站的部分功能:門戶信息、OPAC、館際互借、電子期刊、網(wǎng)絡數(shù)據(jù)庫、網(wǎng)絡資源、參考服務等。
對日志分析系統(tǒng)進行運行參數(shù)設置:讀者訪問時間間隔設為20分鐘;從最新QQ顯IP版軟件中導出讀者IP地址分配資料,轉(zhuǎn)換格式后導入到日志分析系統(tǒng)的地址表中,以便對讀者分群;設置過濾規(guī)格文件濾掉一些無用的訪問信息,如背景圖片、圖書館Logo,頁面美化圖片和服務器漏洞掃描日志等日志信息,然后對服務器訪問日志進行初步統(tǒng)計分析,保存統(tǒng)計分析結(jié)果準備進行進一步統(tǒng)計分析。
最后利用精致多樣的統(tǒng)計分析方法對初步統(tǒng)計結(jié)果進行統(tǒng)計分析,統(tǒng)計分析出的數(shù)據(jù)有:一年內(nèi)資源點擊與訪問計數(shù);一年內(nèi)網(wǎng)站中最常使用的資源與服務;一年內(nèi)點擊次數(shù)最多的讀者;一年內(nèi)務分群讀者的點擊次數(shù)比例;一年內(nèi)點擊次數(shù)與閱讀次數(shù)的變化;一年內(nèi)上網(wǎng)的讀者與累積成長趨勢;一周各天的平均點擊次數(shù);一天內(nèi)各時段的平均點擊次數(shù);校內(nèi)各區(qū)讀者點擊次數(shù)比例;各項相關資源被使用的情形等等。這些數(shù)據(jù)可用Eexel軟件生成直觀的統(tǒng)計分析圖表,部分圖表詳見實際應用一節(jié)中。本系統(tǒng)的研究主要采用訪問過程日志分析法,以內(nèi)容分析法、問卷調(diào)查法輔助研究。主要考慮:一是這種方法在電子商務和其它網(wǎng)絡應用的量化分析,已經(jīng)有許多研究成果,可使我們的研究更為便利;二是可以經(jīng)濟的,較具體客觀的分析到網(wǎng)絡讀者信息需求特性;三是通過定量的計算,定質(zhì)的分析,形成一種綜合分析的方式,以求分析結(jié)果更為客觀和科學。
2系統(tǒng)的實現(xiàn)
訪問量的多少是衡量網(wǎng)站是否成功的重要標準,但對于圖書館網(wǎng)站是遠遠不夠的,圖書館需要獲取完整的讀者訪問流量統(tǒng)計數(shù)據(jù),來對圖書館信息資源的使用情況進行分析,網(wǎng)絡信息計量學方法是目前網(wǎng)絡界普遍采用的網(wǎng)站績效評估計量法,被認為是可以用科學的方法檢驗網(wǎng)站訪問數(shù)據(jù)的一種工具。它的目的包括了解網(wǎng)絡讀者的行為、確定網(wǎng)站是否吸引適當?shù)淖x者來訪、評定網(wǎng)站建設策略是否得當。其實施步驟可分為三個階段:
(1)記錄網(wǎng)站的訪問數(shù)據(jù);
(2)分析記錄數(shù)據(jù);
(3)為網(wǎng)站建設策略的改進提供依據(jù)。
2.1系統(tǒng)原理
由于網(wǎng)絡發(fā)布站點和數(shù)據(jù)庫本身具備了訪問計量功能,各自的信息資源收藏狀況便于人們掌握,并且能自動記錄讀者訪問的登錄情況,如登錄名、登錄時間、瀏覽文件、讀者的來源地址等,這些數(shù)據(jù)資料能夠準確反映讀者訪問信息和來源分布等情況,所以依據(jù)圖書館網(wǎng)絡讀者訪問統(tǒng)計的工作內(nèi)容,制定相應的分析指標,并收集網(wǎng)絡讀者訪問圖書館信息資源發(fā)布站點形成的日志文件,然后利用日志統(tǒng)計工作軟件定時對日志文件進行處理,得到統(tǒng)計數(shù)據(jù),并動態(tài)生成各種表達形式的能滿足圖書館各項統(tǒng)計分析工作的報表。最后把生成的分析報表導入到發(fā)布數(shù)據(jù)庫中發(fā)布出去。
圖書館各個網(wǎng)絡資源站點建設人員可通過瀏覽網(wǎng)絡讀者訪問流量統(tǒng)計分析報告,分析和了解讀者的訪問需求,從而做好網(wǎng)絡信息資源的建設工作。
讀者行為分析研究則可通過對分析報告進行質(zhì)化研究,并結(jié)合一般調(diào)查法、咨詢研究法對讀者的信息尋求行為進行研究。
本系統(tǒng)還可利用統(tǒng)計分析的結(jié)果來對系統(tǒng)自身工作進行評估和調(diào)整。
2.2分析指標
傳統(tǒng)圖書館的分析指標和計量方法,雖然和數(shù)字化圖書館有很多不同,但使用的目的及計量的準則并沒有太大實質(zhì)性差異[4]。
參考傳統(tǒng)圖書館的分析指標以及國內(nèi)外類似的研究結(jié)果選定了下列10個分析指標:
(1)讀者到訪人數(shù)和潛在讀者人數(shù)的百分比;
(2)到訪讀者表現(xiàn)了閱讀的興趣的百分比(采取明顯的閱讀行動);
(3)可能的讀者轉(zhuǎn)為經(jīng)常的讀者的百分比(經(jīng)常閱讀、下載資料);
(4)讀者的持續(xù)度(重復到訪讀者);
(5)讀者的忠誠度(網(wǎng)頁瀏覽次數(shù)、再度到訪的次數(shù)及時間長度);
(6)讀者停止閱讀行為的百分比(閱讀行為半途中止);
(7)讀者耗損率(現(xiàn)有讀者中停止閱讀行為者的百分比);
(8)讀者動搖率(耗損的讀者/到訪讀者的總數(shù));
(9)讀者最近到訪時間(據(jù)上次到訪的間隔時間);
(10)讀者到訪頻率(多久到訪一次)。
就此參數(shù),我們可以從一個客觀的角度來觀察和評估圖書館網(wǎng)絡讀者訪問情況。
2.3系統(tǒng)框圖
網(wǎng)絡讀者流量統(tǒng)計分析系統(tǒng)功能框圖
2.4工作方法
本系統(tǒng)工作方法主要是采集網(wǎng)絡讀者訪問過程日志進行量化分析法,它的優(yōu)缺點見表1。
讀者訪問過程日志分析法優(yōu)缺點
量化分析法重視量的分析,本系統(tǒng)通過對訪問過程日志以量的方法加以統(tǒng)計分析,首先根據(jù)為了研究讀者需求分布和需求增長情況這一目的將研究內(nèi)容歸類成若干分析單元,接著將分析單元以數(shù)量的方式加以表達,進而以此為解釋讀者信息尋求行為的依據(jù)。
2.5技術實現(xiàn)
(1)系統(tǒng)結(jié)構(gòu)
本系統(tǒng)是以瀏覽器/服務器/數(shù)據(jù)庫體系結(jié)構(gòu)作為基本架構(gòu),通過ASP方式實現(xiàn)交互式、動態(tài)的讀者訪問日志統(tǒng)計分析系統(tǒng)。系統(tǒng)結(jié)構(gòu)框架如圖2所示:
讀者訪問日志統(tǒng)計分析系統(tǒng)結(jié)構(gòu)框圖
(2)系統(tǒng)組成模塊
本系統(tǒng)有六個模塊組成:訪問日志入庫、訪問流量分析、被訪頁面分析、來訪讀者分析和統(tǒng)計分析圖表。
(3)系統(tǒng)運行環(huán)境與開發(fā)平臺
本系統(tǒng)運行環(huán)境和開發(fā)平臺如表2。
讀者訪問日志統(tǒng)計分析系統(tǒng)模塊
(4)程序流程與代碼實現(xiàn)
該系統(tǒng)由main.asp(主界面程序)、flux.asp(小時、日、星期流量分析)、target.asp(被訪頁面分析)、visitor.asp(來訪讀者分析)、chart.asp(統(tǒng)計分析圖表)五個組成。
我們以“被訪頁面分析”模塊的程序流程和代碼說明系統(tǒng)組成模塊的實現(xiàn)過程,該模塊程序流程圖如圖4。
“被訪頁面分析”程序流程圖
相應代碼:
。紅able
。紅dclass=定義的表格形式及表頭>
Setconn=server.creatobjectl("adodb.connection")
conn.open"dsn=dsn_dbs;uid=xxx;pwd=xxx"
Setre=server.creatobject("adodb.recorderset")
re.activeconnection=conn
dbname=Application("logtime")——數(shù)據(jù)表名稱
re.open“QL語句”
dowhilenotre.eof
執(zhí)行Recordset操作,服務器進行統(tǒng)計計算
response.write——寫入統(tǒng)計表
re.movenext
loop
re.close
程序中一些代碼說明:
、賀ecordset的Open方法:允許用戶向數(shù)據(jù)庫發(fā)出請求,通常是運行sql命令。如:Sqlquery="selectlogtimefromintemetlogwhereday(logtime)=day(getdate())andmonth(logtime)=month(getdate())andyear(logtime)=year(getdate())"Dbrs.opensqlquery,dbconnection,3,3
、赗ecordset的RecordCount屬性:可以取得當前在Recordset對象中的記錄條數(shù)。如:setdbrs=server.createobject("ADODB.recordset")amount=dbrs.recordcount
、跼ecordset的MoveNext方法:移動指針到Recordset對象的下一條數(shù)據(jù)。如:Dbrs.movenext
、躌esponse的Write方法:負責將字符串信息輸出的用戶端。如:Response.write“頁面總訪問量:“&amount&”<br>
、軷ecordset的Close方法:可以用來關閉指定的Recordset對象。如:Dbrs.close
2.6系統(tǒng)運行過程
下面以西安交通大學圖書館網(wǎng)站為統(tǒng)計分析對象說明該系統(tǒng)運行過程。
首先我們用FTP工具抓取網(wǎng)址為的服務器,時間段為2003/01/01到2003/12/31的訪問日志導入到數(shù)據(jù)庫中,該服務器完成圖書館網(wǎng)站的部分功能:門戶信息、OPAC、館際互借、電子期刊、網(wǎng)絡數(shù)據(jù)庫、網(wǎng)絡資源、參考服務等。
對日志分析系統(tǒng)進行運行參數(shù)設置:讀者訪問時間間隔設為20分鐘;從最新QQ顯IP版軟件中導出讀者IP地址分配資料,轉(zhuǎn)換格式后導入到日志分析系統(tǒng)的地址表中,以便對讀者分群;設置過濾規(guī)格文件濾掉一些無用的訪問信息,如背景圖片、圖書館Logo,頁面美化圖片和服務器漏洞掃描日志等日志信息,然后對服務器訪問日志進行初步統(tǒng)計分析,保存統(tǒng)計分析結(jié)果準備進行進一步統(tǒng)計分析。
最后利用精致多樣的統(tǒng)計分析方法對初步統(tǒng)計結(jié)果進行統(tǒng)計分析,統(tǒng)計分析出的數(shù)據(jù)有:一年內(nèi)資源點擊與訪問計數(shù);一年內(nèi)網(wǎng)站中最常使用的資源與服務;一年內(nèi)點擊次數(shù)最多的讀者;一年內(nèi)務分群讀者的點擊次數(shù)比例;一年內(nèi)點擊次數(shù)與閱讀次數(shù)的變化;一年內(nèi)上網(wǎng)的讀者與累積成長趨勢;一周各天的平均點擊次數(shù);一天內(nèi)各時段的平均點擊次數(shù);校內(nèi)各區(qū)讀者點擊次數(shù)比例;各項相關資源被使用的情形等等。這些數(shù)據(jù)可用Eexel軟件生成直觀的統(tǒng)計分析圖表,部分圖表詳見實際應用一節(jié)中。本系統(tǒng)的研究主要采用訪問過程日志分析法,以內(nèi)容分析法、問卷調(diào)查法輔助研究。主要考慮:一是這種方法在電子商務和其它網(wǎng)絡應用的量化分析,已經(jīng)有許多研究成果,可使我們的研究更為便利;二是可以經(jīng)濟的,較具體客觀的分析到網(wǎng)絡讀者信息需求特性;三是通過定量的計算,定質(zhì)的分析,形成一種綜合分析的方式,以求分析結(jié)果更為客觀和科學。
3實際應用
從2002年開始,我們從圖書館門戶網(wǎng)站讀者訪問計數(shù)開始了網(wǎng)絡讀者訪問統(tǒng)計工作,從最初的圖書館首頁訪問計數(shù)到現(xiàn)在應用網(wǎng)絡讀者訪問流量統(tǒng)計分析系統(tǒng)到以信息資源發(fā)布站點、數(shù)據(jù)庫為單元的訪問利用上,取得了不少研究成果,下面我們介紹以2003年西安交通大學圖書館網(wǎng)站讀者訪問日志為統(tǒng)計對象,獲得的一些統(tǒng)計分析結(jié)果。
表3是2003年圖書館網(wǎng)站的資源瀏覽次數(shù),訪問次數(shù)與訪問讀者數(shù)的統(tǒng)計表,我們看到一年內(nèi)資源的瀏覽次數(shù)是10,222,296,訪問次數(shù)是1,617,166,訪問讀者是310,628,對照2003年西安交大統(tǒng)計公報教職工5341人,在校學生32766人的數(shù)據(jù)表明圖書館網(wǎng)站有很高的訪問量。另外網(wǎng)絡訪問讀者310,628遠遠大于學生和教職工的總和,表明有相當多的讀者使用本館的資源,這說明本館的信息資源豐富,吸引了很多讀者。網(wǎng)站不足之處是自建的外文資源很少。從表3看,來自國內(nèi)訪問占6.43%,來自國外訪問占0.01%。綜合以上資料,西安交大圖書館網(wǎng)站為校內(nèi)外讀者提供了方便、豐富的資源服務,吸引了大量的讀者,但在國外的知名度很低,現(xiàn)有資源不能吸引國外讀者,對此圖書館采取一些措施,來解決這個問題。
接著我們看一年間網(wǎng)絡讀者常使用的網(wǎng)站資源與服務,圖5顯示的是讀者最常使用的前十項網(wǎng)站資源與服務以及它們占全部瀏覽次數(shù)的百分比。從圖中我們觀察到前十項占了訪問量的43%,第一項是圖書館首頁,然后依次是網(wǎng)絡數(shù)據(jù)庫、聯(lián)機公共目錄查詢、中國期刊網(wǎng)……,這說明圖書館網(wǎng)站的資源內(nèi)容設計與規(guī)劃合理,讀者訪問資源方便,相關信息更新及時,受到了讀者的歡迎。另外,網(wǎng)絡數(shù)據(jù)庫和聯(lián)機公共目錄訪問比例接近說明讀者并重利用印刷型資源和數(shù)宇化資源,數(shù)字化資源對科研和教學的作用日益明顯。從圖5中我們還觀察到所有的電子數(shù)據(jù)庫訪問所占比例值呈現(xiàn)出指數(shù)下降的.趨勢,這說明較少數(shù)數(shù)據(jù)庫的訪問量較大,而較多數(shù)數(shù)據(jù)庫訪問量較少,根據(jù)這個特點,圖書館在采購數(shù)據(jù)庫時可采取不同的采購策略,對于使用量大的數(shù)據(jù)庫保證數(shù)據(jù)的更新量和連續(xù)性,則可滿足約80%的讀者信息需求,對于較多的使用量少的數(shù)據(jù)庫可采用合伙采購共同使用的辦法,來滿足約20%的讀者信息需求。
圖書館網(wǎng)站前十名資源與服務以及它們占全部訪問次數(shù)的比例(01/01/2003-12/31/2003)
接下來我們來分析常訪問的讀者及其來源,首先,圖6中表示網(wǎng)絡讀者訪問次數(shù)的分布,從圖6中可以看出75.15%的讀者只訪問過一次,9.86%的讀者訪問過兩次,6.49%的讀者則經(jīng)常訪問圖書館網(wǎng)站,這說明作為一個為大學教育和科研服務的信息中心,圖書館的網(wǎng)絡資源已經(jīng)有了固定的讀者,但還有大量讀者的信息需求不能滿足,為此圖書館通過參加一些文獻信息資源建設項目和組織,如中國高等教育文獻保障體系(CALIS),陜西省科技情報協(xié)作網(wǎng)等,以便獲取更多優(yōu)質(zhì)的文獻信息資源,增強圖書館文獻信息資源的保障能力。另外,圖書館信息資源大多數(shù)有訪問權的限制,校外的讀者無法接觸到,為此圖書館采取了一些辦法,如建立電子數(shù)據(jù)庫導航庫,電子期刊導航庫,提供文獻傳遞等服務來滿足校外讀者的信息需求。表4是常來圖書館網(wǎng)站的讀者統(tǒng)計數(shù)據(jù),可以觀察到前二十名讀者絕大部分是西安交大校園網(wǎng)的讀者占全部來訪數(shù)的4.61%。如果以其上網(wǎng)所屬機構(gòu)來劃分來訪的網(wǎng)絡讀者,圖7是前十名各類機構(gòu)網(wǎng)絡讀者的訪問。從圖7中,我們可以清楚的看到本校的用戶占73%,其中來自科學館的訪問占3.23%,圖書館的讀者占3.18%,西一樓的2.34%,可見西安交大的校園網(wǎng)比較普及,讀者能夠很方便的進入圖書館資源網(wǎng)站,這也表示圖書館提供給讀者閱讀電子資源的電子閱覽室滿足了讀者需要。在圖7中數(shù)據(jù)顯示,外校的讀者也經(jīng)常訪問圖書館網(wǎng)站,如西安理工大學的讀者占0.33%,長安大學的占0.31%,北京大學的占0.05%,西北工業(yè)大學的占0.17%,上海交大占0.08%等等,這些讀者主要使用聯(lián)機公共目錄查詢和使用自建數(shù)據(jù)庫,這說明高校間的信息共享正在發(fā)展,圖書館應該加強自建特色數(shù)據(jù)庫的建設,增強文獻傳遞和館際互借服務,滿足這些讀者的信息需求。
接下來我們來觀察各類讀者在每個月訪問網(wǎng)絡資源的比例變化圖,見圖8是各類網(wǎng)絡讀者訪問前十名網(wǎng)絡資源的變化圖,總體訪問變化的趨勢和學校的校歷安排有明顯的關系,每個數(shù)據(jù)庫的訪問量變化則和各類讀者的信息需求不同有關系。這反映了讀者的結(jié)構(gòu)影響著網(wǎng)站的使用情形。
網(wǎng)絡讀者訪問圖書館網(wǎng)站次數(shù)分布(01/01/2003-12/31/2003)
前十名各類主機訪問圖書館網(wǎng)站的訪問次數(shù)(01/01/2003-12/31/2003)
各類網(wǎng)絡讀者對前十名網(wǎng)絡資源訪問變化圖(01/01/2003-12/31/2003)
由于篇幅有限,我們簡單介紹了本系統(tǒng)對圖書館網(wǎng)站網(wǎng)絡讀者訪問流量的統(tǒng)計分析結(jié)果,在以上的討論中,可以觀察到讀者利用網(wǎng)絡信息資源是聯(lián)機公共目錄檢索和信息檢索并重,且大部分讀者是本校的。
通過上述討論,我們知道本系統(tǒng)還有許多值得進一步研究之處,下一步的研究方向是收集更完整的讀者訪問日志,包括更長期的和所有與圖書館資源訪問相關的。并且嘗試利用精致的統(tǒng)計方法來分析,以達到對網(wǎng)絡讀者行為更精確的解讀。
4結(jié)語
經(jīng)實際應用證明,該系統(tǒng)對我館信息資源建設起到了重要的促進作用。首先,在控制我館信息資源存放空間問題上,雖然目前看來效果不明顯,但如果越來越多的信息資源雜亂無章地占據(jù)信息空間,將會大大降低信息檢索的效率,干擾核心信息源的利用。本系統(tǒng)可以提供調(diào)整信息存放的定量依據(jù),在探明各類型信息資料數(shù)量特征的基礎上,分析其增長和老化規(guī)律,判斷信息的價值和時效性,使有價值的信息充分地發(fā)揮作用,使信息空間得到有效的利用。
其次,在“以人為本”的理念指導下,圖書館走出了單純提供館藏信息資源為中心的定位,著眼于滿足讀者廣泛的信息需求。在本系統(tǒng)的指導下能實現(xiàn)這個目標:一是根據(jù)信息資源規(guī)律反映出的學術動態(tài)和信息利用規(guī)律反映出的需求動態(tài),指導圖書館的館藏資源建設。二是通過對信息資源利用規(guī)律的研究,使計算機信息檢索系統(tǒng)走向科學化、規(guī)范化,從而方便用戶查詢。
在整個研究過程中,取得了一些研究成果,也發(fā)現(xiàn)有不少問題等待我們進一步的研究,首先是無法取得確實充分的數(shù)據(jù),主要問題是圖書館提供的網(wǎng)絡數(shù)據(jù)庫是聯(lián)接到廠商的數(shù)據(jù)庫中去檢索的。如果圖書館自己沒有服務主機,那么就要請廠商提供訪問數(shù)據(jù),雖然廠商都會提供月報表,但是能夠判讀的資料不多,或是他提供的數(shù)據(jù)不標準,或是他提供資料不是圖書館想要的。其次不易解釋數(shù)據(jù),有了訪問過程記錄數(shù)據(jù),可是怎么去解釋它?讀者從哪里來,做什么,這個比較容易解釋,可是要知道讀者做某件事的動機,就沒有辦法從數(shù)據(jù)中去解釋了。
【網(wǎng)絡讀者訪問流量統(tǒng)計分析的論文】相關文章:
MBA學位論文的讀者論文03-23
MBA學位論文的讀者論文01-20
訪問學者項目管理的論文06-13
現(xiàn)金流量的作用與分析論文06-11
現(xiàn)金流量管理論文04-01
《讀者》的讀者08-05
業(yè)務匹配決定流量價值議論文03-22
業(yè)務匹配決定流量價值議論文09-22