1. <rp id="zsypk"></rp>

      2. 網(wǎng)對網(wǎng)和Web數(shù)據(jù)挖掘在搜索引擎中的運(yùn)用論文

        時間:2021-05-14 13:25:36 論文 我要投稿

        網(wǎng)對網(wǎng)和Web數(shù)據(jù)挖掘在搜索引擎中的運(yùn)用論文

          摘 要:當(dāng)今網(wǎng)絡(luò)信息技術(shù)日益發(fā)展,傳統(tǒng)意義上的搜索引擎更加難以滿足廣大用戶日益增長的信息檢索需求。在這種趨勢下,智能技術(shù)在搜索引擎中的應(yīng)用顯得越來越重要。只有將智能技術(shù)引進(jìn)搜索引擎,才能提高用戶的工作效率,滿足人們?nèi)找嬖鲩L的客觀需求。主要介紹了如今搜索引擎的幾大分類,傳統(tǒng)搜索引擎需要改進(jìn)的不足以及兩大智能技術(shù)在搜索引擎中的應(yīng)用。在智能技術(shù)將會更加智能更加發(fā)達(dá)的未來,搜索引擎也將不斷地更新和發(fā)展,為人們提供更加高效的搜索體驗(yàn)。

        網(wǎng)對網(wǎng)和Web數(shù)據(jù)挖掘在搜索引擎中的運(yùn)用論文

          關(guān)鍵詞:智能技術(shù);搜索引擎;網(wǎng)對網(wǎng)技術(shù);數(shù)據(jù)挖掘。

          搜索引擎是根據(jù)一定的策略,運(yùn)用特定的計算機(jī)程序來搜索互聯(lián)網(wǎng)上的信息,在對信息進(jìn)行組織和處理后,將處理后的結(jié)果顯示給用戶,是為用戶提供檢索服務(wù)的系統(tǒng)。而智能技術(shù)在搜索引擎中的實(shí)際應(yīng)用也越來越廣泛,不斷有新興的智能技術(shù),搜索引擎也不斷地結(jié)合這些智能技術(shù)來進(jìn)行自身的變革和發(fā)展。這是一個漸進(jìn)的過程。本文將詳細(xì)介紹 2 種智能技術(shù)在搜索引擎中的應(yīng)用。

          1.搜索引擎的分類。

          搜索引擎可分為以下 3 類:①全文搜索引擎。全文搜索引擎是最標(biāo)準(zhǔn)的搜索引擎,國外的主要代表是 Google,而國內(nèi)的主要代表則是百度。全文搜索引擎的主要原理是在互聯(lián)網(wǎng)中檢索與所查目標(biāo)相匹配的內(nèi)容,繼而建立數(shù)據(jù)庫,按序排列并且將其展示給用戶。②目錄搜索引擎。從本質(zhì)來說,目錄搜索引擎其實(shí)不能算是真正的搜索引擎。只是將網(wǎng)站鏈接目錄分類,用戶并不需要輸入關(guān)鍵字,根據(jù)目錄就完全可以找到想要的.信息。目錄索引最具代表性的就是 Yahoo 和新浪索引。③元搜索引擎。元搜索引擎在接收用戶的搜索請求后,可以在各個搜索引擎上同時搜索,隨后將結(jié)果顯示給用戶。這一種搜索引擎的國內(nèi)代表是搜星搜索引擎。

          2.傳統(tǒng)搜索引擎相比網(wǎng)絡(luò)信息檢索的缺點(diǎn)。

          傳統(tǒng)搜索引擎作為用戶在互聯(lián)網(wǎng)進(jìn)行信息檢索的一個重要途徑,給廣大用戶提供了相當(dāng)大的便利,隨著互聯(lián)網(wǎng)的迅速發(fā)展,用戶對搜索引擎又提出了搜索速度更快、搜索效率更高等諸多要求。正是用戶的這些需求刺激著搜索引擎的快速發(fā)展。傳統(tǒng)搜索引擎越來越滿足不了用戶的需求,主要存在以下幾點(diǎn)不足:①搜索引擎從互聯(lián)網(wǎng)搜索的各種網(wǎng)頁水準(zhǔn)不一,存在著根本沒用或者暫時性的網(wǎng)頁。這嚴(yán)重加大了用戶檢索信息的困難程度,并且嚴(yán)重影響了檢索速度。②主流搜索引擎大多采用關(guān)鍵詞來檢索,由于用戶水平的差異,極少數(shù)可以總結(jié)出關(guān)鍵詞或關(guān)鍵詞組,以至于用戶搜索不到想要的內(nèi)容,從而加大了檢索難度。③每個搜索引擎覆蓋的范圍雖然不小,但與龐大的互聯(lián)網(wǎng)相比,簡直是九牛一毛。④檢索的結(jié)果不準(zhǔn)確、不唯一,搜索結(jié)果為零或者為數(shù)萬的情況時有發(fā)生。⑤不能智能搜索,難以滿足用戶深層次的需求。

          3.智能技術(shù)的運(yùn)用。

          由于傳統(tǒng)引擎的各種缺點(diǎn),用戶越來越渴望更好用、更便捷的搜索方式出現(xiàn)。在這種刺激下,智能技術(shù)在搜索引擎中的應(yīng)用大量出現(xiàn)。這使得搜索引擎需具有一定的智能化和理解能力。當(dāng)前主要有以下兩大智能技術(shù)。

          3.1 網(wǎng)對網(wǎng)技術(shù)。

          顧名思義,“網(wǎng)對網(wǎng)技術(shù)”就是網(wǎng)絡(luò)和網(wǎng)絡(luò)對應(yīng)起來的意思。這其中又要提到兩個概念了,是兩個單詞。一個單詞我們都相當(dāng)熟悉了--Internet.我們常說的互聯(lián)網(wǎng),就是這個單詞。而在這里,這個單詞指的是一個信息網(wǎng)絡(luò),也就是我們所說的網(wǎng)絡(luò)中的信息網(wǎng)。我們想要搜索什么東西時,將它輸入搜索引擎中,引擎就會在這個網(wǎng)絡(luò)庫中查找,找到相關(guān)信息,然后呈現(xiàn)在我們面前。而另一個詞可能就有一些陌生了--Innernet.表面上看起來與 Internet 很像,英文詞典中并沒有這個詞,我們在這里叫它“內(nèi)聯(lián)網(wǎng)”.與看起來更像數(shù)據(jù)庫的 Internet 比起來,內(nèi)聯(lián)網(wǎng)更像是人類大腦的一個信息網(wǎng)絡(luò)。這里面不僅僅有我們生活和工作中所用到的各種各樣的信息,更重要的是,信息之間繁雜又緊密的聯(lián)系。就像我們在生活中和他人交流,提到“小伙伴”這個詞,我們會想到其他與之有聯(lián)系的詞匯,比如“朋友”“同學(xué)”等。同樣的,當(dāng)提到“師父”,我們的大腦也會迅速聯(lián)想到“師門”“師生”這樣的相關(guān)詞匯。我們所說的內(nèi)聯(lián)網(wǎng),它所著重的,也是信息與信息之間這樣息息相關(guān)的聯(lián)系。Internet 和 Innernet都是知識的網(wǎng)絡(luò),互聯(lián)網(wǎng)時代的信息社會發(fā)展日新月異,因此無論是哪個網(wǎng)絡(luò),其內(nèi)的信息都是不斷變化著的。人們將這個技術(shù)運(yùn)用在搜索引擎中,大大提高了搜索引擎的實(shí)用性。作為內(nèi)聯(lián)網(wǎng)的 Innernet 和 Internet 聯(lián)結(jié)起來,運(yùn)用信息之間存在的各種各樣的聯(lián)系,將用戶輸入搜索引擎中,將復(fù)雜的聯(lián)系正確分割開,然后各自拓展出一些對人們而言有用的信息,將 Internet 中龐大、雜亂的信息進(jìn)行有序化的篩選和整理,最終將信息呈現(xiàn)在人們的眼前。這大大提高了搜索引擎的可操作性,縮短了人們不斷刪改語句來配合 Internet 的時間,自然也就提高了用戶的工作效率。

          3.2 Web 數(shù)據(jù)挖掘技術(shù)。

          數(shù)據(jù)挖掘作為一門交叉學(xué)科,其原理比較復(fù)雜,可以從龐大的數(shù)據(jù)中將更有用、更有新意的數(shù)據(jù)挖掘出來,而 Web 挖掘,便是將數(shù)據(jù)挖掘和 Web 發(fā)展聯(lián)系起來。Web 數(shù)據(jù)挖掘有 3 種不同的挖掘形式,即內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用記錄的挖掘。

          3.2.1 內(nèi)容挖掘。

          內(nèi)容挖掘指的是從 Web 文檔中或是描述中挖掘,在網(wǎng)頁中進(jìn)行數(shù)據(jù)挖掘,其中包括文本、超鏈接、圖像和視頻等,而半結(jié)構(gòu)化的數(shù)據(jù)和無結(jié)構(gòu)的文本便是主要的挖掘?qū)ο蟆?/p>

          3.2.2 結(jié)構(gòu)挖掘。

          Web 結(jié)構(gòu)挖掘則是通過網(wǎng)頁中的超鏈接,發(fā)現(xiàn)其中信息之間的結(jié)構(gòu)及其緊密或稀疏的聯(lián)系。在平時上網(wǎng)時,我們只能看到一個個的網(wǎng)頁,打開瀏覽或者關(guān)閉。但是在這些頁面的背后,其實(shí)隱藏著無數(shù)個結(jié)構(gòu)鏈接。Web 數(shù)據(jù)挖掘就能夠通過這些結(jié)構(gòu)上的鏈接,發(fā)現(xiàn)頁面與頁面、數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系,隨后對它們分類,以便為用戶提供含有相似信息的更多頁面,幫助用戶完善自己想要在搜索引擎中得到的信息。

          3.2.3 使用記錄的挖掘。

          與前兩者相比,Web 使用記錄的挖掘讓我們感覺更加熟悉,至少“使用記錄”4 個字是我們上網(wǎng)過程中能夠看到的。當(dāng)我們點(diǎn)擊一下搜索引擎的輸入框想要輸入文本時,搜索引擎會自動下拉出我們前幾次使用時所查詢的內(nèi)容,以便我們重復(fù)查看相似內(nèi)容的信息。搜索引擎有時也會為我們推薦一些內(nèi)容的信息。這些信息也會是我們所感興趣的一些內(nèi)容,是搜索引擎結(jié)合了我們之前的使用記錄,為我們提供感興趣的相類似的內(nèi)容。這些都是 Web 使用記錄挖掘在搜索引擎中的實(shí)用例子,但并不是全部。搜索引擎會從用戶的訪問痕跡中挖掘出很多有意義的數(shù)據(jù),包括數(shù)據(jù)端、服務(wù)器端和代理端的數(shù)據(jù)。而其獲得這些數(shù)據(jù)的途徑又分為 KDD 和專業(yè)化追蹤。這些方法和深度的挖掘,使搜索引擎更加“智能”地了解用戶的興趣和需要。

          4.總結(jié)。

          搜索引擎是我們工作、學(xué)習(xí)和生活中必不可少的實(shí)用性技術(shù),正如一個調(diào)查中所顯示的,85%的人都是通過搜索引擎獲取到他們所需要的信息和所喜愛的網(wǎng)站,可見搜索引擎的重要性。隨著智能技術(shù)的不斷更新,人們的生活變得越來越智能,對搜索引擎的要求也會隨之越來越高,因此不斷利用新的技術(shù)完善和提高搜索引擎的智能性,是用戶的選擇,也是時代的選擇,是搜索引擎在現(xiàn)在和未來的發(fā)展中必然的趨勢,且將一直持續(xù)下去。

          參考文獻(xiàn):

          [1]陳勇躍,張玉峰。智能技術(shù)在搜索引擎中的應(yīng)用[J].情報雜志,2004(02):2-3,6.

          [2]楊占華,楊燕。數(shù)據(jù)挖掘在智能搜索引擎中的應(yīng)用[J].微計算機(jī)信息,2006(12):244-246.

          [3]朱素媛,馬溪俊,梁昌勇。人工智能技術(shù)在搜索引擎中的應(yīng)用[J].合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版),2003(S1):657-661.

        【網(wǎng)對網(wǎng)和Web數(shù)據(jù)挖掘在搜索引擎中的運(yùn)用論文】相關(guān)文章:

        什么是以太網(wǎng)和以太網(wǎng)交換機(jī)02-22

        淺談歷史微故事在初中教學(xué)中的運(yùn)用論文12-13

        測試你對網(wǎng)購的態(tài)度題目及答案01-16

        食物鏈和食物網(wǎng)課件設(shè)計05-09

        情感美文網(wǎng)04-18

        網(wǎng)教教育論文致謝(精選8篇)04-20

        網(wǎng)課的教學(xué)反思04-02

        網(wǎng)購小學(xué)作文04-06

        《夏洛的網(wǎng)》教學(xué)設(shè)計04-03

        網(wǎng)投簡歷的編寫要點(diǎn)02-24

        99热这里只有精品国产7_欧美色欲色综合色欲久久_中文字幕无码精品亚洲资源网久久_91热久久免费频精品无码
          1. <rp id="zsypk"></rp>