1. <rp id="zsypk"></rp>

      2. 網(wǎng)對(duì)網(wǎng)和Web數(shù)據(jù)挖掘在搜索引擎中的運(yùn)用論文

        時(shí)間:2021-05-14 13:25:36 論文 我要投稿

        網(wǎng)對(duì)網(wǎng)和Web數(shù)據(jù)挖掘在搜索引擎中的運(yùn)用論文

          摘 要:當(dāng)今網(wǎng)絡(luò)信息技術(shù)日益發(fā)展,傳統(tǒng)意義上的搜索引擎更加難以滿足廣大用戶日益增長(zhǎng)的信息檢索需求。在這種趨勢(shì)下,智能技術(shù)在搜索引擎中的應(yīng)用顯得越來(lái)越重要。只有將智能技術(shù)引進(jìn)搜索引擎,才能提高用戶的工作效率,滿足人們?nèi)找嬖鲩L(zhǎng)的客觀需求。主要介紹了如今搜索引擎的幾大分類,傳統(tǒng)搜索引擎需要改進(jìn)的不足以及兩大智能技術(shù)在搜索引擎中的應(yīng)用。在智能技術(shù)將會(huì)更加智能更加發(fā)達(dá)的未來(lái),搜索引擎也將不斷地更新和發(fā)展,為人們提供更加高效的搜索體驗(yàn)。

        網(wǎng)對(duì)網(wǎng)和Web數(shù)據(jù)挖掘在搜索引擎中的運(yùn)用論文

          關(guān)鍵詞:智能技術(shù);搜索引擎;網(wǎng)對(duì)網(wǎng)技術(shù);數(shù)據(jù)挖掘。

          搜索引擎是根據(jù)一定的策略,運(yùn)用特定的計(jì)算機(jī)程序來(lái)搜索互聯(lián)網(wǎng)上的信息,在對(duì)信息進(jìn)行組織和處理后,將處理后的結(jié)果顯示給用戶,是為用戶提供檢索服務(wù)的系統(tǒng)。而智能技術(shù)在搜索引擎中的實(shí)際應(yīng)用也越來(lái)越廣泛,不斷有新興的智能技術(shù),搜索引擎也不斷地結(jié)合這些智能技術(shù)來(lái)進(jìn)行自身的變革和發(fā)展。這是一個(gè)漸進(jìn)的過(guò)程。本文將詳細(xì)介紹 2 種智能技術(shù)在搜索引擎中的應(yīng)用。

          1.搜索引擎的分類。

          搜索引擎可分為以下 3 類:①全文搜索引擎。全文搜索引擎是最標(biāo)準(zhǔn)的搜索引擎,國(guó)外的主要代表是 Google,而國(guó)內(nèi)的主要代表則是百度。全文搜索引擎的主要原理是在互聯(lián)網(wǎng)中檢索與所查目標(biāo)相匹配的內(nèi)容,繼而建立數(shù)據(jù)庫(kù),按序排列并且將其展示給用戶。②目錄搜索引擎。從本質(zhì)來(lái)說(shuō),目錄搜索引擎其實(shí)不能算是真正的搜索引擎。只是將網(wǎng)站鏈接目錄分類,用戶并不需要輸入關(guān)鍵字,根據(jù)目錄就完全可以找到想要的.信息。目錄索引最具代表性的就是 Yahoo 和新浪索引。③元搜索引擎。元搜索引擎在接收用戶的搜索請(qǐng)求后,可以在各個(gè)搜索引擎上同時(shí)搜索,隨后將結(jié)果顯示給用戶。這一種搜索引擎的國(guó)內(nèi)代表是搜星搜索引擎。

          2.傳統(tǒng)搜索引擎相比網(wǎng)絡(luò)信息檢索的缺點(diǎn)。

          傳統(tǒng)搜索引擎作為用戶在互聯(lián)網(wǎng)進(jìn)行信息檢索的一個(gè)重要途徑,給廣大用戶提供了相當(dāng)大的便利,隨著互聯(lián)網(wǎng)的迅速發(fā)展,用戶對(duì)搜索引擎又提出了搜索速度更快、搜索效率更高等諸多要求。正是用戶的這些需求刺激著搜索引擎的快速發(fā)展。傳統(tǒng)搜索引擎越來(lái)越滿足不了用戶的需求,主要存在以下幾點(diǎn)不足:①搜索引擎從互聯(lián)網(wǎng)搜索的各種網(wǎng)頁(yè)水準(zhǔn)不一,存在著根本沒(méi)用或者暫時(shí)性的網(wǎng)頁(yè)。這嚴(yán)重加大了用戶檢索信息的困難程度,并且嚴(yán)重影響了檢索速度。②主流搜索引擎大多采用關(guān)鍵詞來(lái)檢索,由于用戶水平的差異,極少數(shù)可以總結(jié)出關(guān)鍵詞或關(guān)鍵詞組,以至于用戶搜索不到想要的內(nèi)容,從而加大了檢索難度。③每個(gè)搜索引擎覆蓋的范圍雖然不小,但與龐大的互聯(lián)網(wǎng)相比,簡(jiǎn)直是九牛一毛。④檢索的結(jié)果不準(zhǔn)確、不唯一,搜索結(jié)果為零或者為數(shù)萬(wàn)的情況時(shí)有發(fā)生。⑤不能智能搜索,難以滿足用戶深層次的需求。

          3.智能技術(shù)的運(yùn)用。

          由于傳統(tǒng)引擎的各種缺點(diǎn),用戶越來(lái)越渴望更好用、更便捷的搜索方式出現(xiàn)。在這種刺激下,智能技術(shù)在搜索引擎中的應(yīng)用大量出現(xiàn)。這使得搜索引擎需具有一定的智能化和理解能力。當(dāng)前主要有以下兩大智能技術(shù)。

          3.1 網(wǎng)對(duì)網(wǎng)技術(shù)。

          顧名思義,“網(wǎng)對(duì)網(wǎng)技術(shù)”就是網(wǎng)絡(luò)和網(wǎng)絡(luò)對(duì)應(yīng)起來(lái)的意思。這其中又要提到兩個(gè)概念了,是兩個(gè)單詞。一個(gè)單詞我們都相當(dāng)熟悉了--Internet.我們常說(shuō)的互聯(lián)網(wǎng),就是這個(gè)單詞。而在這里,這個(gè)單詞指的是一個(gè)信息網(wǎng)絡(luò),也就是我們所說(shuō)的網(wǎng)絡(luò)中的信息網(wǎng)。我們想要搜索什么東西時(shí),將它輸入搜索引擎中,引擎就會(huì)在這個(gè)網(wǎng)絡(luò)庫(kù)中查找,找到相關(guān)信息,然后呈現(xiàn)在我們面前。而另一個(gè)詞可能就有一些陌生了--Innernet.表面上看起來(lái)與 Internet 很像,英文詞典中并沒(méi)有這個(gè)詞,我們?cè)谶@里叫它“內(nèi)聯(lián)網(wǎng)”.與看起來(lái)更像數(shù)據(jù)庫(kù)的 Internet 比起來(lái),內(nèi)聯(lián)網(wǎng)更像是人類大腦的一個(gè)信息網(wǎng)絡(luò)。這里面不僅僅有我們生活和工作中所用到的各種各樣的信息,更重要的是,信息之間繁雜又緊密的聯(lián)系。就像我們?cè)谏钪泻退私涣,提到“小伙伴”這個(gè)詞,我們會(huì)想到其他與之有聯(lián)系的詞匯,比如“朋友”“同學(xué)”等。同樣的,當(dāng)提到“師父”,我們的大腦也會(huì)迅速聯(lián)想到“師門”“師生”這樣的相關(guān)詞匯。我們所說(shuō)的內(nèi)聯(lián)網(wǎng),它所著重的,也是信息與信息之間這樣息息相關(guān)的聯(lián)系。Internet 和 Innernet都是知識(shí)的網(wǎng)絡(luò),互聯(lián)網(wǎng)時(shí)代的信息社會(huì)發(fā)展日新月異,因此無(wú)論是哪個(gè)網(wǎng)絡(luò),其內(nèi)的信息都是不斷變化著的。人們將這個(gè)技術(shù)運(yùn)用在搜索引擎中,大大提高了搜索引擎的實(shí)用性。作為內(nèi)聯(lián)網(wǎng)的 Innernet 和 Internet 聯(lián)結(jié)起來(lái),運(yùn)用信息之間存在的各種各樣的聯(lián)系,將用戶輸入搜索引擎中,將復(fù)雜的聯(lián)系正確分割開(kāi),然后各自拓展出一些對(duì)人們而言有用的信息,將 Internet 中龐大、雜亂的信息進(jìn)行有序化的篩選和整理,最終將信息呈現(xiàn)在人們的眼前。這大大提高了搜索引擎的可操作性,縮短了人們不斷刪改語(yǔ)句來(lái)配合 Internet 的時(shí)間,自然也就提高了用戶的工作效率。

          3.2 Web 數(shù)據(jù)挖掘技術(shù)。

          數(shù)據(jù)挖掘作為一門交叉學(xué)科,其原理比較復(fù)雜,可以從龐大的數(shù)據(jù)中將更有用、更有新意的數(shù)據(jù)挖掘出來(lái),而 Web 挖掘,便是將數(shù)據(jù)挖掘和 Web 發(fā)展聯(lián)系起來(lái)。Web 數(shù)據(jù)挖掘有 3 種不同的挖掘形式,即內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用記錄的挖掘。

          3.2.1 內(nèi)容挖掘。

          內(nèi)容挖掘指的是從 Web 文檔中或是描述中挖掘,在網(wǎng)頁(yè)中進(jìn)行數(shù)據(jù)挖掘,其中包括文本、超鏈接、圖像和視頻等,而半結(jié)構(gòu)化的數(shù)據(jù)和無(wú)結(jié)構(gòu)的文本便是主要的挖掘?qū)ο蟆?/p>

          3.2.2 結(jié)構(gòu)挖掘。

          Web 結(jié)構(gòu)挖掘則是通過(guò)網(wǎng)頁(yè)中的超鏈接,發(fā)現(xiàn)其中信息之間的結(jié)構(gòu)及其緊密或稀疏的聯(lián)系。在平時(shí)上網(wǎng)時(shí),我們只能看到一個(gè)個(gè)的網(wǎng)頁(yè),打開(kāi)瀏覽或者關(guān)閉。但是在這些頁(yè)面的背后,其實(shí)隱藏著無(wú)數(shù)個(gè)結(jié)構(gòu)鏈接。Web 數(shù)據(jù)挖掘就能夠通過(guò)這些結(jié)構(gòu)上的鏈接,發(fā)現(xiàn)頁(yè)面與頁(yè)面、數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系,隨后對(duì)它們分類,以便為用戶提供含有相似信息的更多頁(yè)面,幫助用戶完善自己想要在搜索引擎中得到的信息。

          3.2.3 使用記錄的挖掘。

          與前兩者相比,Web 使用記錄的挖掘讓我們感覺(jué)更加熟悉,至少“使用記錄”4 個(gè)字是我們上網(wǎng)過(guò)程中能夠看到的。當(dāng)我們點(diǎn)擊一下搜索引擎的輸入框想要輸入文本時(shí),搜索引擎會(huì)自動(dòng)下拉出我們前幾次使用時(shí)所查詢的內(nèi)容,以便我們重復(fù)查看相似內(nèi)容的信息。搜索引擎有時(shí)也會(huì)為我們推薦一些內(nèi)容的信息。這些信息也會(huì)是我們所感興趣的一些內(nèi)容,是搜索引擎結(jié)合了我們之前的使用記錄,為我們提供感興趣的相類似的內(nèi)容。這些都是 Web 使用記錄挖掘在搜索引擎中的實(shí)用例子,但并不是全部。搜索引擎會(huì)從用戶的訪問(wèn)痕跡中挖掘出很多有意義的數(shù)據(jù),包括數(shù)據(jù)端、服務(wù)器端和代理端的數(shù)據(jù)。而其獲得這些數(shù)據(jù)的途徑又分為 KDD 和專業(yè)化追蹤。這些方法和深度的挖掘,使搜索引擎更加“智能”地了解用戶的興趣和需要。

          4.總結(jié)。

          搜索引擎是我們工作、學(xué)習(xí)和生活中必不可少的實(shí)用性技術(shù),正如一個(gè)調(diào)查中所顯示的,85%的人都是通過(guò)搜索引擎獲取到他們所需要的信息和所喜愛(ài)的網(wǎng)站,可見(jiàn)搜索引擎的重要性。隨著智能技術(shù)的不斷更新,人們的生活變得越來(lái)越智能,對(duì)搜索引擎的要求也會(huì)隨之越來(lái)越高,因此不斷利用新的技術(shù)完善和提高搜索引擎的智能性,是用戶的選擇,也是時(shí)代的選擇,是搜索引擎在現(xiàn)在和未來(lái)的發(fā)展中必然的趨勢(shì),且將一直持續(xù)下去。

          參考文獻(xiàn):

          [1]陳勇躍,張玉峰。智能技術(shù)在搜索引擎中的應(yīng)用[J].情報(bào)雜志,2004(02):2-3,6.

          [2]楊占華,楊燕。數(shù)據(jù)挖掘在智能搜索引擎中的應(yīng)用[J].微計(jì)算機(jī)信息,2006(12):244-246.

          [3]朱素媛,馬溪俊,梁昌勇。人工智能技術(shù)在搜索引擎中的應(yīng)用[J].合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2003(S1):657-661.

        【網(wǎng)對(duì)網(wǎng)和Web數(shù)據(jù)挖掘在搜索引擎中的運(yùn)用論文】相關(guān)文章:

        什么是以太網(wǎng)和以太網(wǎng)交換機(jī)02-22

        淺談歷史微故事在初中教學(xué)中的運(yùn)用論文12-13

        測(cè)試你對(duì)網(wǎng)購(gòu)的態(tài)度題目及答案01-16

        食物鏈和食物網(wǎng)課件設(shè)計(jì)05-09

        情感美文網(wǎng)04-18

        網(wǎng)教教育論文致謝(精選8篇)04-20

        網(wǎng)課的教學(xué)反思04-02

        網(wǎng)購(gòu)小學(xué)作文04-06

        《夏洛的網(wǎng)》教學(xué)設(shè)計(jì)04-03

        網(wǎng)投簡(jiǎn)歷的編寫要點(diǎn)02-24

        99热这里只有精品国产7_欧美色欲色综合色欲久久_中文字幕无码精品亚洲资源网久久_91热久久免费频精品无码
          1. <rp id="zsypk"></rp>