搜索引擎的橫空出世,讓我們更容易使用互聯(lián)網(wǎng),十年前的信息爆炸言論現(xiàn)在已經(jīng)基本停息,這些都?xì)w功于搜索引擎,因?yàn)樾畔⒃俣,已?jīng)有搜索引擎幫我們分類整理,我們想要的時(shí)候只要輸入相關(guān)的關(guān)鍵詞就能夠找到相應(yīng)的信息,就不會(huì)再存在那種信息爆炸式的狀態(tài),找一個(gè)信息會(huì)把一個(gè)人折磨的半死!可見搜索引擎的貢獻(xiàn)和作用是多么的巨大!
我們平時(shí)找信息都是通過輸入數(shù)據(jù)來獲得,也就是我們常說的關(guān)鍵詞,搜索引擎對(duì)于輸入的關(guān)鍵詞是如何工作的,是直接通過這個(gè)詞來找,還是要把這些詞分開,進(jìn)行相關(guān)的比對(duì)再從數(shù)據(jù)庫中找,然后再根據(jù)這次詞來進(jìn)行排名,很多人對(duì)這個(gè)工作原理還不是很清楚,筆者因?yàn)樵赟EO優(yōu)化行業(yè)工作多年,對(duì)于搜索引擎的分詞原理也有了一定的了解,下面就把我的理解寫下來跟大家討論一下!
一:首先就是分詞,這是搜索引擎都要做的工作,因?yàn)槲覀冊谒阉骺蚶锩孑斎氲脑~有時(shí)候是短語,有時(shí)候就是一個(gè)完整的句子,很少是用詞組來直接搜索的,所以搜索引擎在正式工作之前要把輸入的短語或者句子進(jìn)行切分,然后把這些字符串變成詞組的組合,不能夠再分割了,然后在通過預(yù)處理的數(shù)據(jù)庫進(jìn)行查詢和比對(duì),把符合這些詞的數(shù)據(jù)返回給用戶,這個(gè)分詞其實(shí)和頁面分詞差不了多少!
二:去掉停止詞,所謂停止詞都是一些沒有實(shí)際意義的詞,比如一些啊,哦等等語氣詞,這些詞往往會(huì)在搜索的時(shí)候被輸入搜索框里面,此時(shí)搜索引擎在正式和數(shù)據(jù)庫比對(duì)的時(shí)候會(huì)把這些沒有意義的停止詞取消然后保證搜索的準(zhǔn)確性!
三:如何處理指令,對(duì)于搜索引擎處理搜索命令式,會(huì)把很多默認(rèn)的詞組變成一個(gè)短語來進(jìn)行搜索,這樣能夠保持較高的準(zhǔn)確性,比如你在搜索框里面輸入xx減肥xx網(wǎng)站,此時(shí)實(shí)際上被執(zhí)行的命令是減肥網(wǎng)站,而不是全部的xx減肥xx網(wǎng)站返回結(jié)果,但是往往會(huì)返回一些單獨(dú)的這些詞的內(nèi)容,比如單獨(dú)的減肥內(nèi)容等等!另外指令執(zhí)行的時(shí)候還要粗粒各種高級(jí)的搜索命令,比如特定的標(biāo)識(shí)符,如加減號(hào)等等!
四:對(duì)輸入詞的矯正,因?yàn)闈h字很多都有諧音,有時(shí)候?qū)懺~組還很容易出現(xiàn)錯(cuò)別字,這時(shí)候搜索引擎往往也能夠返回正確的結(jié)果來,這就是因?yàn)樗阉饕嬖诜衷~的過程中,將一些錯(cuò)別字給矯正過來了,而且在返回的結(jié)果頁面的上方還會(huì)出現(xiàn)糾正后的正確詞組出來!如圖:
五:分類區(qū)分對(duì)待,不同的詞語會(huì)不同的對(duì)待,這是搜索引擎的一個(gè)獨(dú)特功能,如果你搜索的一般的關(guān)鍵詞,那么返回的結(jié)果就是一般的網(wǎng)頁,而如果你搜索的是新聞熱詞或者明星關(guān)鍵詞時(shí)往往返回的就是相關(guān)的新聞源,所以搜索引擎在這方面的智能是相當(dāng)高的!
上面就是筆者對(duì)于搜索引擎對(duì)關(guān)鍵詞的工作原理從五個(gè)方面進(jìn)行了簡單的介紹,雖然這個(gè)原理對(duì)于我們做網(wǎng)站沒有直接的關(guān)系,但是在網(wǎng)站的優(yōu)化方面還是有很大幫助到,畢竟涉及到關(guān)鍵詞的分析和選擇,所以認(rèn)識(shí)這個(gè)原理對(duì)于我們個(gè)人站長們來說也是非常必要的!
標(biāo)簽Tags:
關(guān)鍵字:
搜索引擎分析關(guān)鍵詞,搜索引擎關(guān)鍵詞
|