久久久久无码精品,四川省少妇一级毛片,老老熟妇xxxxhd,人妻无码少妇一区二区

提高網(wǎng)站在Google中的排名二)

  • 相關(guān)推薦

提高網(wǎng)站在Google中的排名(二)

提高網(wǎng)站在Google中的排名(二) 
 
 
  
如何突出關(guān)鍵詞:面向主題(Theme)的關(guān)鍵詞匹配
 Theme Engine正在逐步超過(guò)PR,成為結(jié)果排序中更主要的因素,可以比較一下以下現(xiàn)象: 
為什么查“新聞”,“汽車(chē)”之類(lèi)的文字,各種門(mén)戶網(wǎng)站的首頁(yè)不在第一位?要知道他們的頁(yè)面中都有相應(yīng)頻道的鏈接文字的 
一篇新聞頁(yè)面中,搜索引擎如何不通過(guò)模板匹配,自動(dòng)將新聞的主體和頁(yè)面中的頁(yè)頭,欄目導(dǎo)航條,頁(yè)尾等部分的內(nèi)容區(qū)分開(kāi)的? 
其實(shí)以上問(wèn)題都可以歸結(jié)為網(wǎng)頁(yè)內(nèi)容摘要的提取策略和關(guān)鍵詞在其中的命中:
首先將能夠描述一個(gè)頁(yè)面內(nèi)容的分成以下幾種類(lèi)型:

鏈入文字描述:inbound link text
http://www.searchenginedictionary.com/terms-inbound-link.shtml

HTML頁(yè)面標(biāo)題:title 好標(biāo)題一般會(huì)將頁(yè)面中最重要的關(guān)鍵詞放在最前面,比如:ABC-10型吸塵器 - XX家電城 
HTML內(nèi)容主體:content text 
鏈出文字:outbound link text

如果按照以下規(guī)則:
一個(gè)頁(yè)面中關(guān)鍵詞命中權(quán)重:鏈入文字 > HTML標(biāo)題文字 > HTML頁(yè)面主體內(nèi)容 >> 出鏈文字,以上現(xiàn)象就比較好解釋了。
鏈入文字是頁(yè)面上看不見(jiàn)的,但鏈入文字對(duì)被鏈接頁(yè)面有巨大的作用:在現(xiàn)代搜索引擎在關(guān)鍵詞匹配的過(guò)程中,匹配的過(guò)程不只看當(dāng)前頁(yè)面的內(nèi)容摘要:很大程度上,不只看這個(gè)網(wǎng)頁(yè)自己說(shuō)自己有什么內(nèi)容,還要看別人如何鏈接時(shí),如何描述你的網(wǎng)站別人怎么稱(chēng)呼你,比你自己說(shuō)自己更重要。。
比如查:“世界衛(wèi)生組織”,返回結(jié)果中有http://www.who.int/ 而這個(gè)頁(yè)面中是沒(méi)有中文的,之所以能匹配上,是因?yàn)楹芏噫溄铀闹形木W(wǎng)站使用了:<a >世界衛(wèi)生組織</a>,所以,這個(gè)頁(yè)面中不存在的中文關(guān)鍵詞也成為了頁(yè)面摘要的一部分。這樣一想,就可以知道鏈出鏈接的文字其實(shí)是為被鏈接的子頻道首頁(yè)或者內(nèi)容詳情頁(yè)服務(wù)的。對(duì)自身頁(yè)面的關(guān)鍵詞密度只有負(fù)面的影響,這也是Google建議一個(gè)頁(yè)面中鏈接不要超過(guò)100個(gè)的原因:他根本不索引100個(gè)鏈接以后的內(nèi)容。按照以上規(guī)則,搜索引擎將一篇新聞詳情頁(yè)中的新聞內(nèi)容提取出來(lái)就是把頁(yè)面上所有帶HTTP鏈接的文字都去掉,就是新聞的內(nèi)容部分了,更精確一些可以通過(guò)取最長(zhǎng)文本段落等策略實(shí)現(xiàn);而很多網(wǎng)站首頁(yè)或頻道首頁(yè)中幾乎全部都是鏈接,經(jīng)過(guò)搜索引擎分析的結(jié)果就是:什么內(nèi)容也沒(méi)有,能夠被命中的關(guān)鍵詞僅僅是別人鏈接你用的“網(wǎng)站首頁(yè)”和頻道標(biāo)題Title中的站點(diǎn)名稱(chēng)等的幾個(gè)關(guān)鍵詞,而頁(yè)面中其他的文字則遠(yuǎn)遠(yuǎn)不如相應(yīng)子頻道和具體內(nèi)容頁(yè)面的匹配度高,而搜索引擎能夠通過(guò)以上規(guī)則,讓用戶更快的直接定位到有具體內(nèi)容的內(nèi)容詳情頁(yè)面。因此希望通過(guò)一個(gè)首頁(yè),盡可能多的命中所有希望推廣的關(guān)鍵詞是不可能的。讓網(wǎng)頁(yè)盡可能多的進(jìn)入搜索引擎的索引,然后把握好整個(gè)網(wǎng)站的主題風(fēng)格是非常重要的,讓網(wǎng)站的主題關(guān)鍵詞能夠比較均勻的按照金字塔模式分布到網(wǎng)站中可以參考:網(wǎng)站的主題金字塔設(shè)計(jì)          網(wǎng)站名稱(chēng)(用戶通過(guò)1-2個(gè)抽象關(guān)鍵詞)
         /       \
    子頻道1   子頻道2 (用戶通過(guò)2-3個(gè)關(guān)鍵詞命中)
   /    \      /    \
產(chǎn)品1  產(chǎn)品2 文章1 文章2 (用戶通過(guò)3-4個(gè)關(guān)鍵詞命中:這種用戶最有價(jià)值)


不要空著標(biāo)題:空著<title></title>無(wú)異于浪費(fèi)了最有價(jià)值的一塊陣地;
傳統(tǒng)的頁(yè)面中,HTML頁(yè)面中會(huì)有類(lèi)似以下的隱含信息,用于說(shuō)明當(dāng)前網(wǎng)頁(yè)的主要內(nèi)容關(guān)鍵字:
<header>
    <meta name="keyword" content="mp3 download music...">
</header>
后來(lái)由于這種人工添加關(guān)鍵詞的方式被濫用,大量網(wǎng)頁(yè)中為了提高被搜索引擎命中的概率,經(jīng)常添加一些和實(shí)際網(wǎng)頁(yè)內(nèi)容無(wú)關(guān)的熱門(mén)關(guān)鍵比如:“music mp3 download”等,所以新一代的搜索引擎已經(jīng)不再關(guān)心頁(yè)面頭文件中的人工meta keyword聲明,而頁(yè)面標(biāo)題在搜索引擎的關(guān)鍵詞的命中命中過(guò)程中往往有著更高的比重,如果一個(gè)關(guān)鍵詞在標(biāo)題中命中會(huì)比在頁(yè)面中命中有更高的得分,從而在相應(yīng)的搜索結(jié)果排名中更靠前。 

 
標(biāo)題長(zhǎng)度和內(nèi)容:不要過(guò)長(zhǎng),一般在40個(gè)字符以?xún)?nèi),并充分突出關(guān)鍵詞的比重;
如果更長(zhǎng)的標(biāo)題搜索引擎一般會(huì)忽略掉,所以要盡可能將主要關(guān)鍵詞放在標(biāo)題靠前的位置。省略掉不必要的形容詞吧,畢竟用戶主要通過(guò)名詞來(lái)找到需要的內(nèi)容。標(biāo)題內(nèi)容:盡量用一些別人可以通過(guò)關(guān)鍵詞找到的字眼(也別太過(guò)頭,如果標(biāo)題中的字眼超過(guò)1半內(nèi)容中都沒(méi)有,有可能被搜索引擎排除出索引),因此基于web日志中來(lái)自其他搜索引擎的關(guān)鍵詞查詢(xún)統(tǒng)計(jì)非常必要。 
如果網(wǎng)頁(yè)很多的話,盡量使用不同的網(wǎng)頁(yè)標(biāo)題,爭(zhēng)取讓自己網(wǎng)站的內(nèi)容更多的進(jìn)入搜索引擎索引范圍;
因?yàn)樗阉饕鏁?huì)根據(jù)頁(yè)面內(nèi)容的相似度把一些內(nèi)容當(dāng)成重復(fù)頁(yè)面排除出索引范圍;
http://www.chedong.com/phpMan.php是我的網(wǎng)站上的一個(gè)小應(yīng)用:一個(gè)web界面的unix命令手冊(cè)(man page),在以前的設(shè)計(jì)中所有動(dòng)態(tài)頁(yè)面使用的都是同樣的標(biāo)題:"phpMan: man page /perldoc /info page web interface" ,Google索引了大約3000多個(gè)頁(yè)面,后來(lái)我將頁(yè)面標(biāo)題改成了"phpMan:  [命令名]"這樣的格式,比如:"phpMan: ls",這樣大部分動(dòng)態(tài)頁(yè)面的標(biāo)題就都不一樣了,一個(gè)月后Google從這個(gè)頁(yè)面入口索引了大約6000個(gè)頁(yè)面。因此,如果網(wǎng)站中很多網(wǎng)頁(yè)都使用相同的標(biāo)題,比如:“新聞?lì)l道”,“論壇”,這些頁(yè)面中很大一部分就會(huì)被排重機(jī)制忽略掉。 
除了<title></title>外,還可以用<h1></h1>標(biāo)題行突出內(nèi)容主題,加強(qiáng)標(biāo)題的效果;
在我的網(wǎng)站設(shè)計(jì)中:我會(huì)把用<h1>[標(biāo)題]</h1>這樣的模板把標(biāo)題突出顯示,而不是通過(guò)改變字體的方式突出標(biāo)題。 
其他網(wǎng)站設(shè)計(jì)提示
靜態(tài)鏈接:Blog網(wǎng)站另外一個(gè)優(yōu)勢(shì)在于其網(wǎng)頁(yè)是靜態(tài)鏈接:動(dòng)態(tài)網(wǎng)頁(yè)占到整個(gè)互聯(lián)網(wǎng)內(nèi)容的90%以上。各個(gè)搜索引擎其實(shí)能夠表現(xiàn)的都只不過(guò)是互聯(lián)網(wǎng)的冰山一角(3-5%),不同的只是誰(shuí)讓優(yōu)質(zhì)網(wǎng)頁(yè)排名靠前的策略更優(yōu)秀而已:大部分搜索引擎都認(rèn)為靜態(tài)鏈接的網(wǎng)頁(yè)是優(yōu)質(zhì)網(wǎng)頁(yè),Google在優(yōu)先抓取索引的網(wǎng)頁(yè)中70%以上是不帶參數(shù)鏈接的靜態(tài)網(wǎng)頁(yè)。而且即使同樣的內(nèi)容,靜態(tài)網(wǎng)頁(yè)也會(huì)比動(dòng)態(tài)網(wǎng)頁(yè)權(quán)重高:很容易理解:query?a=1&b=2這樣的鏈接由于參數(shù)順序顛倒的query?b=2&a=1完全相同。盡量使用靜態(tài)網(wǎng)頁(yè):目前能夠動(dòng)態(tài)網(wǎng)頁(yè)進(jìn)行全面的索引還比較難,而即使是Google也更不會(huì)索引所有的內(nèi)容,因此很少會(huì)對(duì)參數(shù)超過(guò)2個(gè)的動(dòng)態(tài)網(wǎng)頁(yè)進(jìn)行進(jìn)一步的抓取和分析。以下是一個(gè)phpBB論壇頁(yè)面返回的HTTP頭信息: 
HTTP/1.1 200 OK Date: Wed, 28 Jan 2004 12:58:54 GMT Server: Apache/1.3.29 (Unix) mod_gzip/1.3.26.1a PHP/4.3.4 X-Powered-By: PHP/4.3.4 Set-Cookie: phpBB_data=a%3A0%3A%7B%7D; expires=Thu, 27-Jan-2005 12:58:54 GMT; path=/; Set-Cookie: phpBB_sid=09f67a83ee108ecbf11e35bb6f36fcec; path=/; Content-Encoding: gzip Cache-Control: private, pre-check=0, post-check=0, max-age=0 Expires: 0 Pragma: no-cache Connection: close Content-Type: text/html 

為了避免隱私問(wèn)題:Googlebot可以通過(guò)對(duì)頁(yè)面http header中的session id和session cookie進(jìn)行一些甄別,這樣很多需要認(rèn)證信息的論壇內(nèi)容就無(wú)法進(jìn)入索引了。
總體上說(shuō)Google喜歡新的,靜態(tài)的內(nèi)容。因此無(wú)論從效率上講還是方便搜索引擎收錄:使用內(nèi)容發(fā)布系統(tǒng)將網(wǎng)站內(nèi)容發(fā)布成靜態(tài)網(wǎng)頁(yè)都是非常必要的,從某種程度上說(shuō)google friendly = anonymous cache friendly。
比如http://www.chedong.com/phpMan.php/man/intro/3
http://www.chedong.com/phpMan.php?mode=man&;parameter=intro§ion=3這樣的鏈接更容易進(jìn)入搜索引擎的索引。而且在URL中的命中也能突出關(guān)鍵詞。 
能夠進(jìn)入Google索引的頁(yè)面數(shù)量越多越好。用類(lèi)似以下的腳本可以統(tǒng)計(jì)自己的網(wǎng)站被搜索引擎索引的情況。 

#!/bin/sh YESTERDAY=`date -d yesterday +%Y%m%d` # for FreeBSD: YESTERDAY=`date -v-1d +%Y%m%d` LOG_FILE='/home/apache/logs/access_log' grep -i Googlebot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.googlebot.txt grep -i baiduspider $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.baiduspider.txt grep -i msnbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.msnbot.txt grep -i inktomi $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort | uniq -c | sort -rn > spider/$YESTERDAY.inktomi.txt grep -i openbot $LOG_FILE.$YESTERDAY|awk '{print $7}' |sort |uniq -c | sort -rn > spider/$YESTERDAY.openbot.txt 

網(wǎng)站目錄結(jié)構(gòu)要扁平,因?yàn)槊可钜患?jí)目錄,PAGERANK降低1-2個(gè)檔次。假設(shè)首頁(yè)是3,其子可能目錄就是1了,更深可能就無(wú)法列入評(píng)級(jí)范圍了。

表現(xiàn)和內(nèi)容的分離:“綠色”網(wǎng)頁(yè)
網(wǎng)頁(yè)中的javascript和css盡可能和網(wǎng)頁(yè)分離,一方面提高代碼重用度(也方便頁(yè)面緩存),另外一方面,由于有效內(nèi)容占網(wǎng)頁(yè)長(zhǎng)度的百分比高,也能提高相關(guān)關(guān)鍵詞在頁(yè)面中的比重也增加了?傊,應(yīng)該鼓勵(lì)遵循w3c的規(guī)范,使用更規(guī)范的XHTML和XML作為顯示格式便于內(nèi)容更長(zhǎng)時(shí)間的保存。 
讓所有的頁(yè)面都有能夠快速入口:站點(diǎn)地圖,方便網(wǎng)頁(yè)爬蟲(chóng)(spider)快速遍歷網(wǎng)站所有需要發(fā)布的內(nèi)容。如果首頁(yè)就是用Flash或圖片進(jìn)入的話,無(wú)異于將搜索引擎拒之門(mén)外,除了UI設(shè)計(jì)的用戶友好外,spider friendly也是非常重要的。 
保持網(wǎng)站自身的健康:經(jīng)常利用壞鏈檢查工具檢查網(wǎng)站中是否有死鏈。 
保持網(wǎng)頁(yè)內(nèi)容/鏈接的穩(wěn)定性和持久性:在搜索引擎索引中網(wǎng)頁(yè)存在的歷史也是一個(gè)比較重要的因素,而且歷史比較久的網(wǎng)頁(yè)被鏈接的幾率越高。為了保證自己網(wǎng)頁(yè)能夠被比較持久的被其他網(wǎng)站的頁(yè)面引用,如果自己網(wǎng)頁(yè)中有鏈接更新時(shí),最好能保留舊的頁(yè)面并做好鏈接轉(zhuǎn)向,以保持內(nèi)容的連續(xù)性。要知道,把一個(gè)網(wǎng)站和內(nèi)容在搜索引擎中的排名“培養(yǎng)”的很高是一件非常不容易的事情,誰(shuí)都不希望好不容易自己的內(nèi)容被別人找到了,點(diǎn)擊卻是“404 頁(yè)面不存在”吧,因此站點(diǎn)管理員對(duì)自身站點(diǎn)error.log的分析也是非常必要的。 
文件類(lèi)型因素:Google有對(duì)PDF, Word(Power Point, Excel), PS文檔的索引能力,由于這種文檔的內(nèi)容比一般的HTML經(jīng)過(guò)了更多的整理,學(xué)術(shù)價(jià)值一般比較高,所以這些類(lèi)型的文檔天生就比一般的HTML類(lèi)型的文檔 PageRank要高。因此,對(duì)于比較重要的文檔:技術(shù)白皮書(shū),F(xiàn)AQ,安裝文檔等建議使用PDF PS等高級(jí)格式存取,這樣在搜索結(jié)果中也能獲得比較靠前的位置。 
常常能發(fā)現(xiàn)門(mén)戶站點(diǎn)的一條新聞往往比其他站點(diǎn)的首頁(yè)排名還要靠前。因此一個(gè)站點(diǎn)總體PageRank提高了以后,往往自身一些并不重要的內(nèi)容也會(huì)被同那些高PageRank的內(nèi)容一起帶入被搜索引擎優(yōu)先查詢(xún)的列表中。這樣經(jīng)常造成很多大的開(kāi)發(fā)站點(diǎn)的郵件列表歸檔往往比其他站點(diǎn)的首頁(yè)P(yáng)ageRank還要高。

【提高網(wǎng)站在Google中的排名二)】相關(guān)文章:

淺析Google Earth在旅游景點(diǎn)展示中的應(yīng)用11-20

直放站在UMTS網(wǎng)絡(luò)規(guī)劃中的建模03-07

移動(dòng)智能網(wǎng)中的呼叫前轉(zhuǎn)02-25

試論如何發(fā)揮模擬電站在課程改革中的作用03-28

Openprocess在熱網(wǎng)監(jiān)控系統(tǒng)中的應(yīng)用01-11

高中美術(shù)課程中課堂效率的提高03-03

探析Openprocess在熱網(wǎng)監(jiān)控系統(tǒng)中的應(yīng)用01-07

談Openprocess在熱網(wǎng)監(jiān)控系統(tǒng)中的應(yīng)用01-14

雙向CATV網(wǎng)中控制信令的傳送01-07

國(guó)際貿(mào)易中商務(wù)英語(yǔ)談判素質(zhì)的提高03-19