很多人知道要做SEO推廣,讓用戶透過搜尋得知你的產(chǎn)品。這主要的戰(zhàn)場就在Google搜尋引擎上,在寫內(nèi)容、制定關(guān)鍵字策略、SEO策略前,對于Google搜尋了解這三件前備知識,你將事半功倍,在策略上擁有更大的勝率贏過其他競品對手。
1.檢索Crawl(爬?。?/strong>
「檢索」是Google官方文件給的正式稱呼,我們通常稱其為「爬取」。
在爬取階段,指的是Google透過追蹤連接、讀取Sitemap等多種方法來發(fā)掘網(wǎng)址。Google這樣做目的是尋找新網(wǎng)頁,并為這些網(wǎng)頁建立索引。
然而網(wǎng)站要成功被Google索引(收錄),需要符合一些相關(guān)規(guī)則,或是你提交的文件告訴Google哪些網(wǎng)頁可以被索引。
這份文件叫「Robot.txt」。
每個(gè)網(wǎng)站都被規(guī)定需要有這份文件,通常這份文件就像是一個(gè)網(wǎng)站的門口放的導(dǎo)覽地圖,在Google檢索時(shí),告訴google哪里可以爬取、哪里不行。 常見的應(yīng)用場景:
在中國,當(dāng)?shù)啬刚Z為中文,你的Robot.txt就會(huì)請Google盡量避免爬取美國版本的網(wǎng)站。
2.索引Index(收錄)
「索引」是Google正式官方文件的稱呼,我們通常稱它為「收錄」。
成功被索引的網(wǎng)頁,會(huì)收錄于搜尋結(jié)果當(dāng)中。想打SEO排名戰(zhàn),當(dāng)然要讓你的網(wǎng)站被成功索引,讓潛在用戶透過搜尋找到你。
網(wǎng)站上線第一件事:檢查Google是否有收錄你
驗(yàn)證方法很簡單,直接在搜尋列打:site:(你的網(wǎng)址),如果有就會(huì)顯示啰。
如果沒被收錄,可能有以下常見原因:
盡管Google會(huì)自動(dòng)檢索世界上 大部分網(wǎng)站,但仍有漏網(wǎng)之魚。你可以主動(dòng)邀請Google來收錄你的網(wǎng)站,你可以提交sitemap給Google,而Google Search Console這項(xiàng)工具將能幫你順利提交。
Sitemap和Robot.txt的關(guān)系
Sitemap是個(gè)檔案,Google這類搜尋引擎會(huì)讀取Sitemap,知道要如何爬取您的網(wǎng)站信息。因此Sitemap的更新、維護(hù)和完整度會(huì)幫助Google降低檢索的負(fù)擔(dān),對SEO是重要而有幫助的。
而Robot.txt是一份文字文件,你可以在Robot.txt加入Sitemap,或是運(yùn)用Google Search Console直接提交你的Sitemap,都能幫助你的網(wǎng)頁被檢索。
Robot.txt和Noindex的差別
Robot.txt只能告訴Google可不可以爬取哪些頁面,但不能決定哪些內(nèi)容要不要被索引(收錄)進(jìn)Google。
如果你的網(wǎng)站有某些內(nèi)容不想被索引,這時(shí)就需要noindex這份指令文件。noindex有點(diǎn)像是你的網(wǎng)站政策,通常放于處。
3.演算
搜尋引擎的目的,是在最短的時(shí)間內(nèi),提供最符合使用者需求的相關(guān)結(jié)果。
如今網(wǎng)站生成的速度越來越快、越來越多,以往常討論到的算法類型可以明白,但不需過度針對和鉆研,目前Google算法的技術(shù)已進(jìn)展到相當(dāng)成熟的地步,不論是熊貓、企鵝或其他算法,都能夠做到「即時(shí)爬取」、「即時(shí)檢索」的地步,因此現(xiàn)在統(tǒng)稱為「核心算法」。
在這樣的情形下,我們該專注的,是提供優(yōu)質(zhì)的內(nèi)容給使用者,并盡量保持在技術(shù)上方便Google算法共同合作的協(xié)調(diào)性。(sitemap,Robot.txt等文件、網(wǎng)站政策和構(gòu)架清楚。)
結(jié)語
了解Google搜尋引擎運(yùn)作的原則,相信能在你生產(chǎn)內(nèi)容、擬定內(nèi)容策上有更清楚和全面的概念,擁有良好的地基,后端內(nèi)容的排名戰(zhàn)將打得更加精確、有效率。