超碰中文字幕在线_女人18毛片水真多18精品_色综合久久六月婷婷中文字幕_免费的av网站_国产视频久久久_精品久久久久久久久久久久久久久 _欧美最猛性xxxxx亚洲精品_欧美人妻一区二区_欧美美女激情18p_一区二区三区视频在线播放_欧美a视频在线观看_一区免费观看视频

或者

與Googbot的第一次約會:標(biāo)頭和壓縮

作者:胡舒君 瀏覽:4302 發(fā)布時(shí)間:2016-12-22
編輯 分享 評論 3


本文翻譯自:First date with the Googlebot: Headers and compression

谷歌機(jī)器人 -- 多么神奇的夢幻之舟!他了解我們的靈魂和各個(gè)組成部分。或許他并不尋求什么獨(dú)一無二的東西;他閱覽過其它數(shù)十億個(gè)網(wǎng)站(雖然我們也與其他搜索引擎機(jī)器人分享自己的數(shù)據(jù):)),但是就在今晚,作為網(wǎng)站和谷歌機(jī)器人,我們將真正地了解對方。

我知道第一次約會的時(shí)候,過分地分析從來就不是什么好主意。我們將通過一系列的文章,一點(diǎn)點(diǎn)地了解谷歌機(jī)器人:

我們的第一次約會(就在今晚):谷歌機(jī)器人發(fā)出的數(shù)據(jù)標(biāo)頭和他所留意到的文件格式是否適于被進(jìn)行壓縮處理;

判斷他的反應(yīng):響應(yīng)代碼(301s、302s),他如何處理重定向和If-Modified-Since;

下一步:隨著鏈接,讓他爬行得更快或者更慢(這樣他就不會興奮地過了頭)。

今晚只是我們的第一次約會……

***************

谷歌機(jī)器人: 命令正確應(yīng)答

網(wǎng)站: 谷歌機(jī)器人,你來了!

谷歌機(jī)器人:是的,我來了!


GET / HTTP/1.1

Host: example.com

Connection: Keep-alive

Accept: */*

From: googlebot(at)googlebot.com

User-Agent: Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Accept-Encoding: gzip,deflate


網(wǎng)站: 這些標(biāo)頭太炫了!無論我的網(wǎng)站在美國、亞洲還是歐洲,你都用同樣的標(biāo)頭爬行嗎?你曾經(jīng)用過其他標(biāo)頭嗎?


谷歌機(jī)器人: 一般而言,我在全球各地所用的標(biāo)頭都保持一致。我試圖從一個(gè)網(wǎng)站默認(rèn)的語言和設(shè)定出發(fā),搞清楚一個(gè)網(wǎng)頁究竟長得什么樣。有時(shí)候人們的用戶代理各不相同,例如Adsense讀取使用的是“Mediapartners-Google”:

User-Agent: Mediapartners-Google

或者對于圖像搜索:

User-Agent: Googlebot-Image/1.0

無線讀取的用戶代理因運(yùn)營商而異,而谷歌閱讀器RSS讀取則包含了訂閱者數(shù)量等額外信息。

我通常會避免Cookies(因此不存在所謂“Cookie:”標(biāo)頭),因?yàn)槲也⒉幌Mc具體對話有關(guān)的信息對內(nèi)容產(chǎn)生太大的影響。此外,如果某個(gè)服務(wù)器在動態(tài)URL而不是Cookies上使用對話ID,通常我都能識別出來,這樣就不用因?yàn)槊看螌υ扞D的不同而成千上萬遍地重復(fù)爬行同一個(gè)網(wǎng)頁。

網(wǎng)站:我的結(jié)構(gòu)非常復(fù)雜。我是用許多類型的文件。你的標(biāo)頭說:“Accept:*/*”。你會對所有的URL進(jìn)行收錄,還是自動過濾某些文件擴(kuò)展名?


谷歌機(jī)器人:這要取決于我想找什么。

如果我只是對常規(guī)的Web搜索進(jìn)行檢索,當(dāng)我看到指向MP3和視頻內(nèi)容的鏈接,我可能不會下載這些東西。類似地,如果我看到了一個(gè)JPG文件,處理方法自然 就與HTML或者PDF鏈接有所區(qū)別。例如JPG 的變動頻率往往比HTML低很多,所以我不太經(jīng)常檢查JPG的變動,以節(jié)約帶寬。同時(shí),如果我為谷歌學(xué)術(shù)搜索尋找鏈接,那么我對PDF文章的興趣就會遠(yuǎn)遠(yuǎn)高于對JPG文件的興趣。對于學(xué)者而言,下載涂鴉繪畫(例如JPG),或者是關(guān)于小狗玩滑板的視頻,是容易讓他們分散注意力的,你說對嗎?

網(wǎng)站:沒錯,他們可能會覺得被打擾到了。你的敬業(yè)精神令我佩服得五體投地。我自己就喜歡涂鴉繪畫(JPG),很難抗拒它們的誘惑力。

谷歌機(jī)器人:我也一樣。實(shí)際上我并不是一直都在做學(xué)問。如果我為搜索圖像而爬行,就會對JPG非常感興趣,碰到新聞,我會花大力氣考察HTML和它們附近的圖像。

還有很多擴(kuò)展名,例如exe、dll、zip、dmg等,它們對于搜索引擎而言,既數(shù)量龐大,又沒有多大用處。


網(wǎng)站:如果你看到我的URL“http://www.example.com/page1.LOL111”,(嗚噎著說)你會不會只是因?yàn)槔锩姘粗奈募U(kuò)展名就把它拒之門外呢?


谷歌機(jī)器人: 網(wǎng)站老兄,讓我給你講點(diǎn)背景知識吧。一個(gè)文件真正下載完成后,我會使用“內(nèi)容—類別”(Content-Type)標(biāo)頭來檢查它屬于HTML、圖像、文本還是別的什么東西。如果它是PDF、Word文檔或Excel工作表等特殊的數(shù)據(jù)類型,我會確認(rèn)它的格式是否合法有效,并從中抽取文本內(nèi)容。但是你永遠(yuǎn)也不能確定里面是否含有病毒。但是如果文檔或數(shù)據(jù)類型混亂不清,我除了把它們?nèi)拥糁猓矝]有什么更好的辦法。

所以,如果我爬行你的“http://www.example.com/page1.LOL111”URL并發(fā)現(xiàn)未知文件擴(kuò)展名時(shí),我可能會首先把它下載。 如果我從標(biāo)頭中無法弄清內(nèi)容類型,或者它屬于我們拒絕檢索的文件格式(例如MP3),那么只能把它放在一邊了。除此之外,我們會接著對文件進(jìn)行爬行。

網(wǎng)站:谷歌機(jī)器人,我很抱歉對你的工作風(fēng)格“雞蛋里挑骨頭”,但我注意到你的“Accept-Encoding”標(biāo)頭這樣說:

Accept-Encoding: gzip,deflate

你能跟我說說這些標(biāo)頭是怎么回事嗎?


谷歌機(jī)器人:當(dāng)然。所有的主流搜索引擎和WEB瀏覽器都支持對內(nèi)容進(jìn)行g(shù)zip壓縮,以節(jié)約帶寬。你或許還會碰到其它的一些類型,例如“x-gzip”(與“gzip”相同),“deflate”(我們也支持它)和“identity”(不支持)。


網(wǎng)站:你能更詳細(xì)地說說文件壓縮和“Accept-Encoding: gzip,deflate”嗎?我的許多URL都包含尺寸很大的Flash文件和美妙的圖像,不僅僅是HTML。如果我把一個(gè)比較大的文件加以壓縮,會不會有助于你更迅速地爬行呢?


谷歌機(jī)器人:對于這個(gè)問題,并沒有一個(gè)簡單的答案。首先,swf(Flash)、jpg、png、gif和pdf等文件格式本身已經(jīng)是壓縮過的了(而且還有專門的Flash 優(yōu)化器)。

網(wǎng)站:或許我已經(jīng)把自己的Flash文件進(jìn)行了壓縮,自己還不知道。很顯然,我的效率很高嘍。

谷歌機(jī)器人:Apache和IIS都提供了選項(xiàng),允許進(jìn)行g(shù)zip和deflate壓縮,當(dāng)然,節(jié)省帶寬的代價(jià)是對CPU資源的更多消耗。一般情況下,這項(xiàng)功能只適用于比較容易壓縮的文件,例如文本HTML/CSS/PHP內(nèi)容等。而且,只有在用戶的瀏覽器或者我(搜索引擎機(jī)器人)允許的情況下才可以使用。 就我個(gè)人而言,更傾向于“gzip”而不是“deflate”。Gzip的編碼過程相對可靠一些,因?yàn)樗粩嗟剡M(jìn)行加和檢查,并且保持完整的標(biāo)頭,不像 “deflate”那樣需要我在工作中不斷推測。除此之外,這兩種程序的壓縮算法語言都很相似。

如果你的服務(wù)器上有閑置的CPU資源,可以嘗試進(jìn)行壓縮(鏈接:Apache, IIS)。但是,如果你提供的是動態(tài)內(nèi)容,而且服務(wù)器的CPU已經(jīng)處于滿負(fù)荷狀態(tài),我建議你還是不要這樣做。


網(wǎng)站:很長見識。我很高興今晚你能來看我。感謝老天爺,我的robots.txt文件允許你能來。這個(gè)文件有時(shí)候就像對自己的子女過分保護(hù)的父母。


谷歌機(jī)器人:說到這里,該見見父母大人了——它就是robots.txt。我曾經(jīng)見過不少發(fā)瘋的“父母”。其中有些實(shí)際上只是HTML錯誤信息網(wǎng)頁,而不是有效的robots.txt。有些文件里充滿了無窮無盡的重定向,而且可能指向完全不相關(guān)的站點(diǎn)。另外一些體積龐大,含有成千上萬條單獨(dú)成行、各不相同的 URL。下面就是其中的一種有副作用的文件模式,在通常情況下,這個(gè)站點(diǎn)是希望我去爬行它的內(nèi)容的:

User-Agent: *

Allow: /

然而,在某個(gè)用戶流量的高峰時(shí)段,這個(gè)站點(diǎn)轉(zhuǎn)而將它的robots.txt切換到限制性極強(qiáng)的機(jī)制上:

# Can you go away for a while? I'll let you back

# again in the future. Really, I promise!

User-Agent: *

Disallow: /

上述robots.txt文件切換的問題在于,一旦我看到這種限制性很強(qiáng)的robots.txt,有可能使我不得不把索引中已經(jīng)爬行的該網(wǎng)站內(nèi)容舍棄掉。當(dāng)我再次被批準(zhǔn)進(jìn)入這個(gè)站點(diǎn)的時(shí)候,我不得不將原先的許多內(nèi)容重新爬行一遍,至少會暫時(shí)出現(xiàn)503錯誤相應(yīng)代碼。

一 般來說,我每天只能重新檢查一次robots.txt(否則,在許多虛擬主機(jī)站點(diǎn)上,我會將一大部分時(shí)間花在讀取robots.txt文件上,要知道沒有 多少約會對象喜歡如此頻繁地拜見對方父母的)。站長們通過robots.txt 切換的方式來控制爬行頻率是有副作用的,更好的辦法是用網(wǎng)站管理員工具將爬行頻率調(diào)至“較低”即可。


谷歌機(jī)器人: 網(wǎng)站老兄,謝謝你提出的這些問題,你一直做得很不錯,但我現(xiàn)在不得不說“再見,我的愛人”了。

網(wǎng)站:哦,谷歌機(jī)器人…(結(jié)束應(yīng)答):)


評論(0人參與,0條評論)

發(fā)布評論

最新評論

詞條統(tǒng)計(jì)

  • 瀏覽次數(shù):4302
  • 編輯次數(shù):0次歷史版本
  • 最近更新:2016-12-22
  • 創(chuàng)建者:胡舒君
  • 相關(guān)詞條

    相關(guān)問答

    相關(guān)百科

    相關(guān)資訊

    日韩亚洲综合在线| 老熟妇一区二区| 国产精品av在线| 日韩电视剧免费观看网站| 亚洲在线视频一区| 91免费国产在线观看| 婷婷综合激情网| 天天操天天干天天摸| 久久一级免费视频| 亚洲男人在线天堂| www.污网站| 成年人视频观看| 正在播放一区二区三区| 精品综合在线| 成人信息集中地欧美| 1769国产精品| 亚洲日本中文字幕免费在线不卡| 欧美日韩在线一区二区| 夜夜亚洲天天久久| 国产欧美一区二区精品性| 成a人片亚洲日本久久| 麻豆91精品视频| 日韩精品一卡二卡三卡四卡无卡| 国产免费不卡av| 亚洲av综合一区| 日韩精品一区二区不卡| 成人在线观看高清| 日韩欧美视频免费观看| 国产精品成av人在线视午夜片| 国产视频精品va久久久久久 | 91入口在线观看| 国产精品久久久久久久7电影| 97香蕉超级碰碰久久免费的优势 | 亚洲精品免费在线观看| 亚洲女同志亚洲女同女播放| 中文字幕+乱码+中文乱码91| 综合网在线观看| 99久久精品国产亚洲| 91日韩中文字幕| 欧美日韩精品一区二区三区视频播放| 日韩欧美黄色网址| 疯狂撞击丝袜人妻| 免费在线一区二区三区| 国产大片aaa| 久久久久久久久久久久久av| 波多野结衣在线观看一区| 18国产免费视频| 国产精品久久欧美久久一区| 久久综合精品国产一区二区三区| 免费看欧美黑人毛片| 亚洲缚视频在线观看| 欧美一级生活片| 日韩免费视频一区二区| 欧美日韩电影一区| 欧美一激情一区二区三区| 777亚洲妇女| 日韩电影第一页| 中文在线不卡视频| 午夜精品久久久久久久白皮肤| 欧美一级片久久久久久久| 国产精品视频在线观看| 91久久久一线二线三线品牌| 久久久久久久久久久久久久一区 | 456亚洲影院| 91九色国产视频| 亚洲精品一区二区三区四区五区| a级黄色小视频| 第四色婷婷基地| 无码精品一区二区三区在线播放| 三上悠亚在线观看视频| 探花视频在线观看| 欧美特级特黄aaaaaa在线看| 久久精品国产色蜜蜜麻豆| 久久丝袜美腿综合| 色综合中文字幕| 日韩精品一区二区三区第95| 97国产精品久久| 久久精品magnetxturnbtih| 三年中国中文在线观看免费播放| 九色porny自拍| 91九色露脸| 岳毛多又紧做起爽| 日本一区二区高清视频| 欧美成人三级在线视频| 国产无套精品一区二区三区| 久久久国产精品人人片| 黄色美女一级片| 2020国产精品| 91精品国产手机| 久久精品一区中文字幕| 999日本视频| 久久精品99国产| wwwww黄色| 日日夜夜精品免费| 亚洲精品伦理在线| 国产日韩精品一区二区三区在线| 日本视频www色| 国产成人精品亚洲日本在线桃色 | www.亚洲一区二区| 欧美中文字幕在线观看| 精品国产一区二区三区四区vr| 免费av观看网址| 很污很黄的网站| 三级久久三级久久久| kk眼镜猥琐国模调教系列一区二区 | 国产精品传媒入口麻豆| 欧美成人性福生活免费看| 97国产成人精品视频| 最新中文字幕久久| 玖草视频在线观看| 久草手机在线视频| 超碰成人免费在线| 免费一级特黄特色大片| 性欧美videos另类hd| 97久久精品人人澡人人爽| 91久久精品日日躁夜夜躁欧美| 亚洲性视频网站| 欧美日韩在线高清| av电影在线不卡| 麻豆久久一区二区| 欧美性videosxxxxx| 国产成人短视频| 日本一极黄色片| 波多野结衣绝顶大高潮| 国产精品国产精品国产专区不蜜| 亚洲人成免费电影| 一区二区免费电影| 久久精品综合视频| 日本vs亚洲vs韩国一区三区| 欧美色综合影院| 99久re热视频这里只有精品6| 97超碰人人爽| 人妻少妇精品无码专区久久| 欧美日韩在线视频首页| 国产精品爽爽爽爽爽爽在线观看| 日韩av片网站| 刘玥91精选国产在线观看| 欧美日韩国产在线播放| 日韩av片永久免费网站| 男人的天堂最新网址| www.久久久久久| 欧美日韩成人激情| 久久精品国产精品青草色艺| 中文乱码字幕高清一区二区| 久久久久久久网| 欧美激情国产精品| 亚洲天堂网一区| 三级成人在线视频| 亚洲精品成人久久| 激情视频小说图片| 一区二区自拍偷拍| 一本色道久久综合亚洲aⅴ蜜桃| 91美女高潮出水| 一级黄色片网址| 久久久久成人黄色影片| 国色天香2019中文字幕在线观看| av污在线观看| 日韩不卡在线观看日韩不卡视频| 亚洲第一页自拍| 日本熟妇人妻xxxx| 色窝窝无码一区二区三区成人网站| 日韩一区二区麻豆国产| 日韩人妻精品一区二区三区| 伊人久久成人网| 欧美日韩黄视频| 资源网第一页久久久| 在线观看国产小视频| 欧美精品丝袜中出| 只有这里有精品| 亚洲精品国产精| 亚洲老板91色精品久久| 欧美精品99久久| 久久午夜激情| 久久躁日日躁aaaaxxxx| 国产精品99精品无码视亚| k8久久久一区二区三区| 欧美一级片一区| 蜜桃av.com| 亚洲成人午夜电影| 日本在线观看一区二区| 国产又粗又大又黄| 日韩成人在线网站| 天堂av8在线| 久久久午夜精品理论片中文字幕| 国产精品久久久久久av| 国产亚洲第一页| 欧美午夜精品理论片a级按摩| 一区二区三区日韩视频| 久久久久国产精品一区二区| 精品综合久久久久久97| 一区二区三区久久久久| 图片区日韩欧美亚洲| 在线观看免费黄色片| 五月婷婷深深爱| 欧美精品一区二区三区国产精品| 免费在线观看污| 欧美国产禁国产网站cc| 91久久国产综合久久| 99久久综合精品| 亚洲已满18点击进入久久| 国产高清自拍一区| wwwxxx亚洲| 日韩一区和二区| 久久久国产欧美| 岛国av一区二区三区| 精品视频久久久久久| 久久久福利影院| 中文字幕在线不卡一区| 日韩在线三级| 免费观看30秒视频久久| 97精品在线视频| 国产一级久久久| 精品国产第一区二区三区观看体验| 中文字幕永久视频| 中文字幕一区二区三区在线播放 | 亲子乱一区二区三区电影| 久久免费视频精品| 日韩av在线精品| 在线视频 日韩| 欧美香蕉大胸在线视频观看| 欧美日韩国产精品激情在线播放| 99久久综合精品| 亚洲国产精品一区在线观看不卡 | 极品美女扒开粉嫩小泬| 99久久精品免费看国产免费软件| 国产一区二区免费在线观看| 久久精品毛片| 亚洲一区二区久久久久久久| 99久久国产免费| 国产激情久久久久| www天堂在线| 国产精品偷伦免费视频观看的| av手机免费看| 国产精品爽爽爽| 免费看黄色一级视频| 国产日韩在线看| 日韩中文字幕免费在线观看| 国产精品丝袜高跟| 日韩avvvv在线播放| 精品1区2区| 国产成人综合在线| 亚洲午夜精品一区二区三区| 国产a久久麻豆| 三级网在线观看| 国产精品每日更新在线播放网址| www..com日韩| 香蕉乱码成人久久天堂爱免费| 小明看看成人免费视频| 91黄色免费版| 醉酒壮男gay强迫野外xx| 亚洲成人免费网站| 欧美日韩精品亚洲精品| 久久久在线视频| www.com在线观看| 成人亚洲欧美一区二区三区| 美女视频一区在线观看| 亚洲国产欧美一区二区三区不卡| 国产欧美一区二区三区沐欲| 欧美三级午夜理伦三级| 91成人在线免费观看| 2017亚洲天堂| 久久777国产线看观看精品| 性中国古装videossex| 久久99精品久久久久久青青日本| 久久久天堂av| 天堂在线一区二区三区| 欧美一二三区在线| 国产精品19乱码一区二区三区| 97在线精品国自产拍中文| 丝袜美腿亚洲色图| 精品国产一区二区三区在线| 欧美日韩综合视频| 艳妇荡乳欲伦69影片| 久久久久久久久久久网站| 成人深夜在线观看| 精品国产免费一区二区三区香蕉| 91久久久在线| 国产成人激情av| 欧美精品一区免费| 在线不卡免费av| 日本在线视频中文字幕| 国产一区二区在线免费| 99re这里只有精品首页| 91av俱乐部| 精品不卡在线视频| 在线观看国产小视频| 国产精品美女久久久久av福利| 久久人人97超碰com| 亚洲精品国产久| 久久精品福利视频| 视频一区二区不卡| 久久精品视频16| 欧美精品一区二区三区高清aⅴ | 在线观看三级视频欧美| 国产一级免费观看| 91精品国产高清久久久久久91裸体 | 欧美综合77777色婷婷| 亚洲不卡在线观看| 国产中文字幕免费| 国产精品一区二区三区免费| 亚洲一二三四在线观看| 激情五月少妇a| 精品一区二区国产| 欧美视频在线不卡| 夜夜嗨aⅴ一区二区三区| 亚洲精品在线观看免费| 91麻豆精品国产| 精品人妻久久久久一区二区三区| 天堂8在线天堂资源bt| 欧美不卡一区二区三区四区| 韩国av在线免费观看| 成年人免费在线播放| 在线看福利67194| 国产一区二区三区av电影| 天天色天天干天天色| 91国产精品91| 亚洲日本韩国一区| 国产精品久免费的黄网站| 少妇特黄a一区二区三区| 欧美精品久久天天躁| 亚洲av无码乱码国产麻豆| 免费在线激情视频| 欧美刺激性大交免费视频| 91麻豆视频网站| 四虎884aa成人精品| 美国av一区二区三区| 911精品国产一区二区在线| 亚洲av无码乱码在线观看性色| 爱情岛论坛成人| 97精品视频在线| 一区二区久久久久久| 中文字幕日韩国产| 无码日韩人妻精品久久蜜桃| 欧美高清在线视频观看不卡| 中文字幕一区二区在线观看| 久久中文字幕免费| 免费在线看黄色片| 久久综合五月天| 国产精品国产三级国产a| 中文字幕一区二区人妻电影| 日韩国产欧美亚洲| 韩日欧美一区二区| 婷婷中文字幕一区三区| 亚洲一级黄色大片| 一区二区三区欧美精品| 国产精品自拍视频| 91麻豆精品国产综合久久久久久| 欧美a级理论片| 高清国产在线观看| 一区二区精品国产| 精品少妇一区二区30p| 亚洲综合色区另类av| 国产成人精品亚洲精品色欲| 免费人成视频在线播放| 91原创国产| 亚洲女同精品视频| 亚洲欧洲日产国产综合网| 91麻豆视频在线观看| 特种兵之深入敌后| 久久99精品国产99久久| 一个色综合导航| 亚洲一卡二卡三卡四卡| 亚欧洲精品视频| 亚洲欧美综合7777色婷婷| 天天综合五月天| 97视频免费在线观看| 91成人网在线| 成人午夜视频网站| 亚洲天堂五月天| 潘金莲一级淫片aaaaa| 久久国产精品-国产精品| 最新亚洲国产精品| 欧美视频中文字幕在线| 极品尤物av久久免费看| 国产成人精品a视频一区| 国产色视频在线播放| 国产成人一区二区三区免费看| 欧美一卡2卡3卡4卡无卡免费观看水多多| 欧美精品一区二区三| 亚洲国产三级网| 在线播放成人av| 又黄又爽的网站| 日本黄xxxxxxxxx100| 国产精品久久久| 亚洲欧美精品中文字幕在线| 一区二区三区中文在线观看| 日韩av在线发布| 国产传媒一区| 佐山爱在线视频| 国产免费一区视频观看免费| 欧美不卡一区二区| 中文字幕一区二区三区色视频| 亚州视频一区二区三区| 欧美人与禽zozzo禽性配| 一级淫片在线观看| 日本免费高清一区| 日产精品99久久久久久| 亚洲国产高清福利视频| 亚洲国产一区在线观看| 成人高清视频在线观看| а√天堂资源在线| 国产亚洲欧美久久久久| 少妇一级淫免费观看| 国产麻花豆剧传媒精品mv在线| 开心色怡人综合网站| 国产精品久久久| 久久成人在线视频| 日韩精品极品视频| 欧美日韩第一区日日骚| 精品国产精品三级精品av网址|