为您提供网站建设行业资讯、网站优化知识、主机域名邮箱、网站开发常见问题等
几种常见搜索引擎爬虫程序的整理
发表日期:2016-06-20 资讯来源:佰牛科技 浏览:207

百度的算法一直改变,这让很多站长在做SEO优化的时候有点犹豫,都想弄明白一件事,如何才能把握好网页更新策略,快速的提高网站的知名度。现在佰牛网络(深圳网站建设公司)就谈谈SEO的基础工作-网站页面收录问题,这就需要站长做好robots.txt。
这里就整理一些常见的爬虫程序,不常见的我也不是很了解,毕竟世界上的爬虫程序非常非常多,有好有坏。
一、Google爬虫
算法优秀,反应速度迅速,对内容质量把握优秀,中等强度爬虫程序,对服务器负担不大,推广效果好。
对应user-agent:爬虫名称
Googlebot:google网页爬虫
Googlebot-news:google新闻爬虫
Googlebot-image:google图片爬虫
Googlebot-video:google视频爬虫
Googlebot-mobile:google移动爬虫
Mediapartners-google或Mediapartners(googlebot):google广告爬虫
Adsbot-google:google着陆页质量检测爬虫
二、百度爬虫
算法良好,反应速度迟钝,对内容质量把握一般,高强度爬虫程序,由于算法优化不良问题,对服务器负担较大,本身小问题也挺多(比如:度娘又抽风了),隐私保护恶劣,在百度面前无隐私可言,推广效果好。(然而谁叫这货是国内搜索引擎老大呢)
对应user-agent:爬虫名称
Baiduspider:百度网页爬虫兼移动爬虫
Baiduspider-image:百度图片爬虫
Baiduspider-video:百度视频爬虫
Baiduspider-news:百度新闻爬虫
Baiduspider-favo:百度搜藏爬虫
Baiduspider-cpro:百度联盟爬虫
Baiduspider-ads:百度商务爬虫
三、好搜(即360)爬虫
类似百度早期算法,反应速度迟钝,对内容质量把握不足,高强度爬虫程序,隐私保护跟百度一个尿性,需要翻墙的小伙伴千万要避开这货。
推广效果好,目前好搜的客服给我的印象最好,然而以后就不知道了,毕竟有流氓历史。
对应user-agent:爬虫名称
360spider或haosouspider:好搜网页爬虫兼移动爬虫
360spider-image:好搜图片爬虫
360spider-video:好搜视频爬虫
三、搜狗爬虫
算法恶劣,反应速度极其迟钝,不能良好的把握内容质量,高强度爬虫程序,由于算法奇差,会对页面进行大量反复而又无实际意义的扫描,对服务器负担很大,个人建议直接遮蔽这货,推广效果差!严重的内部点击,个人最讨厌。搜狗本身流量就很少,并且收录慢,抓取压力大,综合性价比非常低。
对应user-agent:爬虫名称
Sogou spider:搜狗综合爬虫
四、新浪爱问爬虫
基本可以当作搜狗爬虫,各项性能恶劣,建议遮蔽,推广效果差。
对应user-agent:爬虫名称
Iaskspider:新浪爱问爬虫
五、有道爬虫
也基本可以当作搜狗爬虫,各项性能恶劣,对服务器负担较搜狗略低,建议遮蔽,推广效果差。
对应user-agent:爬虫名称
YodaoBot:网易有道爬虫
Alexa爬虫
Alexa爬虫,用于检测网站是否做了Alexa排名作弊,如果不关心Alexa排名的可以遮蔽。一般企业站看这个没意思很难有排名的。
对应user-agent:爬虫名称
ia_archiver:Alexa爬虫
六、雅虎爬虫
算法优良,反应速度还可以,高强度爬虫程序,有时候会从多个ip地址启动捉取,算是比较规范的爬虫,推广效果还可以。不过自从雅虎离开大陆,而且在11年11月左右雅虎关闭了站长服务并把数据转移到必应,一般情况建议遮蔽。
对应user-agent:爬虫名称
Yahoo! Slurp:雅虎爬虫
七、必应爬虫
整体性能还不能判断,不过根据最近世界搜索引擎市场份额占比判断,性能应该接近百度甚至比百度要好,国内本土化不足。九秋网站来自必应的流量不少于好搜。
对应user-agent:爬虫名称
Bingbot:必应爬虫
总结:
好了,大概我们常见的爬虫程序就有这些,别的基本可以直接遮蔽了。
- 内容标签:
- 几种常见搜索引擎爬虫程序的整理
- SEO优化
- 网站页面收录
- 上一条:网站页面不被百度收录怎么办?
- 上一条:SEO指南:网站使用分页究竟是利是弊?
- 相关资讯
-
联系我们-新盛娱乐客服开户注册电话15559858555
首页-新盛娱乐公司-电话【15559858555】【微信】新盛公司微同步【在线客服-15559858555】开户电话-客服开户-热线开户-咨询-联系-代理开户-在线开户-开户网址-注册开户-开账号-开会员
日期:2025-06-25 浏览:100 -
浅谈Seo工作中执行力的重要性
总的来说’PDCAR法则”就是制定好计划马上实施,计划实施完毕后,将整个计划执行的过程回顾一遍,仔细考虑每个细节,确认哪些部分成功了,哪些部分是失败的。
日期:2016-05-16 浏览:120 -
SEO大牛是如何“原创”网站文章的?
首先是收集长尾关键词,你可以去百度指数、百度相关搜索栏、百度知道问答或者软件等等地方收集到长尾关键词。有一点要注意的是,我们收集好关键词后要进行整理,把明显不相关的长尾词筛选,比如搜索钢管时会出现"钢管舞"这跟做钢管这一产品词没有帮助。
日期:2016-05-16 浏览:123 -
外链建设如何影响网站关键词排名
再次是外链的相关性远比数量重要,很多SEOER做外链基本不注重相关性,在他们看来,只要悬挂外链的网站有高权重即可,并且觉得外链做的越多越好,也就是说十分注重外链的数量,忽略的质量。
日期:2016-05-16 浏览:122 -
如何识别SEO中的水货?
百科中原理写的是向百度发送数据包。大哥,你发了也得人家接收执行才行。这边如果写成『缓存溢出可执行漏洞』,那还具有一定可行性。而忽悠大师是不会这么深入研究的,他们最擅长的就是抛出一套理论,让你觉得很高深,很有效,其实具体怎么执行,往往他们都说不出个所以然来。
日期:2016-05-16 浏览:120 -
精简优化代码是做好SEO优化必须的一个步骤
尽量采用局您的页面,局的益处是让搜索引擎爬虫能够更顺遂的、更快的、更友好的爬完您的页面局还可以年夜量缩减网页巨细,这在SEO优化工作中起到很大的浸染,不仅提高浏览的速度,更使得代码更精练、流利、更轻易放置更多内容。
日期:2016-05-16 浏览:121 -
对于于门第上网站seo优化的网站操作
网站题目:关于一度新站来说是很首要的,第二天你网站题目就成为了呵呵,这可是举例,百度引擎可没有喜爱网站题目没有断变来边去,新站要安靖做兴起,就要想好一度面前的题目,假如斯后需求批改,也最好正在网站有所根底的状况下,遏制修正。
日期:2016-05-16 浏览:130 -
SEO优化 文章隐藏的文本和链接算是作弊?
在网站底部添加闪动的友情链接,只需要拉动到网站底部就可以看到一排闪动,从源代码里面可以看到,也有添加到其他地方的(这个情况一般都是网站被黑了,网站怎么预防请看:网站被黑预防措施)
日期:2016-05-13 浏览:122