seo教程:如何分析网站日志?确定优化方向
如何分析网站日志?一些网站管理员或一些网站SEOer一定听说过网站日志这个名字!都知道会看、能看懂网站日志,是一个seoer大师的标志是也是一个合格的网站管理员必备的技能,网站日志记录,所有搜索引擎爬行和抓取记录,是我们的网站管理员和seo人员,参考网站是否有异常和实时访客记录等!重要的参考依据,但当我们真的需要阅读和理解网站日志时,看看那些密集的代码,我们是前两个大的。今天,这个网站将给你如何正确。
在开始介绍之前,先介绍一下网站日志中各大搜索引擎的名称。
1、百度:Baiduspider
2、谷歌:google-googlebot
3、360:360Spider
4、搜搜:Sosospider
5、搜狗:Sogou News Spider
以上是一些主流搜索引擎的蜘蛛,如果以上的蜘蛛程序常来你的网站,那么恭喜你的网站距离成功不远了。
在查看日志之前,您需要下载网站日志。
在查看日志之前,您需要下载网站日志。现在一般的虚拟空间提供商都会提供它“下载访问日志”如果没有这个功能,可以在网站程序“wwwlogs或log”进行下载
在这里,我先复制一个我的网站空间日志代码给大家看。
2012-02-08 09:05:25 GET /default.asp – – 220。181。108。180 HTTP/1.1 Mozilla/5.0 (compatible; Baiduspider/2.0; file:///C:UsersADMINI~1AppDataLocalTemp%$ACOF(TYDYECOKVDYB.pnghttp://www。baidu。com/search/spider.html) – 200 34499 421
这是一行日志代码,你应该知道Baiduspide是百度蜘蛛的名字,我们可以从这个代码中看到百度蜘蛛对网站的爬行信息。
2012-02-08 09:05:25 GET /default.asp,这个大家一眼就应该明白,意思是Baiduspider这个名字的用户是2012-02-08百度蜘蛛 09:05:25 这次爬行了我们网站的主页,也就是说default.asp页面,这个get是搜索引擎的抓取动作。
file:///C:UsersADMINI~1AppDataLocalTemp%$ACOF(TYDYECOKVDYB.png220.181.108.180代表访问用户ip这个日志的地址ip地址就代表着百度蜘蛛的ip来路。相信有过建站经验的朋友对这个有过建站经验的朋友。ip应该都很熟悉。相信有过建站经验的朋友对这个有过建站经验的朋友。ip应该都很熟悉。
HTTP/1.该代码代表超文本传输协议。接触网络的人应该知道,网络上的信息传输需要通过一定的网络协议进行HTTP/1.1是一种很多协议。你不必太在意。当然,如果你感兴趣,你可以仔细理解。
Mozilla/5.0 (compatible; Baiduspider/2.0; file:///C:UsersADMINI~1AppDataLocalTemp%$ACOF(TYDYECOKVDYB.pnghttp://www。baidu。com/search/spider.html)这段代码Mozilla/5.0意味着用户使用的浏览器是Mozilla/5.0.如果括号中的信息出现在新站日志中,应该会让站长兴奋一段时间。是百度蜘蛛,可以说是百度优化站长衣食的父母。他们又爱又恨。
200 34499 421这段代码中“200”代表蜘蛛爬行返回的状态码,200代表爬行成功,34499代表爬行网页的大小。
以上是本网站对网站日志的一些回答。 这只是众多网站日志中的一种,安装在不同空间的网站的日志也会有所不同。但只要知道http了解网站日志的某些状态码和某些代码所代表的含义没有问题。
以下应重点介绍返回状态码的含义:
其实简单总结一下2**代码代表正常
200 正常;请求已完成。
201 正常;紧接 POST 命令。
202 正常;已接受处理,但尚未完成。
203 正常;部分信息 — 只是返回信息的一部分。
204 正常;无响应 — 已收到请求,但无需回发信息。
3**代码代表重定向
301 已移动 — 要求的数据位置新,变更永久。
302 已找到 — 临时要求的数据不同 URI。
303 请参阅其它 — 可在另一 URI 找到对请求的响应并使用它 GET 该方法检索此响应。
304 未修改 — 文档未按预期修改。
305 使用代理 — 请求资源必须通过位置字段中提供的代理访问。
306 未使用 — 不再使用;保留此代码以便将来使用。
4xx代码代表客户机中的错误
400 错误请求 — 请求中有语法问题,或者不能满足要求。
401 未授权 — 未授权客户机访问数据。
402 需要付款 — 表示计费系统已有效。
403 禁止 — 即使有授权也不需要访问。
404 找不到 — 服务器找不到给定的资源;文档不存在。
407 代理认证请求 — 客户机必须首先使用代理认证本身。
415 不支持介质类型 — 由于不支持实体的格式,服务器拒绝服务请求。
5xx代码代表服务器中的错误
500 内部错误 — 由于事故,服务器无法完成请求。
501 未执行 — 服务器不支持要求的工具。
502 错误网关 — 服务器接收上游服务器的无效响应。
503 无法获得服务 — 由于临时过载或维护,服务器无法处理
事实上,我们通常分析网站日志最重要的一点是知道这些状态代码意味着什么,以便了解网站页面的获取。
现在有很多网站日志分析软件可以直接分析网站日志不需要网站管理员辛苦检查,但个人觉得像这个网站管理员基本技能新手或学习更好,如果软件问题或其他情况不会分析。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权本站发表,未经许可,不得转载。