半点优化网 http://www.bdxc.net/
当前位置首页 > 网站技术问题> 正文

如何对网站日志进行分析

2021-06-19 23:38:31 暂无评论 51 网站技术问题 进行   分析   如何

分析日志:
蜘蛛名称:百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider
在日志文件里,搜索以上蜘蛛名称。就可以看到蜘蛛抓取的痕迹。
我们分析的主要点是,HTTP状态码,如以上的200和301。
" 200 5162 " 代表正常抓取,这次抓取了5162个字节。

不同的服务器或虚拟主机设置的日志记录内容不同。
有的如:200 0 33834 237 953 我们通过多看几条记录,观察规律,可以判断第三个数字代表字节数。
有的如:200 0 0或200 0 64 这是没有记录抓取字节数。注意:200 0 0和200 0 64 没代表什么问题。所谓200 0 64代表要被K的言论没有根据,一般的网站都有64代码。

在日志里,发现比较多的HTTP状态码是,200(正常)、304(没变化)、404(错误链接)。
304代表,自从上次抓取后,该内容没有更新。一般情况下,网站的图片经常会返回该值。
404代表,访问的这个链接是错误链接。这个错误链接,一方面来自原本存在后来删除了网页,另一方面可能来自本来就不存在,但其他人外链了这么个死链接。

猜你喜欢