做位一名SEO工作者,网站日志和对日志代码的了解是比较基础的,很多时候我们会从中间发现或分析一些现象,这对于网站的发展进度和以后的操作流 程,乃至网站下一步情况的预测,都是非常有帮助的,下面我们将网站日志及其中的HTTP状态码说明下,希望能解决一些在SEO工作中遇见的常见问题。
网站日志是什么?
网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件。
网站日志有什么作用?
通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。
对于Seoer而言,网站日志可以记录各搜索引擎蜘蛛机器人爬行网站的详细情况,例如:哪个搜索引擎的蜘蛛机器人在哪天访问了网站多少次,访问了哪 些页面,以及访问页面时返回的HTTP状态码,了解这些对网站在搜索引擎的情况会了解的比较清楚些,也有利于我们SEO工作的计划和展开。
网站日志如何查看?
网站日志一般存放在虚拟主机的logfiles文件夹下,有些主机的日志文件存放的文件夹可能会不太一样,但一般都包含log这个词,具体文件夹可 以咨询你的主机商或自己在主机目录下查找即可,找到日志文件后,我们可以通过FTP工具将网站日志下载下来,通过txt文档方式查看。
日志代码
通常情况下,我们将HTTP状态码叫做日志代码,下面是一些常见的日志代码和相应的注释。
1xx-信息提示:这些状态代码表示临时的响应。客户端在收到常规响应之前,应准备接收一个或多个1xx响应。
100-继续
101-切换协议
2xx-成功:这类状态代码表明服务器成功地接受了客户端请求。
200-确定,客户端请求已成功
201-已创建
202-已接受
203-非权威性信息
204-无内容
205-重置内容
206-部分内容
3xx-重定向:客户端浏览器必须采取更多操作来实现请求。例如,浏览器可能不得不请求服务器上的不同的页面,或通过代理服务器重复该请求。
301-对象已永久移走,即永久重定向
302-对象已临时移动
304-未修改
307-临时重定向
4xx-客户端错误:发生错误,客户端似乎有问题。例如,客户端请求不存在的页面,客户端未提供有效的身份验证信息。400-错误的请求。
401-访问被拒绝。IIS定义了许多不同的401错误,它们指明更为具体的错误原因。这些具体的错误代码在浏览器中显示,但不在IIS日志中显示。
401.1-登录失败
401.2-服务器配置导致登录失败
401.3-由于ACL对资源的限制而未获得授权
401.4-筛选器授权失败
401.5-ISAPI/CGI应用程序授权失败
401.7–访问被Web服务器上的URL授权策略拒绝。这个错误代码为IIS6.0所专用
403-禁止访问:IIS定义了许多不同的403错误,它们指明更为具体的错误原因:
403.1-执行访问被禁止
403.2-读访问被禁止
403.3-写访问被禁止
403.4-要求SSL
403.5-要求SSL128
403.6-IP地址被拒绝
403.7-要求客户端证书
403.8-站点访问被拒绝
403.9-用户数过多
403.10-配置无效
403.11-密码更改
403.12-拒绝访问映射表
403.13-客户端证书被吊销
403.14-拒绝目录列表
403.15-超出客户端访问许可
403.16-客户端证书不受信任或无效
403.17-客户端证书已过期或尚未生效
403.18-在当前的应用程序池中不能执行所请求的URL(这个错误代码为IIS6.0所专用)
403.19-不能为这个应用程序池中的客户端执行CGI(这个错误代码为IIS6.0所专用)
403.20-Passport登录失败(这个错误代码为IIS6.0所专用)
404-未找到。
404.0-(无)–没有找到文件或目录
404.1-无法在所请求的端口上访问Web站点
404.2-Web服务扩展锁定策略阻止本请求
404.3-MIME映射策略阻止本请求
405-用来访问本页面的HTTP谓词不被允许(方法不被允许)
406-客户端浏览器不接受所请求页面的MIME类型
407-要求进行代理身份验证
412-前提条件失败
413–请求实体太大
414-请求URI太长
415–不支持的媒体类型
416–所请求的范围无法满足
417–执行失败
423–锁定的错误
5xx-服务器错误:服务器由于遇到错误而不能完成该请求。
500-内部服务器错误
500.12-应用程序正忙于在Web服务器上重新启动
500.13-Web服务器太忙
500.15-不允许直接请求Global.asa
500.16–UNC授权凭据不正确(这个错误代码为IIS6.0所专用)
500.18–URL授权存储不能打开(这个错误代码为IIS6.0所专用)
500.100-内部ASP错误
501-页眉值指定了未实现的配置
502-Web服务器用作网关或代理服务器时收到了无效响应
502.1-CGI应用程序超时
502.2-CGI应用程序出错
503-服务不可用(这个错误代码为IIS6.0所专用)
504-网关超时
505-HTTP版本不受支持
网站日志怎么看?
有了网站日志文件和相应的日志代码注释,我们就可以对网站的日志文件进行查看,下面用一段日志文件来说明下:
主机环境介绍:操作系统:Linux、Web服务器:Nginx0.8、Php版本:Php5+、Mysql版本:5.0+
日志文件:
[05/Aug/2010:10:05:14 +0800] “GET /bbs/thread-229-1-1.html HTTP/1.1″ 200 6844 “-” “Baiduspider+(+http://www.baidu.com/search/spider.htm)” “-”
220.181.7.26
释义:
05/Aug/2010:10:05:14 +0800:访问日期与端口号码
GET /bbs/thread-229-1-1.html:抓取“ /bbs/thread-229-1-1.html”文件
HTTP/1.1:HTTP协议,版本为1.1
200 6844:抓取成功,抓取字节数为6844字节
Baiduspider:蜘蛛代码,这里是百度蜘蛛
220.181.7.26:蜘蛛IP地址
另外,网站日志中还清楚的记录了浏览者的一些访问记录:IP地址、访问时间、访问页面及文件、返回的http状态码、浏览器及版本等等信息,但一般 这都不是我们了解的重点,比如用户访问出现了404代码,我们只需要做好404错误页面就可以了,其他可以不用去分析,因为网站都安装有统计工具,我们在 网站的统计工具中可以很直观的看见用户行为。
作者博客:http://www.scseoer.com/web-log-code.html
分享到:
相关推荐
基于JavaScript的网站流量日志数据分析系统源码.zip基于JavaScript的网站流量日志数据分析系统源码.zip基于JavaScript的网站流量日志数据分析系统源码.zip基于JavaScript的网站流量日志数据分析系统源码.zip基于...
员工工作日志管理系统1.0源码.rar
基于Hadoop网站流量日志数据分析系统项目源码+教程.zip网站流量日志数据分析系统 典型的离线流数据分析系统 技术分析 hadoop nginx flume hive sqoop mysql springboot+mybatisplus+vcharts 基于Hadoop网站流量日志...
网站日志蜘蛛在线分析工具源码 日志可视化管理工具源码 快速分析搜索引擎网络爬虫抓取记录 如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件...
网站日志蜘蛛在线分析工具源码 日志可视化管理工具源码 快速分析搜索引擎网络爬虫抓取记录 如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件...
Hadoop网站日志分析源码(hive命令).txt
网站日志蜘蛛在线分析工具源码 日志可视化管理工具源码 快速分析搜索引擎网络爬虫抓取记录 如果是 linux 宝塔面板 的服务器自然环境,大家登陆宝塔面板linux控制面板后,点一下左边“文件”,在www下的wwwlogs文件...
所以日志分析是一个网站数据分析中的必要补充。 而且有很多的数据用JS代码是不能统计到的。如:网站上出现的各种各样的错误,搜索引擎爬虫在网站上的行为等, 而这些对SEO的分析与决策都很重要。
经典成品网站非常漂亮的个人博客网站源码非常漂亮的个人博客网站源码非常漂亮的个人博客网站源码非常漂亮的个人博客网站源码
后端有:首页、内容管理、系统管理、网站管理员、资源管理、数据备份、日志管理、系统备份 源码名称: 通用性企业门户网站 适用版本: URF-8(整站) 适用站点: 企业官网、门户网站、行业通用门户网站 部署工具: ...
FastreSolve日志分析系统源代码
用excel存储,在代码中应用了对datatable的操作,和对excel的读写,以及对gridcontrol控件的应用。动态添加列,减少列,增加行,删除行。 dev控件版本12.1.6.0 nopi组件版本 2.0.6.0
个性化个人日志网站源代码
这是一个用jsp+servlet+javabean模式写的日志资源共享网站的代码。完全采用MVC模式,具体操作间里面的说明文档,相信一看就懂了哦~~ 可以实现日志上传,日志下载,在线浏览日志等基本功能,由于时间仓促,写的比较...
【资源说明】 1、该资源包括项目的全部源码,下载可以直接使用! 2、本项目适合作为计算机、数学...企业级电商网站的大数据统计分析平台源码+项目说明(以 Spark 框架为核心,对电商网站的日志进行离线和实时分析)...
蜘蛛日志在线分析工具是一款开源的工具,可用于快速分析网站访问日志中搜索引擎网络爬虫的抓取记录。如果你的服务器运行在linux宝塔面板环境下,你只需要登录宝塔面板的linux控制面板,在左侧导航栏中点击”文件”,...
(带手机版数据同步)QQ空间日志说说类网站模板QQ心情日志网站源码下载.txt
4:来源分析(查看用户通过XX网站打开你的网址..)。5:状态码统计(查看HTTP状态码总计数)。6:搜寻数据(搜寻日志字段,并将搜索结果展现出来)。7:查看IP详细访问(可以查看当前日志,你指定的IP的所有访问,访问间隔)。@qq...
asp.net 网站追踪系统bug日志源码