URL详细地址反应出网站的真相

2021-02-25 06:19 admin

我喜爱访问网页页面时好几个心眼。这个心眼必须观查很多元素,每一个元素都能出示信息内容。独立的1个元素不关键,可是好几个元素构成的信息内容,常常能得到有使用价值的分辨。那末从这些元素说起:

始终不忽视URL
URL是1个关键的信息内容,岗位比较敏感让剖析师肯定不容易忽视URL详细地址的特性。URL反应出网站的真相,立即以事例讲话:

$URL详细地址所属的网站域名
许多人在网络上上当受骗,很大缘故便是几乎不关心URL所属的网站域名。

例如:http://www.taobao.ipx32.com/about.html,看似弱智的骗局却让许多网友 误认为是淘宝的网站而落入陷阱。这是ipx32域的网站,而并不是taobao的网站。
在访问的全过程中,時刻关心网页页面的URL网站域名,能够了解点一下连接是不是离去本站,而关心新到的站点网站域名有何特点。在很多大顾客的营销推广全过程中,跨域的连接是很常 见的,不一样的域代表着站长或广告宣传主的监测专用工具与对策也会有一定的不一样。

例如:在IT门户网中常有Intel,华硕,HP等硬件配置厂商的专题网页页面(将会会加上Google Analytics或Nielsen的监测编码),这些网页页面中会有连接将浏览者导入新的网站域名,如intel.com.cn,或hp.com.cn(将会 会加上Omniture、HBX或Webtrends的监测编码)。这类跨域的URL是不言而喻的。


$ URL详细地址所包括的主要参数


URL中包括主要参数是再普遍但是了,但每一个主要参数都有含意,关心它们可以全面把握网站的作用特性。例如:


http://www.chinawebanalytics.cn/?p=917 这是Sidney的新blog的详细地址,能够剖析这个blog经营了挺长的1段時间了,ID号都排到917了。

http://adsclick.qq.com/adsclick?oid=1112901&loc=QQ_SX_JY_Test6&url=http://www.52-abc.com/这是QQ主页的右边广告宣传连接,里边丰富多彩的主要参数告知了大家对这些广告宣传位的名字界定,和自动跳转的总体目标详细地址。

http://www.soso.com/q?sp=S&sc=web&cid=w.q.in.sb.web&ty=1&bn=&op=entry&kw=&w=WA 这是腾迅搜搜的“WA”結果页,告知大家检索重要词主要参数是用W自变量。也有1些其他主要参数,或许1下子看不懂,假如有必须可再数次实验科学研究,便可以明确。


总而言之,对URL的主要参数关心是剖析师的基础功。


$ URL详细地址所指向的文档种类


URL中会包含文档种类的信息内容。


HTML/HTM:这表明这类网站的网页页面是历经静态数据化解决的,以便捷检索模块抓取。如今绝大多数门户网与CMS系 统都会有静态数据化解决作用。再有1些简易的本人网页页面也会应用html文档名。

JSP/PHP/ASPX/ASP:这表明这是1种动态性网页页面,网页页面源文档是存在服务器端,这些文档的特点可自 行检索掌握。

无种类:一些详细地址,http://www.ectend.com,这是属于服务器 自定了首页,实际效果实际上是http://www.ectend.com/index.php

.do:http://www.ems.com.cn/qcgzOutQueryAction.do?reqCode=gotoSearch 这类状况是jsp开发设计的网站。实际上不必须彻底了解,能輔助便可。这类网站1般有1定的技术性含量,但技术性整体实力不强,不足优秀,普遍于1些国资情况公司的作用 型网页页面,或网站的后台管理。由于时下好的网站,在前端开发网页页面都能将URL掩藏得很好,不容易出現.do这类状况。

此外:也有1些开源系统新项目的网站URL详细地址较为非常,如Wordpress:http://www.ectend.com/index.php/excellent-analytics/; 或 Wikipedia:http://zh.wikipedia.org/wiki/Wikipedia:主页。


$ URL详细地址取名的特点


从URL的取名也能发现蹊跷或趣味的事,例如:

 


淘宝的URL特点就很成心思,是根据base 64编号的。(谢谢money的指导,调整原先不正确,很有获得,再度表明URL里有八荒),很 多“-”。我推断“–”之间意味着着自变量,假如正中间沒有值,就意味着这个自变量沒有界定。
http://list.taobao.com/browse/50018957⑸0018960/n⑴⑴---------------------0---------yes--------------------⑵-------b-⑷0--commend-0-all⑸0018960.htm?ssid=r18?ad_id=&am_id=&cm_id=&pm_id=

凡客诚品的URL也很有特点:
http://www.vancl.com/Product_1E10000/RuanNiuPiXiDaiXiuXianXie+HeiSe.html, 商品拼音+色调。

此外还能找出她们职工粗心大意的地方:大家了解汉语括号()与英文括号()不一样,URL详细地址中只能出現英文括号,汉语括号会汉语翻译成编号。可见Vancl 的职工在商品录入时沒有统1规范:
http://www.vancl.com/CategoryList⑴440⑴-⑴/GaoJiMianTangQuanMianChenShan%EF%BC%88ZunGuiKuan%EF%BC%89.html
http://www.vancl.com/CategoryList⑴324⑴-⑴/ShangWuXiuXianKu(BiaoZhunKuan).html


网页页面源文档


针对好奇心的网页页面,1定要查询网页页面源文档。根据源文档的迅速访问可以明确网站的技术性整体实力、设计方案人员的素养,监测专用工具与监测方式的布署状况。1般关心以 下4点:


编码是不是整洁還是冗烦

布署了哪些监测专用工具

监测专用工具的编码布署的部位与次序

是不是添加了可疑编码