首 页 网络编程
网页制作 图形图象 操作系统 冲浪宝典
软件教学 认证考试

网络安全 网络办公 行业资讯 评测对比
您当前位置:站长天空 -> 认证考试-> Cisco认证
获取google pagerank值的研究_google推广
作者:网友供稿 点击:0
推荐
西部数码-全国虚拟主机10强!20余项虚拟主机管理功能,全国领先!第6代双线路虚拟主机,南北访问畅通无阻!可在线rar解压,自动数据恢复设置虚拟目录等.免费赠送访问统计,企业邮局.Cn域名注册10元/年,自助建站480元起,免费试用7天,满意再付款!P4主机租用799元/月.月付免压金
站内搜索
文章页数:[1] 

今天在网上看到有网站提供显示google pagerank值的功能,听说google已经取消了公开的pagerank显示,只有通过ie google toolbar获得,所以觉得挺有意思,就去研究了一下。


我装上google toolbar抓了一下socket包,得到了如下信息:


GET /search?client=navclient-auto&googleip=O;3812&ch=62544423920&freshness_check=4X0lThsX1_WR7cBSIbnl8&ie=UTF-8&oe=UTF-8&features=Rank&q=infhttp%3A%2F%2Fblog%2Eiyi%2Ecn%2Fdavid%2F HTTP/1.1
User-Agent: Mozilla/4.0 (compatible; GoogleToolbar 2.0.114.9-big; Windows 5.2)
Host: toolbarqueries.google.com
Cache-Control: no-cache
Cookie: PREF=ID=3e46a681346bcce2:NW=1:TM=1099618786:LM=1104831026:TB=2:S=8oMV8rWWHE07ngDp
测试了一下,发现只有GET后面的信息和host比较重要,其他的信息可以任意填写
而这其中比较重要的信息是下面这几条:
client=navclient-auto&
ch=0123456789&
features=Rank&
q=infhttp%3A%2F%2Fblog%2Eiyi%2Ecn%2Fdavid%2F
client=navclient-auto表示客户端是google toolbar,如果没有这个参数得到的结果是在google中搜索这个网址的结果
ch=0123456789是checksum值,关键中的关键,google对每个网址用特殊算法进行转换后得到这个checksum,google就是靠这个来对它的pagerank进行"加密"的。如果知道了这个算法,获取pagerank就轻而易举了。
features=Rank获取的是pagerank值,我得到的结果是Rank_1:1:1其中最后一位是pagerank的值,如果忽略这个参数得到的是相关网页在google中的详细信息的xml,我得到的是下面的信息:
<?xml version="1.0" encoding="GB2312" standalone="no" ?>
<!DOCTYPE GSP (View Source for full doctype...)>
- <GSP VER="3.2">
<TM>0.124300</TM>
<Q>inf<>http://blog.iyi.cn/david/[/url]<;/Q>
<PARAM name="client" value="navclient-auto" original_value="navclient-auto" />
<PARAM name="googleip" value="O;907" original_value="O;907" />
<PARAM name="ch" value="62544423920" original_value="62544423920" />
<PARAM name="q" value="inf>http://blog.iyi.cn/david/[/url]" original_value="infhttp%3A%2F%2Fblog.iyi.cn%2Fdavid%2F" />
- <RES SN="1" EN="1">
<M>1</M>
<XT />
- <R N="1" L="1" MIME="text/html">
<U><>http://blog.iyi.cn/david/[/url]<;/U>
<UE><>http://blog.iyi.cn/david/[/url]<;/UE>
<T>泰然处之- 大卫s BLOG</T>
<RK>1</RK>
<S>泰然处之 - 大卫s BLOG. 2004年12月. 日, 一, 二, 三, 四, 五, 六. 1, 2, 3, 4. <b>...</b></S>
<LANG>zh-CN</LANG>
- <HAS>
<L TAG="link:" />
<C SZ="90k" CID="28N4KopQVykJ" TAG="cache:" />
<RT TAG="related:" />
</HAS>
</R>
</RES>
</GSP>

内容很容易看得明白,这里就不解释了。(难道我得blog被google惩罚了?好久没有更新了-_-)
知道了原理,就来考虑如何解决了。其实google toolbar可以很容易的动态跟踪,懂得汇编的人可以很快的找出它的checksum算法,这当然是最好的解决之道。
另外,如果你不懂得汇编,可以通过历史纪录获得向管链接的checksum值,可以从你的ie临时文件夹中找到。
或者你也可以建立代理服务器,让google toolbar通过代理服务器来获取pagerank值,然后在代理服务器上运行相关程序来截取checksum值。
另外,还找到这个pr值对照表:

Toolbar PageRank Real PageRank
0/10        0.15 - 0.9
1/10        0.9 - 5.4
2/10        5.4 - 32.4
3/10        32.4 - 194.4
4/10        194.4 - 1,166.4
5/10        1,166.4 - 6,998.4
6/10        6,998.4 - 41,990.4
7/10        41,990.4 - 251,942.4
8/10        251,942.4 - 1,511,654.4
9/10        1,511,654.4 - 9,069,926.4
10/10       9,069,926.4 - 0.85 × N + 0.15

我觉得所谓的real pagerank可以估算为:Nd+(1-d)
N是在google搜索到的链接到当前网页的网页数,d是google定义的阻尼值。
比如在google中输入link:www.sohu.com得到的结果是:133,000 项,用上面的公式计算得到113050.15,刚好对应到pr值7,也可以根据各个数据段的百分比算出10以内的pr值小数位
其实这样子很容易的到pr值,根本不用那个checksum加密算法


文章整理:站长天空 网址:http://www.z6688.com/
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!

文章页数:[1] 


放大字体显示 缩小字体显示 打印文章 推荐给朋友
热门文章
·JSP页面中的自定义标签-JSP教程,Jsp/Servlet
·动态加载Asp.net分页控件-.NET教程,Asp.Net开发
·探究客户端浏览器分辨率的自适应问题(2)-.NET教程,评论及其它
·使用Eclipse开发Jsp-JSP教程,Jsp/Servlet
·正确优雅地解决用户退出——JSP及Struts解决方案-JSP教程,Jsp/Servlet
·关于C#中虚方法重载的说明-.NET教程,C#语言
·如何查看本机打开的端口是被哪个程序使用的-网管专栏,操作系统
·C#中来应用Hook-.NET教程,C#语言
·网页表单验证代码的改进-ASP教程,脚本编码
·最新版ccnp教材介绍
最新文章
·号称全球第一篇华人女站长的建站理财文章_站长心得
·衡量一个网站的价值的公平化的标准是什么?_站长心得
·谈谈网站设计的10个要点2_站长心得
·获取google pagerank值的研究_google推广
·强悍的网络编辑是怎样炼成的?_网络编辑
·点析网站发展三阶段3_站长心得
·个人网站真能转成商业网站,你能么?_站长心得
·百度搜索引擎使用指南_baidu推广
·加入自动功能windows vista磁盘整理全面解析_windows vista
·asp.net中多彩下拉框的实现_asp.net技巧
相关主题
西部数码虚拟主机

友情链接
CNNIC 西部数码
万网 自助建站
虚拟主机 asp空间
域名注册 域名
域名申请 主页空间
论坛空间 网站空间
国际域名 虚拟空间
空间租用 DDOS防火墙
成都主机托管 四川主机托管
主机租用 服务器租用
网站目录 自助建站
虚拟主机 网址大全
软件下载
自助链接
虚拟主机资讯 特价虚拟主机
版权申明:本站文章均来自网络,如有侵权,请联系我们,我们收到后立即删除,谢谢!
关于我们:站长天空:专业提供最新的站长资讯、在线教程、虚拟主机权威评测、虚拟主机性能对比、网站制作教程,开发教程,站长工具。包括网页制作教程、冲浪宝典、编程参考、操作系统、软件教学、行业动态等。
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有。
发表评论 打印  刷新     关闭