Google 的秘密- (个人见解)
(读者)应该没有余地去怀疑象 PageRank 那样利用超级链接来决定排列次序有效手法吧。
不过,阅读了这些论文以后笔者自身也考虑了许多问题。在这里,列举几个对 PageRank 的个人见解。虽是见解,说到底就是方法论,也许会有很多错误的地方。
阅读完整的文章... xddxz on 08月 12th, 2007 | File Under Pagerank | No Comments -
(读者)应该没有余地去怀疑象 PageRank 那样利用超级链接来决定排列次序有效手法吧。
不过,阅读了这些论文以后笔者自身也考虑了许多问题。在这里,列举几个对 PageRank 的个人见解。虽是见解,说到底就是方法论,也许会有很多错误的地方。
为了使更简单地推测上文描述的问题,PageRank 并不是非世界所有的web页面而不能使用的考虑方法,即使是个人的利用方法也能实现。为了实现「Personalized PageRank」,针对在各种 UNIX 和 Windows 上运作的中小规模网站适用的全文检索系统 Namazu 进行了实际安装实验。(关于Namazu可参考 日语全文检索引擎软件列表。)
从注册域名到建立blog到添加文章再到今天写这篇文章不到4天时间。没有做任何其他网站的推广。目前已经被Google完全收录。百度也收录了。仅仅在两个搜索引擎里面提交了下网址。看来Google 和Baidu并没有传说中的那么慢--几个星期,几个月等等,也没有传说中那么傲慢非得你有一定的双向链接等等。目前我的部分文章搜索特定的词汇在搜索结果第二页的第一条左右。比如:Google 内链(约有1,360,000项符合google 内链的查询结果,以下是第11-20项 ),对于一个4天的站点我感觉这已经相当不错了。上面说明要知道让搜索引擎收录你的网站是不难的。
PageRank 的基本考虑方法并不是很难的东西。实用效果中的巨大成分并不是复杂离奇的算法,而是进行简单的线性变换,倒不如都属于简明直观的类别吧。但是,实际使用 Web 超级链接构造来计算 PageRank 的话,不是简单地能够用嘴巴来说明的东西。主要的困难主要有二个。一、由来于纯粹假设的数值模型和现实世界的不同;二,在实际数值计算上(专门技术的)困难。
我们感兴趣的是,在有像超级链接构造那样的互相参照关系的时候,定量地知道哪一个页面是最「重要」的。换句话大胆地说,这个也就是严密计算「应该从哪一页开始读取」这个指标的过程。就算从谁都不看的小页面开始读取也没有办法。
PageRank 是基于「从许多优质的网页链接过来的网页,必定还是优质网页」的回归关系,来判定所有网页的重要性。
最近,搜索引擎 Google (http://www.google.com/)非常引人注目。Google 是基于现担任 CEO 的 Larry Page 和担任总经理的 Sergey Brin (2001年2月)在就读于美斯坦福大学研究生院时所开发的搜索引擎的一种检索服务。Google 从1998年9月开始服务,但 Netscape Communications 在 Google 的测试阶段就开始与其合作,美国 Yahoo! 公司也从2000年6月起将默认搜索引擎(美国 Yahoo! 不能检索时作为增补的搜索引擎)由原先合作的 Inktomi 转换为了 Google。日语版 Google 在2000年9月正式登场,现已被 BIGLOBE(NEC)所采用。 (注:2001年4月 Yahoo! JAPAN 和 @NIFTY,7月索尼,2002年1月 Excite 也相继与 Google 建立了协作关系)。
先看看博客老大到底有多厉害吧!有超过1000000美金一年的哦。
链接不是一个以多制胜的战役,所以我十分费解为什么那么多无知的站长为什么整天兢兢业业地在论坛和博客上留他们的垃圾链接。要想成功地进行搜索引擎优化,首先要明白网站链接的价值。
纽约时报首席搜索战略官,掌管的网站包括NYtimes.com,Boston.com,IHT.com,和About.com上的前500网站。曾经担任About.com及其母公司Primedia的搜索部门总监,服务过的客户包括惠普、国家地理杂志、哥伦比亚广播公司、加拿大广播公司等。