Easy To Manage The World Network Technology

TEL:18995488365 QQ:627252942

首 页 企业建站 维护助理 代管之家 网站优化 推广精灵 技术交流 下载中心 客户中心
易管天下域名注册、虚拟主机租售
搜索引擎三大定律
易管天下-最新信息:《搜索引擎三大定律 》2006/12/6 16:04:32!网站托管,网站保姆,网站SEO,网站优化,以及搜索引擎研究,SEO技术等
分享到QQ空间 分享到腾讯朋友

搜索引擎三大定律

E 管天下(易管天下) www.egtx.net    来源:网摘
--------------------------------------------------------------------------------


搜索引擎走到今天,已经是一个结束过去,开辟未来的时候了。为了说清楚我所讲的第三定律,我们先来回顾一下第一和第二定律。

■ 第一定律 相关性定律
 听起来象是一篇学术论文,的确,就连第一,第二定律的提法以前也没有过,但是第一,第二定律的内容确早已在业界和学术界得到了公认。其实这第一定律是早在互联网出现之前就被学术界广泛研究过的,那就是所谓的相关性定律。这个领域那时叫情报检索,或信息检索,也有叫全文检索的。
 那时的相关性都是基于词频统计的,也就是说,当用户输入检索词时,搜索引擎去找那些检索词在文章(网页)中出现频率较高的,位置较重要的,再加上一些对检索词本身常用程度的加权,最后排出一个结果来(检索结果页面) 。早期的搜索引擎结果排序都是基于本文的第一定律的,如Infoseek,Excite,Lycos等,它们基本上是沿用了网络时代之前学术界的研究成果,工业界的主要精力放在处理大访问量和大数据量上,对相关性排序没有突破。

 词频统计其实根本没有利用任何跟网络有关的特性,是前网络时代的技术。然而,网络时代的主要文献是以网页的形式存在的,而几乎每个人都可以随心所欲地在网上发表各种内容,词频相同的两个网页,质量相差可以很远,可是按照搜索引擎的第一定律,对这两个网页的排序应该是一样的。为了能够派在某些检索结果的前几位,许多网页内容的制作者绞尽脑汁,在其页面上堆砌关键词,搜索引擎对此防不胜防,苦不堪言。这种情况到了 1996年开始有了改变。

■ 第二定律 人气质量定律
 1996年4月,我到赌城拉斯维加斯开一个有关信息检索方面的学术会议,会议的内容就象拉斯维加斯的天气一样,照例比较枯燥乏味。但远离公司的我,却难得有一个静下心来认真思考问题的机会。就在听一个毫不相干的论文演讲的时候,我突然把科学引文索引的机制跟Web上的超级链接联系起来了 - 感谢北大,她在我上大三的时候就教授了我科学引文索引的机制,美国恐怕没有一所大学会在你本科的时候教这玩艺儿。

 科学引文索引的机制,说白了就是谁的论文被引用次数多,谁就被认为是权威,论文就是好论文。这个思路移植到网上就是谁的网页被链接次数多,那个网页就被认为是质量高,人气旺。在加上相应的链接文字分析,就可以用在搜索结果的排序上了。这就引出了搜索引擎的第二定律:人气质量定律。根据这一定律,搜索结果的相关性排序,并不完全依赖于词频统计,而是更多地依赖于超链分析。

我意识到这是一个突破性的东西,回去以后就很快总结了思路,于96年6月申请了这一方面的美国专利。1999年 7月6号,美国专利和商标局批准了专利号为5,920,859的,以我为唯一发明人的专利。大约在96年底,斯坦福大学计算机系的两位研究生也想到了同样的解决方法,他们后来创立了一个叫Google的搜索引擎,Google的网站上至今仍然说他们的这项技术是Patent-pending (专利申请中) ,不知道美国专利局是不是还会再批这样的专利。Anyway, 超链分析的方法98年以后逐渐被各大搜索引擎所接受,由于链接是网络内容的一个根本特性,这时候的搜索引擎才开始真正利用网络时代的检索技术。世事难料,2000年起网络泡沫迅速破灭,各大搜索引擎要么遭人收购,要么推迟上市,所有使用人气质量定律的搜索引擎公司都未能幸免。那么,搜索引擎的出路到底在哪儿?

■ 第三定律 自信心定律
 人气质量定律解决的还是一个技术层面的问题,然而搜索引擎从诞生的那一天起,从来就不是一个纯技术现像,它融合了技术,文化,市场等各个层面的因素。解决搜索引擎公司的生存和发展问题需要搜索引擎的第三定律--自信心定律。

本新闻共2页,当前在第1页  1  2  

分享到QQ空间 分享到腾讯朋友
今日头条

·短篇小说:《情场父子兵》
·学海日记:《十年青春正流逝》(卷二
·学海日记:《十年青春正流逝》(卷一
·诗集:《无题的意象》(71-80)
·诗集:《无题的意象》(61-70)
·诗集:《无题的意象》(51-60)
·诗集:《无题的意象》(41-50)
·诗集:《无题的意象》(31-40)
·诗集:《无题的意象》(21-30)
·诗集:《无题的意象》(11-20)

技术交流

· 腾讯微博-iWeibo系统 打造属于
· 什么是WAP?深入了解WAP
· 全面封阻六种主要网络威胁
· 应用指南:利用网络设备防范TC
· 三招提高FTP服务器安全性

网站维护

· 通用电气(中国)网站维护案例分析
· 网站建设、网站维护、网站运营过
· 国家计算机病毒中心发现恶意木马
· 《计算机信息网络国际联网安全保
· 一切从零开始 如何快速提升网站的

客户中心

· 个人诗集《幸福若海》(作者:
· 中卫精艺汽车服务有限公司
· 中卫街搜,爱生活,爱中卫,爱
· 中卫SEO培训-“中卫市企业网站
· 宁夏SEO免费培训--我为自己做代
· 北京九鹿鹿业-鹿血酒(保健酒)
· 电子商务十二五发展规划(全文)
· 易管天下免费培训--我为自己做

相关连接:
上一篇:搜索引擎优化:网站自然排名
下一篇:网站维护知识:搜索引擎基本工作原理
相关网络广告: