Easy To Manage The World Network Technology

TEL:18995488365 QQ:627252942

首 页 企业建站 维护助理 代管之家 网站优化 推广精灵 技术交流 下载中心 客户中心
易管天下域名注册、虚拟主机租售
浅析搜索引擎对页面的收录原理以及收录方式
易管天下-最新信息:《浅析搜索引擎对页面的收录原理以及收录方式 》2009/12/20 14:34:03!网站托管,网站保姆,网站SEO,网站优化,以及搜索引擎研究,SEO技术等
分享到QQ空间 分享到腾讯朋友

浅析搜索引擎对页面的收录原理以及收录方式

易管天下 www.egtx.net  来源:网摘 中国搜索引擎研究

搜索引擎收录页面实际上就是在互联网上进行数据采集,这是搜索引擎最基础的工作,而搜索引擎的内容都来自后台的庞大的URL列表,通过这些URL,不断的收录,储存及维护,而学习搜索引擎收录的流程,收录原理及收录方式,有效的提高搜索引擎对网站的收录的数量!

  1.页面收录流程

  在互联网中,URL是每个页面的入口地址,”蜘蛛程序”通过这些URL列表抓取到页面的,“蜘蛛”不断的从这些页面中获取URL资源及存储页面,并加入URL列表,如此不断的循环,搜索引擎就可以从互联网中获取到足够的页面。

  URL是页面的入口,则域名则是网站的入口,搜索引擎就是通过域名进入网站,挖掘URL资源,换而言之搜索引擎在互联网中抓取页面的首要任务就是要有庞大的域名列表,在不断的通过域名,进入网站抓取网站中的页面,而对于咱们而言,想搜索引擎收录,首要条件就是加入搜索引擎的域名列表,常见加入搜索引擎的域名列表的有以下两种方式

  利用搜索引擎提供的网站登录入口,向搜索引擎提交网站域名,例如百度的:www.baidu.com/search/url_submit.html,可在此提交自己的网站域名,不过用此方法搜索引擎只会定期进行抓取并更新,这种做法比较被动,从域名提交网站被收录花费的时间也比较长。

  通过与有质量的“外链”,使搜索引擎在抓取“别人”的网站页面时发现我们的网站,从而实现对网站的收录,这种方法主动权在我们手上,(只要我们有足够多的“外链”)且收录速度比第一种方法快,根据外部链接的数量、质量相关性,一般2-7天就会被搜索引擎收录。

  2.页面收录原理

  通过学习“页面收录流程”可以掌握加快网站被收录的方法,接着来学习页面收录原理,从而提高搜索引擎收录的数量!

  如果把一个网站页面组成的页面看做是一个有向图,从指定的页面出发,沿着页面中的链接,按照某种特定的策略对网站中的页面进行遍历。不停地从URL列表中移出已经访问的URL,并存储原始页面,同时提取原始页面中的URL的信息:再将URL分为域名及内部URL两大类,同时判断URL是否被访问过,将未访问过的URL加入URL列表中。递归地扫描URL列表,直至耗尽所有URL资源为止。经过这些工作,搜索引擎就可以建立庞大的域名列表、页面URL列表并储存足够多的原始页面。

  3.页面收录方式

  知道了“页面收录流程”和“页面收录原理”然而在搜索引擎中要获取相对重要页面,就涉及到了搜索引擎的页面收录方式,页面收录方式是指搜索引擎抓取页面时所使用的策略,目的是为了能在互联网中筛选出相对重要的信息,页面收录的方式的制定取决于搜索引擎对网络结构的理解。如果使用相同的抓取策略,搜索引擎在同样的时间内可以在某一网站中抓取到更多的页面资源,则会在该网站停留更长的时间,收录的页面数自然也就多了。因此,加深对搜索引擎页面收录方式的认识,有利于为网站建立友好的结构,提高被收录的数量。

  搜索引擎搜收录页面的方式主要要有“广度优先”、“深度优先“及”用户提交“(用户提交暂时不讲)三种,认识这三种页面收录方式及各自的优缺点!

  广度优先

  如果把整个网站看做一棵树,首页就是根,每个页面就是叶子。广度优先是一种横向的页面抓取方式,先从树的较浅层开始抓取页面,直接抓完同层次的所有页面后才进入下一层。因此,在对网站进行优化时,我们应该把网站相对重要的信息展示在层次比较浅的页面上(例如:在首页推荐一些热门的内容)。反过来,通过广度优先的抓取方式,搜索引擎就可以首先抓取到网站中相对重要的页面。

  首先,”蜘蛛“从网站的首页出发,抓取首页上所有连接指向的页面,形成页面集合A,并分析出A中所有页面中的链接:在跟踪这些链接抓取下一层的页面,形成页面集合B:就这样递归地从浅层页面中解析出链接,再从深层页面,直至满足某个设定的条件才停止抓取进程

本新闻共2页,当前在第1页  1  2  

分享到QQ空间 分享到腾讯朋友
今日头条

·短篇小说:《情场父子兵》
·学海日记:《十年青春正流逝》(卷二
·学海日记:《十年青春正流逝》(卷一
·诗集:《无题的意象》(71-80)
·诗集:《无题的意象》(61-70)
·诗集:《无题的意象》(51-60)
·诗集:《无题的意象》(41-50)
·诗集:《无题的意象》(31-40)
·诗集:《无题的意象》(21-30)
·诗集:《无题的意象》(11-20)

技术交流

· 腾讯微博-iWeibo系统 打造属于
· 什么是WAP?深入了解WAP
· 全面封阻六种主要网络威胁
· 应用指南:利用网络设备防范TC
· 三招提高FTP服务器安全性

网站维护

· 通用电气(中国)网站维护案例分析
· 网站建设、网站维护、网站运营过
· 国家计算机病毒中心发现恶意木马
· 《计算机信息网络国际联网安全保
· 一切从零开始 如何快速提升网站的

客户中心

· 个人诗集《幸福若海》(作者:
· 中卫精艺汽车服务有限公司
· 中卫街搜,爱生活,爱中卫,爱
· 中卫SEO培训-“中卫市企业网站
· 宁夏SEO免费培训--我为自己做代
· 北京九鹿鹿业-鹿血酒(保健酒)
· 电子商务十二五发展规划(全文)
· 易管天下免费培训--我为自己做

相关连接:
上一篇:浅谈网站优化与搜索引擎优化
下一篇:SEO搜索引擎优化六个小秘诀
相关网络广告: