赵刚:搜索引擎索引并处理网页的原理

时间:2010-08-03 00:41来源:赵刚 作者: 点击:

  赵刚在上一篇文章中给大家简单阐述了搜索引擎抓取网页的基本原理。如需了解上一篇的内容请到百度搜索赵刚的网站推广进入查看;紧接着搜索引擎就开始对已经抓取到的网页进行处理,为下一步的排序做准备了!

  一 般搜索引擎会由专门的分析索引系统程序对收集回来的网页进行分析,然后并提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关 键词位置、生成时间、大小、与其它网页的链接关系等),在搜索引擎提取到网页的基本信息之后,根据一定的相关度算法进行大量复杂计算,针对页面文字中及超 链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。本文由赵刚首发网站推广的博客,如果转载请保留版权!

  赵刚觉得其中,最重要的就是提取关键词,建立索引文件。其他的操作还包括去除重复网页、分析超链接、计算网页的重要度等等。

  类似与上边的这一系列的进程,我们做网站推广和网站优化的是看不到的,但是却可以明显的感觉的到。这也就是我们做网站优化的切入点。毕竟赵刚觉得这些最基本的东西也是搜索引擎最核心最经典的,他们是不会有大的改变的,即便是有也是一些算法的改进和完善。

  只有当你了解了搜索引擎的这些基本原理之后,你所做的优化工作就会轻松很多,更不会迷茫!由于时间关系,赵刚就先简单介绍到这,下一篇文章会给大家分享搜索引擎的排序并提供检索服务的功能!

  本文由赵刚首发赵刚的网站推广博客,如果转载请保留此版权!更多关于网站优化推广请访问:www.cnzg5.com.cn



特别申明:本站文章均来自网络文摘,如有侵权,请联系我们 ,我们收到后将立即删除!
特别注意:本站属于IT网络文摘站,所有转载文章言论不代表本站观点,本站所提供的照片,插画等,版权归原作者所有。
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码:点击我更换图片

Copyright 2003-2005 中华龙腾网(www.f361.com)
地址:中国.成都 邮编:610039 电话:13880439919(值班)
点击这里给我发消息 QQ:245104558 395441976(已满) MSN:fly361@hotmail.com mailto:webmaster@f361.net
本站CNNIC信息 新网互联授权证明 信息业务经营许可证备案编号:蜀ICP备05005991号