当前位置 主页 > 关于我们 > 站长日志 >

    搜索引擎教程,搜索引擎教程概述和技术原理

    栏目:站长日志 时间:2021-03-08 10:58

        概述
        搜索引擎是指运用特定的计算机程序从互联网上搜集信息,经过处理后,将用户检索相关的信息展示给用户的系统。搜索引擎教程的内容有很多,其包括搜索引擎的基本原理、搜索引擎关键技术和搜索引擎体系结构等。
        一、搜索引擎发展史
        互联网发展早期,以雅虎为代表的网站分类目录查询非常流行。网站分类目录由人工整理维护,精选互联网上的优秀网站,并简要描述,分类放置到不同目录下。用户查询时,通过一层层的点击来查找自己想找的网站。也有人把这种基于目录的检索服务网站称为搜索引擎,但从严格意义上讲,它并不是搜索引擎。
        搜索引擎的鼻祖是Archie,1990年由麦吉尔大学的学生Alan Emtage、Peter Deutsch和Bill Wheelan发明。它实际上是一个可搜索的FTP文件名列表。 1993年,内华达州高教系统能检索文件和网页的搜索工具,一直到1994年Yahoo诞生。并在1999年2月,Google完成了从Alpha到Beta版本的转换。2001年8月,中国发布了Baidu.com搜索引擎Beta版。
        二、分类
        搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
        三、主要具体内容
        搜索引擎的基本原理
        首先在互联网中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根据用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
        搜索引擎的关键技术
        信息收集和存储技术、信息预处理技术和信息索引技术
        搜索引擎的体系结构
        一个搜索引擎由搜索器 、索引器 、检索器 和用户接口 四个部分组成。搜索器的功能是在互联网 中漫游,发现和搜集信息。索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档 以及生成文档库的索引表。检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。
        四、影响
        一个网站的命脉就是流量,而网站的流量可以分为两类。一类是自然流量,一类就是通过搜索引擎而来的流量。如果搜索引擎能够能多能有效的抓取网站内容,那么对于网站的好处是不言而喻的。所以,SEO也应运而生了。
        在两大搜索引擎的工作中,百度的工作周期相对来说比google短一些,百度大约在10天左右重新访问网站一次,Google大约在15天左右重新访问一次网站。由于一天之内不能游历全球所有的网站,如果推广网站时,能到更多的网站上提交相应的网站信息,也是加快蜘蛛收录网站内容的重要环节。
        五、未来期望
        随着互联网的发展,网上可以搜索的网页变得愈来愈多,而网页内容的质量亦变得良莠不齐,没有保证。所以,未来的搜索引擎将会朝着知识型搜索引擎的方向发展,期以为搜索者提供更准确及适用的数据。网上的百科全书如雨后春笋般发展起来;另一方面,亦有不少公司尝试在搜索方面改进,务求更符合用户的要求。当中诸如Copernic Agent之类的搜索代理就是其中之一。