一对一免费咨询: 13913005726 025-66045668

一、搜索引擎的历史

二、搜索引擎的技术现状

三、站内搜索和公网搜索

四、中文分词和检索

五、搜索的未来

今天来讨论搜索引擎,很有意思的是徽剑作为技术背景的从业人士,曾经也参与了搜索引擎的开发,开发过一套基于互联网的情报系统,就是当年百度李彦宏也曾经干过的事。后来一直也在关注搜索技术。现在徽剑手上还有两套搜索引擎系统的方案。

需要指出的是,由于考虑到读者群体,徽剑在这篇文章中基本上以原理为主,对于一些涉及细节的东西,除了关键的地方以外,一般都会略去不说。希望讨论搜索引擎这个话题的可以联系徽剑,或者加入QQ群21423628 搜索技术研究与实践,这里主要讨论搜索技术、分词、数据检索挖掘、技术开发等系列问题,特别是前沿问题,刚建立的,人不多。不过这个群不欢迎所谓的SEO人士。在徽剑看来,所谓中国的SEO基本都是糊弄人的,这个群里面发现一个清理一个。

徽剑在这里推荐英文好的朋友可以去阅读一篇文章《The Anatomy of a Large-Scale Hypertextual Web Search Engine》,是讲谷歌雏形的东西.一些主要的技术都提到了。不妨可以把徽剑的本文和那篇文章对照起来阅读,相信你对搜索引擎会有更深的认识。

一、国内搜索引擎的历史

首先让我们来看看搜索引擎的历史:

最早的计算机是用于计算弹道轨迹的,但随后人们就把它用于信息检索,其实搜索引擎就是一种信息检索。而计算机检索系统也就是搜索引擎,我们可以这么说,计算机出现后不久,就出现了搜索引擎。

照IT历史研究人员的说法,计算机信息检索可南宁网站建设公司以分为三个阶段:

首先是早期的脱机检索:其特点是不对一个检索提问立即作出回答,而是集中大批提问后进行处理,且进行处理的时间较长,人机不能对话,

1954年,美国海军首先采用IBM-701型计算机建立了世界上第一个科技文献检索系统,实现了单元词组配检索,检索逻辑只采用逻辑与,检索结果只是文献号。

1958年,美国通用电器公司将其加以改进,输出结果增加了题名、作者和文献摘要等项目。1964年,美国化学文摘服务社建立了文献处理自动化系统,使编制文摘的大部分工作实现了计算机检索。

同年,美国国立医学图书馆建立了计算机数据库,即医学文献分析与检索系统,不仅可以进行逻辑或、与、非等种运算,而且还可以从多种途径检索文献。

第二阶段是联机信息检索,从60年代中期到70年代初。由于计算机分时技术的发展,通信技术的改进,以及计算机网络的初步形成和检索软件包的建立,用户可以通过检索终端设备与检索系统中心计算机进行人机对话,从而实现对远距离之外的数据库进行检索的目的,即实现了联机信息检索。出现了美国的DIALOG系统、ORBIT系统、BRS系统、欧洲的ESA-IRS系统等。

第三个阶段是网络化联机检索阶段,此阶段是从70年代初到现在。由于数据通信网都可为情报检索传输数据。用户可借助通讯网络直接与检索系统联机,从而实现不受地域限制的联机信息检索。像美国的DIALOG信息公司已成为全世界最为著名的联机检索服务机构。

到了上个世纪90年代,联机检索正式从科研、教育等大型机构,走向了大众的日常生活。让我们来看看报道:

90年初当时万维网还未出现,为了查询散布在各个分散的主机中的文件,曾有过Archie, Gopher等搜索工具。随着互联网的迅速发展,基于HTTP访问的web技术的迅速普及,在1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线,它还支持Gopher和Telnet搜索。同年4月,Yahoo目录诞生,随着访问量和收录链接数的增长,开始支持简单的数据库查询。这就是早期的目录导航系统。

1994年7月,Lycos推出了基于robot的数据发现技术,并支持搜索结果相关性排手机wap网站建设序,并且他第一个开始在搜索结果中使用了网页自动摘要。Infoseek也是同时期的一个重要代表,他们是搜索引擎史上一个重要的进步。

1995年,一种新的搜索引擎工具出现了元搜索引擎,第一个元搜索引擎是华盛顿大学的学生开发的Metacrawler。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。

1995年12月才登场亮相的AltaVista推出了大量的创新功能使它迅速到达当时搜索引擎的顶峰,它第一个支持自然语言搜索的搜索引擎,具备了基于网页内容分析,智能处理的能力,第一个实现高级搜索语法的搜索引擎, 同时AltaVista还支持搜索新闻群组(Newsgroups),搜索图片等具有划时代意义的功能。同时期还有inktomi,HotBot等搜索引擎。

1997年8月Northernlight 公司正式推出搜索引擎,它第一个支持对搜索结果进行简单的自动分类,也是当时拥有最大数据库的搜索引擎之一。

1998年10月,Google诞生。它是目前最流行的搜索引擎之一,具备很多独特而且优秀的功能,并且在界面等实现了革命性创新。

1999年5月,Fast(Alltheweb)公司发布了自己的搜索引擎AllTheWeb,它的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。它曾经是最流行的搜索引擎之一,后在2003年2月被Overture收购。

以上就是国际的搜索引擎发展历史。下面来看看中文搜索引擎发展历史。


1996年8月成立的搜狐公司是最早参与作网络信息分类导航的网站,台湾中正大学吴升教授所领导的GAIS实验室1998年1月创立了Openfind中文搜索引擎,是最早开发的中文智能搜索引擎,采用GAIS实验室推出多元排序(PolyRankTM)核心技术。

北大天网是教育网最流行的搜索引擎,它由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务, 2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。2003年7月,北京天网时代科技有限公司完全收购了北大天网,巢湖网站建设公司开展搜索相关业务。

百度中文搜索由前Infoseek工程师李彦宏和好友徐勇2000年1月创建,目前支持网页信息检索,图片,Flash,音乐等多媒体信息的检索。


 


 南京牧狼文化传媒有限公司简介:


      牧狼传媒,牧者之心,狼者之性,以牧之谦卑宽容之心待人,以狼之团结无畏之性做事!


  公司注册资金100万,主营众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放以及电商营销推广全案等相关业务,致力于为客户提供更有价值的服务,创造让用户满意的效果!


  为百度官方及其大客户、苏宁易购、金山WPS秀堂、美的、创维家电、新东方在线、伊莱克斯、宝丽莱等国内国外知名品牌服务过,服务经验丰富!同时,公司也是南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位,可以为您提供更好的服务!


  主营项目:众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放、竞价托管、网站优化、电商代运营等


  合作客户:百度、苏宁易购、饿了么、美的、创维家电、新东方在线、宝丽莱、金山WPS秀堂、伊莱克斯


  资质荣誉:百度商业服务市场2017年度最佳图片服务商、南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位、八戒通TOP服务商、"易拍即合杯"H5创意大赛"三等奖"。



致力于为客户创造更多价值
13913005726 025-66045668
需求提交
电话咨询
在线咨询