互联网基础性技术元搜索引擎概述

域名号子 391 0

摘要:元搜索引擎是互联网基础性技术,针对元搜索引擎的研究有利于推动互联网技术的深入发展。元搜索引擎如今被广泛引用于各个领域之中,对于数据的搜集与管理具有重要的意义。


互联网基础性技术元搜索引擎概述-第1张图片-优米村(YOUMICUN.COM)
关键词:元搜索引擎;计算机;互联网

中图分类号:TP311文献标识码:A文章编号:1007-9599 (2012) 01-0000-02

Overview of Internet Basic Technology Meta-search Engine

Xiao Zhen

(China University of Petroleum East Campus,Dongying257061,China)

Abstract:Meta- search Engine is a basic Internet technology.Related research about Meta-search Engine can promote the further development of the Internet technology.Recently,Meta-search Engine has been used in a series of fields and is quite significant to search and manage data.

Keywords:Meta-search Engine;Computer;Internet

元搜索引擎是互联网基础性技术,其对于互联网的发展起到了巨大的推动作用。针对元搜索引擎的研究,能够有效地提升对互联网的使用效率。本文主要就元搜索引擎的基本特点、工作原理以及系统结构等几个方面对其展开研究,同时也就其存在的问题进行初步的探讨,希望能够对从事相关工作的人员有所启发。

一、元搜索引擎概述

(一)元搜索引擎

元搜索引擎是由检索请求提交机制、检索接口机制、以及检索结果显示机制所组成的信息收集与处理程序。请求提交的主要功能是将用户的个性化信息检索要求,提交给检索接口机制,其中包括的内容有所采用的搜索引擎的种类,检索时间、以及数量等。“接口”在接到请求后,将所提交的信息转换成计算机可以识别的语言,并且从本地数据库内调去用户所需要的信息,并且将信息提交给“结果显示”,结果显示会将信息进行重新整理,并且以用户能够识别的方式进行输出。这是元搜索引擎的基本工作机制。

(二)元搜索引擎的原理

元搜索引擎是一种双层客户机,或者说是一种以服务器为基础的系统。其主要的功能就是根据客户检索请求,向单个或是多个搜索引擎提出检索要求,然后由具体的搜索引擎执行。搜索引擎执行元搜索引擎检索请求后将检索结果反馈给元搜索引擎,元搜索引擎则从多个搜索结果中整理出最佳的结果反馈给用户。不同的元搜索引擎可能在机制上存在着一定的差异,但是其基本原理是相同的。

(三)元搜索引擎的分类

元搜索引擎可以分为目标搜索式引擎、提问搜索式引擎等。这种分类主要是根据搜索引擎的编译方式和显示结果来区分的。不同的搜索引擎存在着很大的区别。目标式搜索引擎可以连续对目标进行搜索。另外一些则是根据不同的提问,同时进行搜索。提问式搜索引擎具有将检索提问变成目标搜索引擎的提问语言,而有一些则原封不懂的发送给目标引擎。元搜索引擎还可以根据功能进行划分,其中多线搜索式当今搜索引擎的主流,All in One式搜索引擎也是一种十分流行的搜索引擎模式。

二、元搜索引擎的系统模块研究

(一)GUI图形化用户接口

GUI图形化接口的主要功能是实现用户与程序之间的信息交互,其能够将用户所发出的原始信息转换成计算机可以识别的语言,并且将搜索结果以图形的方式反馈给用户。GUI图形化用户接口,能够以使用命令的方式,实现人机交互,并且将用户的查询请求提交给系统。

同时,GUI界面能够为用户设定搜索引擎成员列表,根据不同的搜索引擎特性,为用户选择最为适合的引擎。并且自动设定等待时间、反馈结果数量以及反馈方式等。这部分信息可以保存在客户端的用户cookie中,以便用户下次调取,从而提高使用效率。Cookie的主要功能就是保存搜索记录,并且对于搜索结果进行深入的整理和挖掘,便于用户的调取和使用。

(二)查询预处理器

查询预处理器的主要功能是将原始查询请求进行分类处理,并且通过交叉语言检索功能以及自然语言检索功能进行编辑,然后将所需要查询的信息进行重新分类整理。

(三)成员搜索引擎调度器

用户可以根据搜索习惯以及搜索历史,设定具有个性化的搜索引擎,也就是说元搜索引擎能够为用户提供个性化的搜索服务。如果用户并不满意自己的设定的成员搜索引擎,则可以根据成员搜索引擎的调度机制,将主题、领域以及区域等信息,添加到原有的成员搜索引擎之中,从而改变原有引擎的搜索习惯。例如,用户可以添加相应时间、反馈数量等等,从而生产出符合自己需求的搜索引擎列表。由于成员搜索引擎的信息(特别是查询串的格式化信息)经常发生变化,如果将它们的代码固定在元搜索引擎得主程序中显然是不合理的,因此我们采用了成员搜索引擎描述文件,以xml进行描述,采用形式化描述,对于每个新加入的成员搜索引擎,只要按照这个形式为其建立一个描述文件,就很容易将其加入到系统中。

(四)查询分发器

查询分发器的主要功能是接受成员引擎的调度列表,通过调用数据库信息,读取成员引擎的信息。并且根据这些信息,启动相应的成员引擎,同时向它们发送查询信息。查询信息的主要内容有:主机信息;连接信息;查询参数的格式信息等。查询功能主要依靠的是数据库连接,其中部分信息是通过查询来进行的。一方面可以减少数据库的连接次数,另一方面可以在最大程度上集中使用查询信息,从而提高查询速度。

(五)查询

查询的主要功能是提供元搜索引擎所需的交互接口。其具体的机制是首先从分发器中提取查询格式,然后向分发器回馈查询参数信息,而后根据查询结果将查询信息进行本地化处理,如果成员搜索引擎无法支持元搜索引擎的高级检索功能,那么其必须将查询信息转化成其所能够接受的格式。比如:不支持短语检索,通配符功能等。在处理的时候,删除原来的查询串中的这部分请求信息。

而后,元引擎将本地化的查询结果反馈到成员引擎。由于部分服务器可能存在着不可用的情况,因此可以先行执行类似于ping的命令程序,这一程序的主要功能是检测服务器是否可用,如果发现不可用,那么查询器会自动停止发送查询请求,从而转向其他服务器,这样可以有效地缩短查询时间。

(六)综合处理模块

综合处理模块是元引擎的核心模块,元引擎的搜索效率主要是由综合处理模块所决定的。综合处理模块由若干个功能不同的模块所组成,因而具有综合处理能力。其主要包括以下几部分:

(1)结果收集模块。该模块的主要功能是同步接收成员引擎的反馈结果,并且将其反馈给用户。

(2)网页过滤模块。该模块可以过滤重复信息,根据用户的所设定的要求,以及时间、领域等,将不符合条件的信息过滤,从而确保信息更为准确。

(3)网页排序模块。该模块的主要功能是,根据用户设定的要求,将反馈信息进行系统化的排序,从而方便用户检索对比。

综合模块的主要功能就是对搜索结果进行综合性的处理,并且通过GUI将信息反馈给用户。同时,综合模块还具有搜索评价功能,并且将搜索记录自动记录进用户的Cookie之中,通过记录用户的检索习惯,从而提高检索的效率。

(七)数据库

数据库是元搜索引擎的重要组成部分之一,其主要包括实际意义上的数据库,以及一些系统配置文件与设置信息等。这些信息有关于自然语言的问答,成员搜索引擎的信息、用户信息等。在具体实现的过程中,可以将这些信息存储在客户端之中,从而减少服务器的存储压力。

三、总结

互联网拥有庞大的信息资源,并且在不断地膨胀之中。搜索引擎的开发与利用直接关系到用户对于有效信息资源的获取。不仅如此,搜索引擎对于企业内部的数据库管理也具有现实意义,因此针对搜索引擎的研究是十分必要的。经过研究,笔者发现,目前搜索引擎主要存在的问题是如果扩展其独立搜索的能力,从而提高检索的查全率。然而实现这一目的的主要困难在于成员搜索引擎的自治性集成存在一定的技术难点,尤其体现在检索界面的差异,文档索引方式的差异等方面。在今后的研究中,我们将对这些问题进行深入的探索,尝试设计出具有自身特色的搜索语法,并且改善搜索引擎的检索评价机制以及成员引擎的自动调度功能,从而让整个搜索系统更加智能化,进而满足用户不断地增加的需求。

参考文献:

[1]张丽丽,武振毅.元搜索引擎在网络信息检索中的应用[J].信息技术,2010,5

[2]吴楠.元搜索引擎的研究[J].中国舰船研究,2009,5

[3]任洪平.中文元搜索引擎成员搜索引擎的选择策略研究[J].图书馆学研究,2010,1

[4]唐培丽,胡明,解飞.元搜索引擎研究[J].气象水文海洋仪器,2009,Z1

[作者简介]肖震,学校:中国石油大学华东校区,专业:计算机技术,研究方向:搜索引擎。


注:本文为网友上传,不代表本站观点,与本站立场无关。

标签: 元宇宙 搜索引擎 元搜索 chatgpt 人工智能

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~