期刊库

教育   经济   科技   财会   管理   
医学   法学   文史   工业   建筑   
农学   水利   计算机   更多>>
 首 页    论文大全   论文精品    学术答疑    论文检测    出书咨询    服务流程    诚信通道    关于我们 

浅探网络环境下搜索引擎的使用

人气指数: 发布时间:2011-11-05 11:07  来源:http://www.zgqkk.com  作者: 中国期刊库
分享到:

 

    【摘  要】  随着网络信息时代的到来,信息检索处于1个互联的网络系统之中,用户、信息检索技术、信息资源构成信息检索3个基本要素。主要通过Intemet搜索引擎来介绍信息检索技术。

    【关键词】  网络  信息检索  搜索引擎 
    1、前言 
  
随着Internet的迅速发展,网上信息正以爆炸性的速度增长,其资源内容几乎涉及所有领域,已经成为知识、信息的集合体,是人们获取信息的基本工具。在Internet网上进行浏览和检索,就好比进入了世界上最大的图书馆,而这个图书馆里的书刊、杂志、广告、新闻及各种形式的文献信息全都没有规律地排放着,没有1个中心目录将这些信息组织起来。正是因为Internet资源既丰富又分散且处于无序状态,使得人们在网上查找自己所需的信息并非易事。这时为满足人众信息检索的需求,搜索引擎便应运而生。搜索引擎是指使用某些自动索引软件来发现、收集网络上的信息,然后对收集的网页进行标引,建立1个可供查询的大型数据库。 
Intemet提供了多种不同的检索工具,它们各自有各自的数据库、语言、检索功能和显示方式,对用户来说,最重要的就是熟悉这些工具的性能,掌握检索技巧,提高检索的命中率。 
2、搜索引擎的工作原理 
  
搜索引擎的工作原理可以简单概括为:从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。 
从互联网上抓取网页利用能够从互联网上自动收集网页的Spider (又名为:Robot, Crawler,Worms,Wanders)系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其它网页,重复这过程,并把爬过的所有网页收集回来。 
建立索引数据库由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据1定的相关度算法进行大量复杂计算,得到每1个网页针对页面内容中及超链中每1个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。  
在索引数据库中搜索排序当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。说到这里,网络搜索引擎的基本工作原理基本上让大家了解了。 
3、检索技巧 
(1) 科学选择关键词。由于搜索引擎智能化程度的影响,它只能在现存的数据库中查找匹配的关键词,因此,这种匹配相对比较盲目,我们在选择关键词时,要注意两方面的问题,才有可能得到较好的搜索效果。 
(2)使用双引号进行精确查询。如果查找的是1个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最少、最精确。 
(3)使用加号(+)、减号(1)限定查找。很多搜索引擎都支持在搜索词前冠以加号(+)限定搜索结果中必须包含的词汇,用减号(1)限定搜索结果不能包含的词汇。
(4)灵活运用使用通配符。很多搜索引擎支持通配符号,如“*”代表1连串字符,“?”代表单个字符。 
(5)使用逻辑词辅助查找。比较大的搜索引擎都支持使用逻辑词进行更复杂的搜索界定,常用的有:AND (和)、OR (或)、NOT(否)及NEAR(两个单词的靠近程度),恰当应用它们可以使搜索结果非常精确。另外,也可以使用括号将搜索词分别组合,如[(新闻OR足球)AND米卢)NoT 新闻”OR足球) (6) 有针对性地选择搜索引擎。用不同的搜索引擎进行查询得到的结果常常有很大的差异,这是因为它们的设计目的和发展走向存在着许多的不同,比如:Download.com是针对软件类的搜索引擎,可搜寻大量的自由软件和共享软件。驱动之家主要是提供查找驱动程序及硬件厂商信息。 
(7)使用元词检索。大多数搜索引擎都支持“元词”(metawords)功能,用户把元词放在关键词的前面,就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。例如,你在搜索引擎中输入“title:清华大学”,就可以查到网页标题中带有清华大学的网页。其他元词还包括:image,用于检索图片;link,用于检索链接到某个选定网站的页面;URL,用于检索地址中带有某个关键词的网页。 
(八) 细化查询。许多搜索引擎都提供了对搜索结果进行细化与再查询的功能,如有的搜索引擎在结果中有”查询类似网页”的按钮,还有1些则可以对得到的结果进行新1轮的查询。 
(九)尽可能将搜索范围限制在特定的领域里。比如在yahoo中文网站中,你要查找的是与电脑相关的知识,那么你没有必要让搜索引擎在休闲与运动、健康与医药、艺术与人文等其他分类中查找。你可以进入“电脑与因特网”这1类,选中“检索此目录下的网站”。然后再开始搜索。 
4、结束语 
要完成1个有效的搜索,首先要确定要检索的主题,选择合适的检索工具、抽取适当的关键词。为避免可能出现搜索结果的冗余性,要尽可能限制查询范围,正确构造检索式。同时要使用逻辑条件限制及模糊或精确查询的功能保证能真正检索到我们所需的网络信息资源。 
总之,只要掌握1定的方法与技巧并经常实践.利用搜索引擎1定能从网上获取许多有价值的信息。由于网上信息具有动态性、多变性,今天能看到的信息也许明天便不复存在,要注意对检索到的有价值信息的进行保存。 
参考文献 
1。符绍宏,雷菊霞.因特网信息资源检索与利用[M].北京:清华大学出版社,2000 
2。陈春阳。如何利用网络搜索引擎检索网络信息资源。 兰州工业高等专科学校学报。2003 
3。刘毓华。网络信息资源检索初探。现代情报,2003 
4。陈永斌,邱苇.网络时代搜索引擎带来的社会问题[J].图书情报lT作,2006;(3):l19~122 
5。宋蓓玲,王新.浅析构建网络信息检索体系[J].现代情报.2005;(6):54~57 
6。贾红英.网络搜索引擎探析[J].情报资料工作,2002;(3):44~46 
7。张曼玲.现代信息检索[M]。哈尔滨:哈尔滨工程大学出版社,2OOO 
8。费巍,黄如花.基于用户行为分析的搜索引擎优化策略[J].图书情报T作,2005’(10):75-77
  U: you,你;Y: why,为什么;Q: cute,可爱,漂亮;CU: see you,再见。 
  (二)汉语拼音缩略语 
  Gg:哥哥;JJ:姐姐;TMD:他妈的;TNND:他奶奶的。 
  (三)英、汉、数字混合缩略语 
  (1)英文字母、数字混合型 

    期刊库(http://www.zgqkk.com),是一个专门从事期刊推广、投稿辅导的网站。
      本站提供如何投稿辅导,寻求投稿辅导合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


      【免责声明】本文仅代表作者本人观点,与投稿辅导_期刊发表_中国期刊库专业期刊网站无关。投稿辅导_期刊发表_中国期刊库专业期刊网站站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。

     
    QQ在线咨询
    投稿辅导热线:
    180-1501-6272
    微信号咨询:
    fabiaoba-com
    咨询电话:18015016272 投稿邮箱:zgqkk365#126.com(#换成@)
    本站郑重声明:文章只代表作者观点, 并不意味着本站认同。所载文章、数据仅供参考,使用前请核实,风险自负。
    部分作品系转载,版权归原作者或相应的机构   若某篇作品侵犯您的权利,请来信告知.版权:周口博闻教育咨询有限公司 
    Copyright © 2005-2023 . 期刊库 版权所有