陆元婕 2001.12
“美美,问题列出来了吗?”
“嗯,给你看吧。大部分都不是我想要找的。搜索引擎还是不好用。”
“美美,别急,会有办法的,我们一起来找找看。”
司坦福大学——用Google、新浪都没找到与之相符的网页
歌星王菲 精选专辑 -rm——用新浪和Google都没找到有价值的结果
世界杯预选赛 最新新闻——用Google找的都是旧闻。用新浪倒是找到了一些,可是点击过去一看链接的不对啊。
大连 天津街 地图——用Google、新浪都查不到有用的信息。
IT 新闻——在Google中给出的都只是新闻,而没有IT业的新闻。不过新浪倒是不错,有相关的新闻。
看到美美的这张问题列表,小张和妮妮私下研究了一会。 “这些其实不难找。先让小张给你介绍一些基本的搜索技巧吧。然后我们再实战演练几番。”
“好啊,真的能很快就学会搜索吗?我会努力的。现在开始吧……”
一、选择合适的搜索工具
“每种搜索引擎都有不同的特点,只有选择合适的搜索工具才能得到最佳的结果。之前已经介绍过了搜索工具基本上可以分为网页检索(也就是上次说的基于蜘蛛程序的机器人检索系统)和分类目录(即目录式搜索引擎)两种(我们先不谈元搜索引擎)。”
“网页检索实际上是网页的完全索引。分类目录则是由人工编辑整理的网站的链接。”
“这两种搜索工具哪种好用呢?”
“这取决于你想查询的问题。一般来说,如果你需要查找非常具体或者特殊的问题,用网页检索比较合适;如果你希望浏览某方面的信息、专题或者查找某个具体的网站,分类目录会更合适。”
“要是你需要查找的是某些确定的信息,比如Mp3、地图等,就最好使用专门的Mp3、地图等搜索引擎。”
“有这样的专业搜索引擎吗?”
“当然,实际上几乎每一类信息都有非常专业的搜索工具,它们有个名称叫垂直搜索引擎。比如赛迪网的IT罗盘就是以精选式IT垂直搜索为特征的搜索引擎。”
二、使用正确的搜索词
“使用搜索引擎要注意不能写错别字,此外要尽量使用大家比较常用的词语。”
“这是为什么呢?”
“就目前而言,多数搜索引擎不支持容错查询。所以,一定要注意不写错别字。”
“容错查询,就是指即使用户输入了错别字,搜索引擎也能根据某种规则推断出该词的正确写法,给出正确的搜索结果。”
“由于互联网的信息是人来提交的,如果你使用了不常用的词语来搜索,就不大容易找到答案了。比如,你想查有关鼠标的信息,但输入的是‘滑鼠’(港台地区用语),就不容易找到资料了。”
三、正确使用布尔检索
“正确的使用布尔检索方式可以减少搜索结果的返回数。”
“什么是布尔检索?我好像没听过”。
“布尔检索,就是应用布尔表达式的检索方式,比如‘和’(And)、‘或‘(OR)、‘非’(NOT)。其实前面介绍的搜索的数学规则就是这种布尔检索。加号就相当于和,减号就相当于非。而或关系没有介绍,它并不是很常用的检索规则。在搜索时一方面要注意不同搜索引擎工具的布尔检索的表达方法。另一方面,也要注意自己要搜索的内容逻辑关系是否合理。”
四、在点击之前要思考
“成功的搜索=正确的提问 点击有用的结果。”
“这么深奥?解释一下吧。”
“就是说要想得到满意的搜索结果除了要注意搜索条件之外,还取决于你最终点击的那个搜索结果。” “在返回的搜索结果中究竟哪个是真正满意的?在点击之前,你需要通过比较排序位置、网址链接、文字说明等来分析。关于这方面的知识我们在实战演练时再学习。”
五、在实践中取得搜索经验
“搜索技巧和其他的技术一样是在不断练习中总结与成熟起来的。因此你必须不断练习、不断总结。”
“同时,通过练习总结,你可以形成自己的一套有效的搜索习惯。这将有助于更快的完成搜索。好像美美现在这样,遇到一点困难就打了退堂鼓,可是不行的。”
“好了,基本的搜索技巧先讲到这,关键还是多加练习。我们就以美美在搜索时遇到的那几个问题试一下这些搜索技巧吧。” “先让我来试试。我好像已经找到一些原因了。”
“那就说说看吧。”
“司坦福大学,是错别字。应该是斯坦福大学。”
“歌星王菲 精选专辑 –rm,是不是搜索条件太多?试一下,输个简单点的‘王菲 专辑 –rm’,找到了。”
“不仅是这个原因。你要搜索的关键字要符合习惯。这方面,新浪的帮助信息的有介绍。”
“世界杯预选赛 最新新闻。这个问题怎么解决呢?”
“用Google找到的结果确实是比较旧,因为目前Google的搜索数据库的更新是每月一次(平均为28天),所以显然用它来搜索新闻是不合适的。”
“而你在新浪遇到的是死链问题。死链对于搜索引擎而言是很正常的,这不是我帮搜索引擎开脱。实在是因为互联网的信息更新的太快,它不容易抓取。除了死链问题,以后你还会遇到很多属于搜索引擎的不足之处,比如它对于动态网页处理能力不强之类的。”
“那有办法找到这些死链的内容吗?”
“办法有一些。比如google就采用了网页快照的技术。这个我们会在实战演练中详细介绍。”
“另一个办法是:运用一些侦察技巧,加上你的好运气,有可能会找到。”
“什么侦察技巧?”
“由于死链有时是因为网站制作者将文件更换路径而搜索引擎没有及时更新造成的。”
“据此,我们可以使用一种叫做‘URL退选’的方法。也就是将地址栏的网址的文件名一点点删除,在碰到第一个斜杠后停止,然后敲回车键。重复此动作,不断尝试。运气够好的话,就能找到了。”
“听起来很复杂啊。”
“要是你了解一些网站发布的知识会比较容易懂。虽然这种办法并不总有效,但是还是值得尝试的。”
“大连 天津街 地图,这个是不是该用地图搜索引擎?”
“对。比如Go2Map,ChinaQuest之类的地图搜索引擎就能查到。”
“IT 新闻,为什么会查不到呢?”
“这个估计是因为StopWords造成的。”
“什么是StopWords?”
“这个涉及一些搜索技术方面的知识了。就拿英文而言,有大约300个最常用单词本身缺乏实际意义或者使用过于广泛,一旦用来搜索的话,会返回大量的无用的搜索结果甚至导致搜索引擎错误。因此很多搜索引擎都会屏蔽这些关键词。”
“那在新浪怎么就能找到呢?”
“新浪能够给出正确结果可能与它的搜索引擎服务提供商百度的技术有关。”
“太好了,我的问题几乎都解决了。我还想学习更多的搜索知识呢?你们继续教我啊。”
“可以啊,下一次我们会介绍几个比较常用的搜索引擎。”
“我们若能更妥善地搜寻资料,实在已经改变世界。”