Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理.
示例:搜索关于www起源的一些历史资料.
搜索:“www的历史 internet”
结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www 的. 已搜索有关www的历史 internet的中文(简体)网页. 共约有75,100项查询结果,这是第1-10项 . 搜索用时0.22秒.
我们看到,搜索“www的历史 internet”,但搜索引擎把“www”和“的”都省略了.于是上述搜索只搜索了“历史”和“internet”.这显然不符合要求.这里我顺便说一点搜索引擎分词的知识.当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词.所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索.
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号.
搜索:“+www +的历史 internet”
结果:已搜索有关+www +的历史 internet的中文(简体)网页. 共约有25,000项查询结果,这是第1-10项 . 搜索用时0.05秒.
另一个强制搜索的方法是把上述的关键字用英文双引号引起来.在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语.
搜索:“"www的历史" internet” 结果:已搜索有关"www的历史" internet的中文(简体)网页. 共约有7项查询结果,这是第1-6项 . 搜索用时0.26秒.
我们看到,这一搜索事实上把“www的历史”作为完整的一个关键字.显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求.
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行.
|