-
Google
搜索从入门到精通
v4.0
(一)
1
、前言
我是在
2000
年上半年知道
GOOGLE
的。在这之前,我搜索英文信息
通常用
AltaVista
,而搜索中文信息
< br>则常用
Sina
。但自使用了
GOOGLE
之后,它便成为我的
Favorite Sear
chengine
了。这也得感谢新浪网
友曹溪,因为当初正是
因为他的大力推介,才使我识得了
GOOGLE
。
记得
1996
年夏季的时候,当我第一次接触
Inter
net
,便被扑面而来的魔力征服了。那种天涯咫尺的感觉,
真
是妙不可言。在经历了疯狂的
WWW
冲浪和如痴如醉的
BBS
沉迷之后,我意识到
Internet<
/p>
对我影响至
深的还是在于学习方式的变迁。
如何来描述这种变迁呢?以
前的学习,一般需要预先在肚子里存储下足够的知识,必要时,就从海量的信
息中提取所
需的部分。这种学习方式造就了很多“才高八斗,学富五车”的大才子。但是,到了信息领域
大大超出“四书五经”的新时期,预先无目的的吞下海量信息的学习方式就有些不合时宜了。比方说,我 p>
们到了大型的图书城,
往往有一种不知所措的感觉。
旧有的学习方式需要变更以适应这个信息爆炸的年代。
目的明确的去学习,即先
知道要学什么,然后有目的的去寻找答案,这种方式看上去更加有效率。我不妨
把这称为
“即学式”,相应的,旧有的称为“预学式”。
不过,“即学
式”的实施是有前提的。首先,
要求学习者拥有一个包罗万象的信息库,以供随时抽取各
种目的信息;其次,是需要一个强劲的信息检索
工具,以便高效率的从信息库中提取信息
。很明显,
Internet
可以充当那个海量的信息库,而搜
索引擎,
则正是寻找光明之火的绝好工具。
“公欲善其事,必先利其器”。<
/p>
Internet
只有一个,而搜索引擎则有
N
多个。有搜索高手说,所谓搜索,
就是“在正确的地方使
用正确的工具和正确的方法寻找正确的内容”。但是,对于普通人而言,掌握诸多
搜索引
擎的可能性似乎不大。
用一两个相对强劲的具代表性的工具达到绝大多数搜索目的更为人
们所迫切
希望。不同的时期,涌现出不同的强者。就目前而言,我们非常幸运的有了:<
/p>
*****GOOGLE*****
2
、摘要
本文简要的介绍了
GOOGLE
的历史和特点,
GOOGLE
的基本搜索语法和高级搜索语法,
GOOGLE
的
特
色功能,包括图片搜索、新闻组搜索和集成工具条等,还简单的介绍了一些常用搜索技
巧和实用个案。尽
管本文名为“
GOOGLE
< br>搜索从入门到精通”,但事实上,笔者对运用
GOOGLE
进行搜索也尚处于“入
门”阶段。
3
、如何使用本文
阅读本文最好具备一些最基本的布
尔代数基础,如“与”、“或”、“非”等。不过,即便你没有这方面
的知识,
也不必在意。
对那些实例进行练习,
你的疑惑就
会迎刃而解。
对于刚刚接触网络搜索的读者而言,
也许你应该从
头到尾的阅读本文;
但对于那些有一定搜索基础的读者而言,
只
需要跳跃着寻找自己所需要
的信息就可以了。当然,如果你有一定的英文基础,也可以把
本文与
GOOGLE
大全(
.
com/
)参照阅读,那样效果会更好。
4
、
p>
GOOGLE
简介
)是一个
搜索引擎,由两个斯坦福大学博士生
Larry
Page
与
Sergey Brin
于
199
8
年
9
月发明,
Google Inc.
于
1999
年创立。
2000
年
7
月份,
Googl
e
替代
Inktomi
成为
Yahoo
公司的搜
索引擎,同年
9
月份,
Google
成为中
国网易公司的搜索引擎。
98
年至今,
GOOGLE
已经获得
30
多项业
p>
界大奖。
GOOGLE
的成功得益于其强大的功能和独到的特点:
GOOGL
E
支持多达
132
种语言,包括简体中
文和繁体中文;
GOOGLE<
/p>
网站只提供搜索引擎功能,没有花里胡哨的累赘;
GOOGLE
速度极快,据说有
p>
10000
多台服务器,
200
多条
T3
级宽带;
GOOGLE
的专利网页级别技术
PageRank
能够提供高命中率的
搜索结果;
GOOGLE
的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是网站简介;
GOOGLE
智能化的“手气不错”
功能,提供可能最符合要求的网站;
的“网页快照”功能,能从
GOOGLE
p>
服务器里直接取出缓存的网页。
5
、搜索入门
要用
GO
OGLE
做搜索,
当然首先要进
GOO
GLE
网站
-
;
不过,
和
.
cn
使用的实际上也是
GOOGLE
搜
索引擎,
只是对搜索结果进行了编排,
但无法提供一些特色功能
,
如图
片搜索等。
第一次进入
GOOGLE
,它会根据你的操作系统,确定语言界面。需要提醒的是,
GOOGLE
是通过
cooki
e
来存储页面设定的,所以,如果你的系统禁用
cooki
e
,就无法对
GOOGLE
界面进行个
人设定了。
< br>GOOGLE
的首页很清爽,
LOGO
< br>下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是
网站搜索。
现在进行第一次搜索实践,要查找所有关于“易筋经”的中文网站和网页。在搜索框内输入一
个关键字“易筋经”,然后点击下面的“
google
搜索
”按钮(或者直接回车),结果就出来了。
搜索:“易筋经”
结果:已搜索有关易筋经的中文
(<
/p>
简体
)
网页。
共约有
5,930
项查询结果,这是第
1-10
项
。
搜索用时
0.1
2
秒。
6
、初阶搜索
在上例子中,你已经知道了最基本
的搜索,即查询包含单个关键字的信息。现在,进一步探讨多个关键字
以及关键字间不同
逻辑关系的查询。
6.1
、搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之
间加上
“
+
”,
而
GOOGLE
无需用明文的
“
p>
+
”
来表示逻辑
“
与”
操作,
只要空格就可以了。
示例:搜索所有包含关键词“易筋
经”和“吸星大法”的中文网页
搜索:“易筋经
吸星大法”
结果:已搜索有关易筋经
吸星大法的
中文
(
简体
)
网页。
共约有
774
项查询结果,这是第
1-10
项
。
搜索
用时
0.24
秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜
索栏内。
6.2
、搜索结果要求不包含某些特定信息
GOOGLE
用减号“
-
”表示逻辑“非”操作。
示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经
-
吸星大法”
结果:已搜索有关易筋经
-
吸星大法
的中文
(
简体
)
网页。
共约有
5,150
项查询结果,这是第
1-10
项
。
搜
索用时
0.40
秒。
注意:这里的“
+
< br>”和“
-
”号,是英文字符,而不是中文字符的“+”和
“-”。此外,操作符与作用的
关键字之间,不能有空格。比如“易筋经
-
吸星大法”,搜索引擎将视为关键字为易筋经和吸星大法的逻
辑“与”操作,中间的“
-
”被忽略。
6.3
、搜索结果至少包含多个关键字中的任意一个
GOOGLE
用大写的“
OR
”表示逻辑“或”操作。假定你是布兰妮和
批头士的歌迷,现在要查找所有关于
布兰妮和批头士的中文网页。
示例:搜索包含布兰妮“<
/p>
Britney
”或者披头士“
Beat
les
”、或者两者均有的中文网页。
搜索:“
Britney OR
Beatles OR
布兰妮
OR
批头士”
结果:已搜索有关
Britney OR Beatles
OR
布兰妮
OR
批头士的中文<
/p>
(
简体
)
网页。
共约有
31,300
项查询
结果,这是第
1-10
项
。
注意:小写的“
or
”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
6.4
、
“
+
”、“
-
”和“
OR
”的混合查询
混合查询涉及到逻辑操作符的顺序
问题。一般而言,搜索引擎按照从左往右的顺序读取操作符号。如果只
涉及“与”操作和
“非”操作,则不会产生顺序问题,搜索结果数量和关键字顺序无关,不过,具体搜索
的
结果顺序会视关键字的顺序而定。单纯的“或”操作也同样道理。但是,如果“或”查询和其他两种查
询混合在一起,问题就复杂了。现在我们做这样的查询:“所有关于
Bri
tney
或者
Beatles
、但是没
有
Ma
donna
相关信息的中文网页
”。
搜索:“
Britney OR Beatles
-Madonna
”
结果:已搜索有关
Britney OR Beatles -
Madonna
的中文
(
简体
)
网页。
共约有
p>
16,200
项查询结果,这是
第
1-10
项
。
搜索用时
0.23
秒。
搜索:“
-Madonna
Britney OR Beatles
”
结果:已搜索有关
-Madonna
Britney OR Beatles
的中文
(
简体
)
网页。
共约有
16,200
项查询结果,这是第
1-10
项
。
搜索用时
0.13
秒。
搜索:“
Britney
-Madonna OR Beatles
”
结果:找不到和您的查询
-Britney -Madonna
OR Beatles-
相符的网页
搜索:“
Britney OR -Madonna
Beatles
”
结果:找不到和您的查询
-Britney OR
-Madonna Beatles -
相符的网页
可见,“或”操作的前后两个关键
字必须是默认的“与”查询,否则,搜索引擎将无法完成搜索。
6.5
、
用“
+
”和“
-
”减少冗余信息
通常情况下,用一个关键字查询,会得到很多和查询目的不相关的冗余信息。我们总是希望,搜索结 果的
第一个条目中就包含所需要的信息。“
+
< br>”和“
-
”很多时候就起到缩小搜索结果的范围,以提高
查询结果
命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关
键字,搜索结果有
20,300
项,而且排前列的主要与金庸的
小说《天龙
八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
(1)
p>
、如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字。“天龙八部
阿修罗”的搜索结
果就只有
1,050
项,可以很快找到全部八部。
(2)
、
如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录。
“天龙八
部
佛教
-
金庸”的查询结果为
1,120
项,可以迅速找到需要的资料。
7.1
、通配符问题
很多搜索引擎支持通配符号,如“
*
”代表一连串字符,“
?
”代表单个字符等。
GOOGLE
不支持通配符,
只能做精确查询,关键字中的“
*
”或
者“
?
”会被忽略掉。
7.2
、关键字的字母大小写
GOOGLE
对英文字符大小写不敏感,“
GOD
”和“
god
”搜索的结果是一样的。
7.3
、搜索整个句子
GOOGLE
的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键
字,必须加英文引号。
示例:搜索包含“
long, long
ago
”字串的页面。
搜索:“
ago
结果:已搜索有关
long
long ago
的中文
(
简体
)
网页。
共约有<
/p>
16,500
项查询结果,这是第
1-1
0
项
。
搜索
用时
0.06
秒。
7.4
、搜索引擎忽略的字符和词汇
GOOGLE
对一些网路上出现频率极高的英文单词,
如
“
i
”
、
“
< br>com
”
、
“
< br>www
”
等,
以及一些符号如<
/p>
“
*
”
、
“
.
”等,作忽略处理。
示例:搜索关于第一次世界大战的信息
搜索:“
”
结果:
使用
过于频繁,没有被列入搜索范围。已向英特网搜索
共约有
7,370
项查询结果,
这是第
1-10
项
。
搜索用时
0.17
秒。
7.5
、强制搜索
如果要对忽略的关键字进行强制搜
索,则需要在该关键字前加上明文的“
+
”号。
示例:搜索包含“
Who am I ?
”的网页。如果用“
”,“
Who<
/p>
”、“
I
”、“
?
”会被省略掉,
搜索将只用“
am<
/p>
”作关键字,所以应该用强制搜索。
搜索:“
”
结果:
已向英特网搜索
共约有
332,000
项查
询结果,
这是第
1-10
项
。
搜索用时
3.68
秒。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不
行。
8
、进阶搜索
上面已经探讨了
< br>GOOGLE
的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决
绝大部分
问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西
。
8.1
、对搜索的网站进行限制
“
sit
e
”表示搜索结果局限于某个具体网站或者网站频道,如“
p>
”、
“
”,或
p>
者是某个域名,如“
”、“
com
”等等。如果是要排除某网站或者域名范围内的页面,只需用“
-
网站
/
域名”。
p>
示例:搜
索中文教育科研网站(
)上所有包含“金庸”的页面。
搜索:“金庸
site:
”
结果:已搜索有关金庸
site:
的
中文
(
简体
)
网页。
共约有
1,730
项查询结果,这是第
1-10
项
< br>
。
搜
索用时
0.23
秒。
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸
古龙
site:
”
< br>结果:已在
搜索有关金庸
古龙
的中文
(
简体
)
网页。
共约有
734
项查询结果,这是第
1-10
项
。
搜索用时
0.12
秒。
示例:搜索新浪文教频道中关于鲁迅的信息。
搜索:“鲁迅
site:
”
< br>结果:
已在
搜索有关
鲁迅的中文
(
简体
p>
)
网页。
共约有
672
项查询结果,
这是第
1-10
项
。
搜
索用时
0.24
秒。
注意:
s
ite
后的冒号为英文字符,而且,冒号后不能有空格,否则,
“
site:
”将被作为一个搜索的关键字。
< br>此外,网站域名不能有“
http
”以及“
www
”前缀,也不能有任何“
/
< br>”的目录后缀;网站频道则只局限于
“频道名
.
域名”方式,而不能是“域名
/
频道名”方式。
诸如“金庸
site:/1/
”的语法是错
误的。
8.2
、
查询某一类文件(往往带有同一扩展名)
“
filetype:
”,这是个尚在测试阶段的
GOOGLE
特色查询,
不过功能已经非常强大,可以做很多意想不
到的事情哦。
最重要的文档搜索是
PDF
搜索。
PDF
是
p>
ADOBE
公司开发的电子文档格式,现在已经成为互联网的电子<
/p>
化出版标准。目前
GOOGLE
检索的<
/p>
PDF
文档大约有
2500
万左右。
PDF
文档通常是一些图文并茂的综
合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(
ECOMMERCE
)的
PDF
文档。
搜索:“
ecommerce
filetypedf
”
结果:
已向英特网搜索
ecommerce
filetypedf.
共约有
25,500
项查询结果,
这是第
91-100
项
。
搜索用时
0.
44
秒。
下面是某项搜索结果:
[PDF] /apec
文档类型
: PDF/Adobe Acrobat -
一般文字档
Page 1. A Partnership of the Business
Community With APEC Economies E-COMMERCE
READINESS ASSESSMENT GUIDE
/apec Page 2. ...
/apec/docs/......_guide_ -
类似网页
可以看到,
GOOGLE
在
PDF
档前加上了
[P
DF]
的标记,而且,
GOOGLE
把
PDF
文件转换成了文字档,
点击“一
般文字档”,可以粗略的查看该
PDF
文档的大致内容。当然,
PDF
原有的图片以及格式是没有
了。
搜索
PDF
文档还可以用“
inurl:<
/p>
”语法。比如上例,也可以用“
inurldf ecommer
ce
”。搜索结果数量大致
相同,不过查询结果顺序则略有很大
差别。
注意,上述查询均是对
PDF
内文的检索,“
ecommerce
”这个关键字是包含在
PDF
p>
文档中的。
“
filetype
”的另一个强大用
处则在图片搜索。下文将对
GOOGLE
的图片搜索功能作详细
说明,此处只是
略提一下。进入“
/
”
,查找关于本拉登的
JPG
图片。
搜索:“
Bin Laden
filetype:jpg
”
结果:搜索有关
Bin Laden
filetype:jpg
的图片()。(试验版)
共约有
1,630
项查询结果,这是第
1-20
项
。
搜索用时
0.14
秒。
除此之外,我尚未发现其他的
fil
etype
用法。如果有谁知道,请给我发邮件。预先感谢。
8.3
、
搜索的关键字包含在
URL
链接中
“
inu
rl
”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页
文档中。有很
多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,
比如“
MP3
”、
“
< br>GALLARY
”
等,于是,就可以用
< br>INURL
语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具
体资
料。
INURL
语法和基本搜索语
法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找
MIDI
曲“沧海一声笑”。
搜索:“
inurl:midi
沧海一声笑”
结果:已搜索有关
inurl:midi
沧海一声笑的中文
(
简体
)
网页。
共约有
16
项查询结果,这是第
1-10
项
。
搜
索用时
0.16
秒。
示例:查找微软网站上关于
windows2000
的安全课题资料。
搜索:“
inurl:security
windows2000 site:
”
结果:已在
内搜索有关
inurl:security windows2000
的网页。
共约有
188
项查询结果,这
是第
1-1
0
项
。
<
/p>
搜索用时
0.27
秒。
< br>
注意:
“
inurl:
”后面不能有空格,
< br>GOOGLE
也不对
URL
符号
如“
/
”进行搜索。例如,
GOOGL
E
会把“
c
gi-bin/phf
p>
”中的“
/
”当成空格处理。
“
allinurl
”语法返回的网页的链接中包含所有作用关键字。这个查询的
关键字只集中于网页的链接字符
串。
示例:
查
找可能具有
PHF
安全漏洞的公司网站。
通常这些网站的
CGI-BIN
目录中含有
< br>PHF
脚本程序
(这
个脚本是不
安全的),表现在链接中就是“域名
/cgi-
bin/phf
”。
语法:“
allinurl:
”
< br>
搜索:已向英特网搜索
a
llinurl:
共约有
37
项查询结
果,这是第
1-10
项
。
搜索用时
0.
36
秒。
8.4
、
搜索的关键字包含在网页标题中
“
intitle
”和“
allintitle
”的用法类似于上面的
inu
rl
和
allinurl
,只是后者对
URL
进行查询,而前者对网页
-
-
-
-
-
-
-
-
-
上一篇:感谢老婆辛苦付出的句子
下一篇:(完整版)短语结构类型