倍可親

回復: 0
列印 上一主題 下一主題

google搜索真經

[複製鏈接]

687

主題

6068

帖子

2188

積分

禁止發言

倍可親智囊會員(十八級)

積分
2188
跳轉到指定樓層
樓主
phtsl 發表於 2006-3-11 23:35 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
一,什麼是GOOGLE

大家都知道吧,不知道的互相問問吧,略。



二,GOOGLE特色

支持多達132種語言,包括簡體中文和繁體中文;
網站只提供搜索引擎功能,沒有花里胡哨的累贅;
速度極快,據說有8000多台伺服器,200多條T3級寬頻;

的專利網頁級別技術PageRank能夠提供高命中率的搜索結果;
的搜索結果摘錄查詢網頁的部分具體內容,而不僅僅是網站簡介;
智能化的「手氣不錯」功能,提供可能最符合要求的網站;
的「網頁快照」功能,能從GOOGLE伺服器里直接取出緩存的網頁。

三,基本搜索:+,-,OR

GOOGLE無需用明文的「+」來表示邏輯「與」操作,只要空格就可以了。

示例:搜索所有包含關鍵詞「易筋經」和「吸星大法」的中文網頁
搜索:「易筋經 吸星大法」
結果:已搜索有關易筋經 吸星大法的中文(簡體)網頁。共約有726項查詢結果,這是第1-10項。搜索用時0.13秒。

注意:文章中搜索語法外面的引號僅起引用作用,不能帶入搜索欄內。

GOOGLE用減號「-」表示邏輯「非」操作。

示例:搜索所有包含「易筋經」而不含「吸星大法」的中文網頁
搜索:「易筋經 -吸星大法」
結果:已搜索有關易筋經 -吸星大法的中文(簡體)網頁。共約有5,440項查詢結果,這是第1-10項。搜索用時0.13秒。

注意:這裡的「+」和「-」號,是英文字元,而不是中文字元的「+」和「-」。此外,操作符與作用的關鍵字之間,不能有空格。比如「易筋經 - 吸星大法」,搜索引擎將視為邏輯「與」操作,中間的「-」被忽略。

GOOGLE用大寫的「OR」表示邏輯「或」操作。但是,關鍵字為中文的或查詢似乎還有BUG,無法得到正確的查詢結果。

示例:搜索包含布蘭妮「Britney」或者披頭士「Beatles」、或者兩者均有的中文網頁。
搜索:「britney OR beatles」
結果:已搜索有關britney OR beatles的中文(簡體)網頁。共約有14,600項查詢結果,這是第1-10項。搜索用時0.08秒。
搜索:「布蘭妮 OR 披頭士」
結果:找不到和您的查詢-布蘭妮 OR 披頭士-相符的網頁。

注意:小寫的「or」,在查詢的時候將被忽略;這樣上述的操作實際上變成了一次「與」查詢。

「+」和「-」的作用有的時候是相同的,都是為了縮小搜索結果的範圍,提高查詢結果命中率。

例:查閱天龍八部具體是哪八部。

分析:如果光用「天龍八部」做關鍵字,搜索結果有26,500項,而且排前列的主要與金庸的小說《天龍八部》相關,很難找到所需要的資訊。可以用兩個方法減少無關結果。

1,如果你知道八部中的某一部,比如阿修羅,增加「阿修羅」關鍵字,搜索結果就只有995項,可以直接找到全部八部,「天龍八部 阿修羅」。

2,如果你不知道八部中的任何一部,但知道這與佛教相關,可以排除與金庸小說相關的記錄,查詢結果為1,010項,可以迅速找到需要的資料,「天龍八部 佛教 -金庸」。

四,輔助搜索:通配符、大小寫、句子、忽略字元以及強制搜索

GOOGLE不支持通配符,如「*」、「?」等,只能做精確查詢,關鍵字後面的「*」或者「?」會被忽略掉。

GOOGLE對英文字元大小寫不敏感,「GOD」和「god」搜索的結果是一樣的。

GOOGLE的關鍵字可以是片語(中間沒有空格),也可以是句子(中間有空格),但是,用句子做關鍵字,必須加英文引號。

示例:搜索包含「long, long ago」字串的頁面。
搜索:「"long, long ago"」
結果:已向英特網搜索"long, long ago". 共約有28,300項查詢結果,這是第1-10項。搜索用時0.28秒。

注意:和搜索英文關鍵字串不同的是,GOOGLE對中文字串的處理並不十分完善。比如,搜索「"啊,我的太陽"」,我們希望結果中含有這個句子,事實並非如此。查詢的很多結果,「啊」、「我的」、「太陽」等詞語是完全分開的,但又不是「啊 我的 太陽」這樣的與查詢。顯然,GOOGLE對中文的支持尚有欠缺之處。

GOOGLE對一些網路上出現頻率極高的詞(主要是英文單詞),如「i」、「com」,以及一些符號如「*」、「.」等,作忽略處理,如果用戶必須要求關鍵字中包含這些常用詞,就要用強制語法「+」。

示例:搜索包含「Who am I ?」的網頁。如果用「"who am i ?"」,「Who」、「I」、「?」會被省略掉,搜索將只用「am」作關鍵字,所以應該用強制搜索。
搜索:「"+who +am +i"」
結果:已向英特網搜索"+who +am +i". 共約有362,000項查詢結果,這是第1-10項。搜索用時0.30秒。

注意:英文符號(如問號,句號,逗號等)無法成為搜索關鍵字,加強制也不行。

五,高級搜索:site,link,inurl,allinurl,intitle,allintitle

「site」表示搜索結果局限於某個具體網站或者網站頻道,如「sina.com.cn」、「edu.sina.com.cn」,或者是某個域名,如「com.cn」、「com」等等。如果是要排除某網站或者域名範圍內的頁面,只需用「-網站/域名」。

示例:搜索中文教育科研網站(edu.cn)上所有包含「金庸」的頁面。
搜索:「金庸 site:edu.cn」
結果:已搜索有關金庸 site:edu.cn的中文(簡體)網頁。共約有2,680項查詢結果,這是第1-10項 。搜索用時0.31秒。

示例:搜索包含「金庸」和「古龍」的中文新浪網站頁面,
搜索:「金庸 古龍 site:sina.com.cn」
結果:已在sina.com.cn搜索有關金庸 古龍的中文(簡體)網頁。共約有869項查詢結果,這是第1-10項。搜索用時0.34秒。

注意:site后的冒號為英文字元,而且,冒號后不能有空格,否則,「site:」將被作為一個搜索的關鍵字。此外,網站域名不能有「http」以及「www」前綴,也不能有任何「/」的目錄後綴;網站頻道則只局限於「頻道名.域名」方式,而不能是「域名/頻道名」方式。諸如「金庸 site:edu.sina.com.cn/1/」的語法是錯誤的。

「link」語法返回所有鏈接到某個URL地址的網頁。

示例:搜索所有含指向華軍軟體園www.newhua.com」鏈接的網頁。
搜索:「link:www.newhua.com」
結果:搜索有鏈接www.newhua.com的網頁。共約有695項查詢結果,這是第1-10項。搜索用時0.23秒。

注意:「link」不能與其他語法相混合操作,所以「link:」後面即使有空格,也將被GOOGLE忽略。

inurl語法返回的網頁鏈接中包含第一個關鍵字,後面的關鍵字則出現在鏈接中或者網頁文檔中。有很多網站把某一類具有相同屬性的資源名稱顯示在目錄名稱或者網頁名稱中,比如「MP3」、「GALLARY」等,於是,就可以用INURL語法找到這些相關資源鏈接,然後,用第二個關鍵詞確定是否有某項具體資料。INURL語法和基本搜索語法的最大區別在於,前者通常能提供非常精確的專題資料。

示例:查找MIDI曲「滄海一聲笑」。
搜索:「inurl:midi 滄海一聲笑」
結果:已搜索有關inurl:midi 滄海一聲笑的中文(簡體)網頁。共約有14項查詢結果,這是第1-10項。搜索用時0.01秒。

示例:查找微軟網站上關於windows2000的安全課題資料。
搜索:「inurl:security windows2000 site:microsoft.com」
結果:已在microsoft.com內搜索有關 inurl:security windows2000的網頁。共約有198項查詢結果,這是第1-10項。搜索用時0.37秒。

注意:「inurl:」後面不能有空格,GOOGLE也不對URL符號如「/」進行搜索。GOOGLE對「cgi-bin/phf」中的「/」當成空格處理。

allinurl語法返回的網頁的鏈接中包含所有查詢關鍵字。這個查詢的對象只集中於網頁的鏈接字元串。

示例:查找可能具有PHF安全漏洞的公司網站。通常這些網站的CGI-BIN目錄中含有PHF腳本程序(這個腳本是不安全的),表現在鏈接中就是「域名/cgi-bin/phf」。
語法:「allinurl:"cgi-bin" phf +com」
搜索:已向英特網搜索allinurl:"cgi-bin" phf +com. 共約有40項查詢結果,這是第1-10項。搜索用時0.06秒。

allintitle和intitle的用法類似於上面的allinurl和inurl,只是後者對URL進行查詢,而前者對網頁的標題欄進行查詢。網頁標題,就是HTML標記語言title中之間的部分。網頁設計的一個原則就是要把主頁的關鍵內容用簡潔的語言表示在網頁標題中。因此,只查詢標題欄,通常也可以找到高相關率的專題頁面。

示例:查找日本明星藤原紀香的照片集。
搜索:「intitle:藤原紀香 寫真」
結果:已搜索有關intitle:藤原紀香 寫真的中文(簡體)網頁。共約有284項查詢結果,這是第1-10項。搜索用時0.03秒。

GOOGLE的罕用高級搜索語法:related,cache,info

related用來搜索結構內容方面相似的網頁。例:搜索所有與中文新浪網主頁相似的頁面(如網易首頁,搜狐首頁,中華網首頁等),「related:www.sina.com.cn/index.shtml」。

cache用來搜索GOOGLE伺服器上某頁面的緩存,這個功能同「網頁快照」,通常用於查找某些已經被刪除的死鏈接網頁,相當於使用普通搜索結果頁面中的「網頁快照」功能。

info用來顯示與某鏈接相關的一系列搜索,提供cache、link、related和完全包含該鏈接的網頁的功能。

示例:查找和新浪首頁相關的一些資訊。
搜索:「infwww.sina.com.cn」
結果:有www.sina.com.cn的網頁信息。
新浪首頁
北京站 上海站 廣東站. ... 遊戲世界, |, 影音娛樂, |, Club緣, |, 男
人女人, |, 論壇聊天, |, 時尚潮流, |, 文教育兒, |, 車行天下, |,
軟體下載. ...
Google 提供這個網址的信息:
查看Google網頁快照www.sina.com.cn的存檔
尋找www.sina.com.cn類似的網頁
尋找網頁有鏈接www.sina.com.cn
尋找網頁包含有'www.sina.com.cn'

六,其他重要功能

目錄服務

如果不想搜索網頁,而是想尋找某些專題網站,可以訪問GOOGLE的分類目錄「http://directory.google.com/」,中文目錄是「http://directory.google.com/Top/World/Chinese_Simplified/」。不過由於GOOGLE的目錄由志願者服務,而GOOGLE在國內名氣相對比較小,因此中文目錄下收錄站點很少。

工具條

為了方便搜索者,GOOGLE提供了工具條,集成於瀏覽器中,用戶無需打開GOOGLE主頁就可以在工具條內輸入關鍵字進行搜索。此外,工具條還提供了其他許多功能,如顯示頁面PageRank等。最方便的一點在於用戶可以快捷的在GOOGLE主頁、目錄服務、新聞組搜索、高級搜索和搜索設定之間切換。欲安裝GOOGLE的工具條,可以訪問「http://toolbar.google.com/」,按頁面提示可以自動下載並安裝。

新聞組(USENET)搜索

新聞組中有大量的有價值信息,DEJA一直是新聞組搜索引擎中的佼佼者。2001年2月份,GOOGLE將DEJA收購併提供了所有DEJA的功能。現在,除了搜索之外,GOOGLE還支持新聞組的WEB方式瀏覽和張貼功能。

輸入「http://groups.google.com/」后,便進入GOOGLE新聞組界面。可惜現在還沒有中文界面。因為新聞組中的帖子實在是多,所以我點擊「Advaced Groups Search」進入高級搜索界面http://groups.google.com/advanced_group_search。新聞組高級搜索界面提供對關鍵字、新聞組、主題、作者、帖子序號、語言和發布日期的條件搜索。其中作者項指作者發帖所用的唯一識別號電子信箱。比如要在alt.chinese.text內搜索著名老牌網路寫手圖雅的帖子,可以用下列指令「group:alt.chinese.text author:tuya@ccmail.uoregon.edu」。不過一般而言,我更推薦使用圖形搜索界面,方便而且直觀。

搜索結果翻譯

曾經為那些你不懂的法文、西班牙文頁面煩惱么?現在,GOOGLE支持一項搜索結果翻譯功能,可以把非英文的搜索結果翻譯成英文!!雖然目前只支持有限的拉丁語、法語、西班牙語、德語和葡萄牙文,但是我不得不承認,這是個偉大的改進。

不過,目前只能在英文狀態GOOGLE下實現這個功能。進入GOOGLE的設置頁面,http://www.google.com/preferences,有一個「BETA: Enable translation of search results into your interface language. 」的選項,把它選中,就OK了。

搜索結果過濾

網路上的成人內容浩如煙海,而且很多站點具有欺騙或者其他不良企圖,瀏覽者很容易掉入其中的陷阱。為此,GOOGLE新設立了成人內容過濾功能,見GOOGLE的設置頁面,http://www.google.com/preferences,最底下有一個選項SafeSearch Filtering。不過,中文狀態下的GOOGLE尚沒有這個功能。

PDF文檔搜索

我對GOOGLE尤其欣賞的一點就是它提供對PDF文檔內文的檢索。目前GOOGLE檢索的PDF文檔大約有2500萬左右。這真是太美妙了。PDF是ADOBE公司開發的電子文檔格式,現在已經成為互聯網的電子化出版標準。PDF文檔通常是一些圖文並茂的綜合性文檔,提供的資訊一般比較集中全面。

示例:搜索關於電子商務(ECOMMERCE)的PDF文檔。
搜索:「inurl:pdf ecommerce」
結果:已向英特網搜索inurl:pdf ecommerce. 共約有19,200項查詢結果,這是第1-10項。搜索用時0.11秒。

下面是某項搜索結果:

[PDF] www.usi.net/pdf/outsoucing-ecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字檔 - 類似網頁

可以看到,GOOGLE在PDF檔前加上了[PDF]的標記,而且,GOOGLE把PDF文件轉換成了文字檔,點擊「一般文字檔」,可以粗略的查看該PDF文檔的大致內容。當然,PDF原有的圖片以及格式是沒有了。

圖像文檔搜索

GOOGLE提供了Internet上圖像文件的搜索功能!!目前該功能尚在B測試階段,但已經非常好用。訪問地址是「images.google.com」。你可以在關鍵字欄位內輸入描述圖像內容的關鍵字,如「britney spears」,也可以輸入描述圖像質量或者其他屬性的關鍵字,如「high quality」。

GOOGLE給出的搜索結果具有一個直觀的縮略圖(THUMBNAIL),以及對該縮略圖的簡單描述,如圖像文件名稱,以及大小等。點擊縮略圖,頁面分成兩禎,上禎是圖像之縮略圖,以及頁面鏈接,而下禎,則是該圖像所處的頁面。屏幕右上角有一個「Remove Frame」的按鈕,可以把框架頁面迅速切換到單禎的結果頁面,非常方便。GOOGLE還提供了對成人內容圖像的限制功能,可以讓搜索者免受不必要的騷擾。

不過,非常遺憾的是,圖像搜索功能還不支持中文。

七,搜索技巧雜談

關鍵詞的選擇在搜索中起到決定性的作用,所有搜索技巧中,關鍵詞選擇是最基本也是最有效的。

例一:查找《鏡花緣》一書中淑士國酒保的酸話原文。

分析:如果按照一般的思路,找某部小說中的具體段落,就需要用搜索引擎先找到這本書,然後再翻到該段落。這樣做當然可以,但是效率很低。如果了解目標信息的構成,用一些目標信息所特有的字詞,可以非常迅速的查到所需要的資料。也就是說,高效率的搜索關鍵字不一定就是目標信息的主題。在上面的例子中,酒保談到酒的濃淡與貴賤的關係時,之乎者也橫飛。因此,可以用特定的詞語一下子找到目標資料。

搜索:「酒 貴 賤 之」,OK,找到的第一條信息就是鏡花緣的這一段落:「先生聽者:今以酒醋論之,酒價賤之,醋價貴之。因何賤之?為甚貴之?真所分之,在其味之。酒昧淡之,故而賤之;醋味厚之,所以貴之。...」

以上的關鍵字選擇技巧可以謂之「特定詞法」。

例二:「黃花閨女」一詞中「黃花」是什麼意思。

分析:「黃花閨女」是一個約定的俗語,如果只用「黃花閨女 黃花」做關鍵詞,搜索結果將浩如煙海,沒什麼價值,因此必須要加更多的關鍵詞,約束搜索結果。選擇什麼關鍵詞好呢?備選的有「意思」、「含義」、「來歷」、「由來」、「典故」、「出典」、「淵源」等,可以猜到的是,類似的資料,應該包含在一些民俗介紹性的文字里,所以用諸如「來歷」、「由來」、「出典」等辭彙的概率更高一些。

搜索:「黃花閨女 黃花 由來」,查到「黃花」原來出典於《太平御覽》,與南朝的壽陽公主相關。如果想獲得第一手資料,那就可以用「太平御覽 壽陽公主」做搜索了。

以上的關鍵字選擇技巧可以謂之「近義詞法」。

例三:劉德華同志的胸圍是多少。

分析:首先聲明,這是某個MM要我做的搜索,我把它作為搜索案例而已,沒其他的意思。非常直接的搜索是,「劉德華 胸圍」,但事實上,這麼搜索出來的結果,儘是一些諸如「劉德華取笑莫文蔚胸圍太小」之類的八卦新聞,無法快速得到所需要的資料。可以想到的是,需要的資料應該包含在劉德華的全面介紹性文字中,除了胸圍,應該還包括他的身高,體重,生日等一系列相關信息。OK,這樣就可以進一步的增加其他約束性關鍵詞以縮小搜索範圍。

搜索:「劉德華 胸圍 身高」,沒有料到的情況發生了,網上炙手可熱的痞子蔡《第一次親密接觸》里居然含有這樣關鍵字,阿泰「改編自劉德華《忘情水》的變態歪歌」、「用身高體重三圍和生日來加以編號」。好辦,把這部小說去掉,「劉德華 胸圍 身高 -阿泰」,OK,結果出來了,華仔胸圍84cm。說明一下,為什麼用「阿泰」而不用「第一次親密接觸」呢?這是因為小說的名字被轉載的時候可能有變動,但裡面角色的名字是不會變的。

以上的關鍵字選擇技巧可以謂之「相關詞法」。



[此貼子已經被作者於2005-01-10 00:12:48編輯過]

《中國網服》人力資源管理系統
我們認為下述真理是不言而喻的:人人生而平等,造物主賦予他們若干不可讓與的權利,其中包括生存權、自由權和保有財產的權利。
您需要登錄后才可以回帖 登錄 | 註冊

本版積分規則

關於本站 | 隱私權政策 | 免責條款 | 版權聲明 | 聯絡我們

Copyright © 2001-2013 海外華人中文門戶:倍可親 (http://big5.backchina.com) All Rights Reserved.

程序系統基於 Discuz! X3.1 商業版 優化 Discuz! © 2001-2013 Comsenz Inc.

本站時間採用京港台時間 GMT+8, 2025-8-21 22:31

快速回復 返回頂部 返回列表