- 自己動(dòng)手寫(xiě)搜索引擎
- 羅剛編著
- 1280字
- 2018-12-28 22:52:07
1.4 搜索語(yǔ)法
專(zhuān)業(yè)的搜索引擎一般都會(huì)實(shí)現(xiàn)一個(gè)搜索語(yǔ)法,基本的搜索語(yǔ)法有以下邏輯運(yùn)算符:
● 與(+、空格):查詢?cè)~必須出現(xiàn)在搜索結(jié)果中。
● 或(OR、|):搜索結(jié)果可以包括運(yùn)算符兩邊的任意一個(gè)查詢?cè)~。
● 非(-):要求搜索結(jié)果中不含特定查詢?cè)~。如果你發(fā)現(xiàn)搜索結(jié)果中有某一類(lèi)網(wǎng)頁(yè)是你不希望看見(jiàn)的,而且這些網(wǎng)頁(yè)都包含特定的關(guān)鍵詞,那么用減號(hào)語(yǔ)法就可以去除所有這些含有特定關(guān)鍵詞的網(wǎng)頁(yè)。
例如,搜索“神雕俠侶”,希望是關(guān)于武俠小說(shuō)方面的內(nèi)容,卻發(fā)現(xiàn)很多關(guān)于電視劇方面的網(wǎng)頁(yè)。那么就可以這樣查詢:
神雕俠侶 -電視劇
注意:前一個(gè)關(guān)鍵詞和減號(hào)之間必須有空格,否則,減號(hào)會(huì)被當(dāng)成連字符處理,而失去減號(hào)語(yǔ)法的功能。減號(hào)和后一個(gè)關(guān)鍵詞之間有無(wú)空格均可。
除了邏輯運(yùn)算相關(guān)的搜索語(yǔ)法,還有:
● 把搜索范圍限定在網(wǎng)頁(yè)標(biāo)題中——intitle
網(wǎng)頁(yè)標(biāo)題通常是對(duì)網(wǎng)頁(yè)內(nèi)容提綱挈領(lǐng)式的歸納。把查詢內(nèi)容范圍限定在網(wǎng)頁(yè)標(biāo)題中,有時(shí)能獲得良好的效果。使用的方式是把查詢內(nèi)容中特別關(guān)鍵的部分用“intitle:”修飾。
例如,找小沈陽(yáng)的小品,就可以這樣查詢:
小品intitle:小沈陽(yáng)
注意:“intitle:”和后面的關(guān)鍵詞之間不要有空格。
● 把搜索范圍限定在特定站點(diǎn)中——site
有時(shí)候,你如果知道某個(gè)站點(diǎn)中有自己需要找的東西,就可以把搜索范圍限定在這個(gè)站點(diǎn)中,以提高查詢效率。使用的方式是在查詢內(nèi)容的后面加上“site:站點(diǎn)域名”。
例如,要從軟件下載網(wǎng)站“天空網(wǎng)”查找msn聊天工具軟件,就可以這樣查詢:
msn site:skycn.com
注意:“site:”后面跟的站點(diǎn)域名不要有“http://”;另外,“site:”和站點(diǎn)名之間不要有空格。
site語(yǔ)法的另外一個(gè)用處是查看一個(gè)網(wǎng)站被搜索引擎收錄的情況,例如通過(guò)site:search.rayli.com.cn可以看出Google中收錄了26,800條瑞麗搜索的信息,如圖1-3所示。

圖1-3 搜索結(jié)果頁(yè)面
這些信息對(duì)于搜索引擎優(yōu)化(SEO)是有參考價(jià)值的。
● 把搜索范圍限定在URL鏈接中——inurl
網(wǎng)頁(yè)URL中的某些信息常常具有某種有價(jià)值的含義。于是,如果對(duì)搜索結(jié)果的URL做某種限定,就可以獲得良好的效果。實(shí)現(xiàn)的方式是用“inurl:”,后跟需要在URL中出現(xiàn)的關(guān)鍵詞。
例如,查找關(guān)于Word的使用技巧,可以這樣查詢:
上面這個(gè)查詢串中的“Word”可以出現(xiàn)在網(wǎng)頁(yè)中的任何位置,而“jiqiao”則必須出現(xiàn)在網(wǎng)頁(yè)URL中。
Word inurl:jiqiao
注意:“inurl:”和后面所跟的關(guān)鍵詞之間不要有空格。
● 精確匹配——雙引號(hào)和書(shū)名號(hào)
如果輸入的查詢?cè)~很長(zhǎng),搜索引擎在經(jīng)過(guò)分析后,給出搜索結(jié)果中的查詢?cè)~可能是拆分的。如果你對(duì)這種情況不滿意,可以嘗試讓搜索引擎不拆分查詢?cè)~。給查詢?cè)~加上雙引號(hào),就可以達(dá)到這種效果。
例如,搜索上海科技大學(xué),如果不加雙引號(hào),搜索結(jié)果被拆分,效果不是很好,但加上雙引號(hào)后,即搜索“上海科技大學(xué)”,獲得的結(jié)果就全是符合要求的了。
書(shū)名號(hào)是中文搜索獨(dú)有的一個(gè)特殊查詢語(yǔ)法。在有些搜索引擎中,書(shū)名號(hào)會(huì)被忽略,而在百度、Google等搜索中,中文書(shū)名號(hào)是可被查詢的。加上書(shū)名號(hào)的查詢?cè)~,有兩層特殊功能:一是書(shū)名號(hào)會(huì)出現(xiàn)在搜索結(jié)果中;二是在書(shū)名號(hào)中的內(nèi)容不會(huì)被拆分。書(shū)名號(hào)在某些情況下特別有用,例如,查名字很通俗和常用的那些電影或者小說(shuō)。比如,搜索電影《手機(jī)》,如果不加書(shū)名號(hào),很多情況下搜出來(lái)的是通信工具——手機(jī),而加上書(shū)名號(hào)后,搜索《手機(jī)》的結(jié)果就都是關(guān)于電影方面的了。
- 從程序員到架構(gòu)師:大數(shù)據(jù)量、緩存、高并發(fā)、微服務(wù)、多團(tuán)隊(duì)協(xié)同等核心場(chǎng)景實(shí)戰(zhàn)
- Practical DevOps
- R語(yǔ)言數(shù)據(jù)可視化實(shí)戰(zhàn)
- Python Web數(shù)據(jù)分析可視化:基于Django框架的開(kāi)發(fā)實(shí)戰(zhàn)
- 從零開(kāi)始學(xué)Linux編程
- Python全棧數(shù)據(jù)工程師養(yǎng)成攻略(視頻講解版)
- CoffeeScript Application Development Cookbook
- Instant Debian:Build a Web Server
- Mastering VMware Horizon 7(Second Edition)
- Kohana 3.0 Beginner's Guide
- Effective C++:改善程序與設(shè)計(jì)的55個(gè)具體做法(第三版)中文版(雙色)
- Python程序設(shè)計(jì)教程
- Python程序設(shè)計(jì)
- ACE技術(shù)內(nèi)幕:深入解析ACE架構(gòu)設(shè)計(jì)與實(shí)現(xiàn)原理
- Learning WebRTC