搜尋引擎的運作原理??

2008-11-10 11:03 pm
有沒有人可以詳細解構我們平時常用的搜尋引擎其運作原理是怎樣編程又是怎樣?我們可否白編一個自己用?
更新1:

我要的是運作技術,不是表面運作,希望有人提供其技術

回答 (3)

2008-11-11 5:33 am
✔ 最佳答案
樓上朋友, 抄一大段東西, 但文不到題....

其實, 搜尋引擎是一個大題目, 它涉及程式編寫, 演算法, 人工知能及資料庫技術, 還要配合適當的硬件, 才能做到一個強大的搜尋器.

而搜尋器功能, 大體分為三部份, 網絡蜘蛛 (web spider, 另一叫法web crawling), 索引 (indexing) 及 搜尋 (searching).

網絡蜘蛛的作用是用來將一個網頁作為切入點, 然後將每一個網頁裡的連結全部找出來. 而連結就是你於網站可以用滑鼠click到的連結. 當連結至下一個網頁時, 這網頁會變成另一個切入點, 不斷重複找出所有網頁來的連結後, 這些位置便會先記錄至資料庫中, 用來作下一步的工作. 到最後, 每一個連結就好像蜘蛛網般的每一條蜘蛛絲的交接點, 當夠多的話, 就會編織成一個巨大的蜘蛛網了.

完成後, 下一步是建立索引, 個人認為, 最難是這個索引的建立的工, 因為, 這涉及高階的演算法及人工智能. 大體是, 將一整編文章, 分析, 然後找出該文章的一些關鍵詞及該關鍵詞相對於該網站的適合度, 找到後, 便會將這些關鍵詞儲存至資料庫中. 要做到不能, 但要做到好像google那樣快準多就真的非常難 (之所以google能於search engine獨領風騷是有原因的).

最後, 當然是搜尋了, 有了之前的步驟後, 這步驟就最容易了, 只要將輸入的搜尋字, 跟資料庫的關鍵字作比較, 便能找到最相似的值及網站作排列.

而第一及第二步驟的伺服器是不停地運作的

若你想了解多些關於這方面知識, 可到以下網站看看, 老實說, 小弟都只是於大學初步涉獵而已, 如有錯誤, 請見諒.

http://en.wikipedia.org/wiki/Web_search_engine

2008-11-10 21:37:53 補充:
想知更多有關開發search engine, 你可用develop search engine作為關鍵詞於google上找
2008-11-12 12:01 am
特別注意:

不要信~小羊~既大量copy資料啦,

抄人的文章都要抄得聰明些,

連相片下的 goldrabbit2662 都抄錄下來。

世界上癌症( CANCER ) 都有藥醫,只有蠢東西,才無藥醫。

歡迎網友們到下列的網頁看看,便會看得更清楚,

http://hk.knowledge.yahoo.com/question/?qid=7008021801911
2008-11-10 11:08 pm
索引擎能帶給我們什麽?他們是如何運作的?
一般而言,搜索引擎會給您帶來20%至60%的在線生意。全世界現有網頁超過10億,而且還在快速增長。因此,我們非常有必要了解一下他們的工作原理和如何使我們的排名進入搜尋結果的前列。舉個例子,如果您在Yahoo搜索引擎中輸入關鍵詞“音樂”一詞,那麽搜尋結果將顯示有一百萬個相關的網頁檢索。

如果您的排名在前20名,那麽搜索引擎對您的意義非同尋常,它能爲您帶來大量的有意義的訪問且不花您一分錢,但是您的排名在50名以後,它還會對您有意義嗎?搜尋者是看不到您的網頁檢索(盡管理論上看得到),當然更無從談起他們能點擊訪問您的網頁了。

目前有三種類型的搜索引擎:
◆ 第一種:分類目錄式搜索引擎
其實這類搜索引擎不是真正意義上的搜索引擎,他們只是將網頁系統地分類。您可以通過一些描述和關鍵詞來找到您的網頁應該出現在哪個分目錄下,登記您的網頁。您不進行登記,您的網頁永遠也不會在他們任何一個分目錄下出現。他們沒有使用專門的“檢索軟件”定期地在互聯網上搜尋新增站點和頁面,歸入數據庫。這類分目錄的典型代表是Yahoo。

2008-11-10 15:09:33 補充:
◆ 第二種:檢索式搜索引擎
用“檢索軟件”的搜索引擎,他們也存在很大的差異。依據軟件的複雜程度,以下是這類搜索引擎的一些區別:
1、檢索您遞交的網頁(並不是整個網站)
2、在某一站點含蓋的每個頁面中的每個詞
3、在互聯網上每時每刻通過鏈結從一個頁面跳到另一個頁面搜尋新增網頁
遞交您的網頁地址,檢索軟件會自動地訪問並收集任何需要的內容。每一個搜索引擎都有各自標准,搜索結果排序有差異。所以您怎樣遞交您的網頁將完全徹底地影響您的排名。此外,您的排名今天是首位,明天可能不是了,因爲許多搜索引擎頻繁地改變他們的算法。

2008-11-10 15:09:45 補充:
◆ 第三種:元搜索引擎
他們同時向多個搜索引擎發送搜尋請求,對輸入的查詢關鍵詞在各個搜索引擎所得的反饋結果排序進行整合。所以您要在這類搜索引擎中提高排名,就必須在他們所關聯的所有搜索引擎中登記,通常他們所涉及的是前兩類搜索引擎。這類搜索引擎自己沒有數據庫,所以您沒必要向他們注冊登記。

在搜索引擎遞交方法中,哪種最有效?
向不同的搜索引擎遞交您網頁,其方法有許多種。

2008-11-10 15:10:02 補充:
1、使用免費的遞交服務。這類服務可以使您簡單地在很短的時間內將您的網頁自動遞交到50至400個搜索引擎。
2、分別去各種搜索引擎站點手工完成遞交表單。
3、雇傭專業的遞交服務公司。
4、購買專門的搜索引擎遞交軟件來完成遞交工作。
◆ 第一種:免費遞交服務
這類服務有Add Me和Submit It等,您輸入相關信息,選好所要遞交的搜索引擎,一切工作在隨後自動運行。問題是每個搜索引擎的要求不一,如Yahoo對站點描述的字節控制在25個字,而其他可能允許200個字以上。

2008-11-10 15:10:14 補充:
另外您可以使用不同的站點名稱最大程度地宣傳您網站,但這類免費服務送出的信息全部統一。還有對分目錄的選擇不精確(手工可以做到)。所有這些缺陷對您的排名毫無幫助。優點是節約了大量時間。
◆ 第二種:親自去各搜索站點手工登記
到目前爲止,免費登記您網頁的最佳方法就是去各個搜索引擎站點手工登記。充分理解遞交表單的含義和規則,一字一句地輸入您的關鍵詞、網頁描述、附加信息內容、聯系信息等。您也可選擇多個目錄進行登記,提高被發現的機率以吸引訪問者。缺點是耗時,而且沒有專業人士輔導,沒有技巧,排名上不去也就不奇怪了。

2008-11-10 15:10:23 補充:
◆ 第三種:付費的遞交服務
這些有償的遞交服務也有區別: 1、有些比較便宜,遞交的手段類似于前面提到的免費服務。他們或是爲您做,或是賣軟件給您讓您自己做。效果較差,反正登記總比不登記好。 2、如果條件允許,您最好還是多花些錢,買個好的服務,手工爲您登記到最主要的搜索引擎,這樣對您的排名有很大好處。 3、專業遞交公司。他們會教您並和您一起做,最大程度地挖掘潛力。通常費用不便宜(600至900美元),但效果最佳。他們評估您的站點,幫您設計關鍵詞和內容,教您技巧和要點,設計遞交方案,他們是排名服務的專家,理應受到尊重,得到最好的報酬。當然,服務的結果是爲您帶來巨大的訪問量。

2008-11-10 15:10:32 補充:
◆ 第四種:搜索引擎遞交軟件
與前面的免費服務差不多。各搜索引擎的要求不一樣,您在爲提高排名滿足某一搜索引擎要求的同時,也損毀了您在其他搜索引擎中的“得分”。當然,目前有些軟件改良頗多,從經濟角度講,排名效果最好。效果好的最主要原因是這些軟件出自上面提到的遞交專家之手。
◆ 結論
如果您能承受,當然請專家。從設計到最後報告,任何細節,精到專業。不便宜,但效果沒得說。第二方案是買這些專家編寫的軟件,效果次之。

2008-11-10 15:10:41 補充:
關鍵詞中在搜索引擎中起什麽作用?
如果您想要在網上下載一個五筆字形打字練習的軟件,您在網上尋找的絕不是“軟件下載”,而是“五筆字形打字練習”,這樣會使您更快地找到您想要的。
錯誤的關鍵詞,即使搜索引擎中的排名再好,所有網絡營銷的努力皆化爲烏有,因爲人們通過搜索引擎不能及時找到他們想要的東西。從這層意義上說,正確的關鍵詞比搜索引擎中的排名更重要。
◆ 選擇關鍵詞中的常見錯誤有兩個:
1、關鍵詞的羅列太普通

2008-11-10 15:10:52 補充:
2、未含蓋與其電子商務站點密切相關的特殊關鍵詞

◆ 好的搜索引擎排名會成就您大的訪問量,而關鍵詞是區分篩選您的目標訪問客。
1、網絡營銷工作的最終目的是使我們站點形成銷售和贏利。
2、好的搜索引擎排名帶來大的訪問量,但不形成站點的銷售,又有何用?
3、合格的預客戶的訪問,能爲我們站點帶來實在的銷售,這才是我們期望的。
這一切靠什麽?您所選擇的關鍵詞!
關鍵詞不僅是您電子商務業務的內容或概念,更應該體現出爲訪問者解決其現存的問題。

2008-11-10 15:11:13 補充:
如何選擇正確的關鍵詞?
在確定某一關鍵詞之前,您得考慮一個問題:網絡中的用戶查詢這一關鍵詞的目的是什麽?如果您的回答含糊不清,那此關鍵詞決不是您正確的關鍵詞。如果您的回答是明確的,隨之而來的另一個問題是,您的站點能不能有效地解決訪問者的問題。如果答案還是明確無誤,這便是您該選擇的關鍵詞。
如果您的站點不能爲訪問者解決他們希望解決的問題,訪問者將繼續尋找其他的能解決問題的站點,而這些站點多半是您的競爭對手。爲什麽您花了時間和精力集中某一關鍵詞,但又不能很好地滿足訪問者的需求,解決他們的問題呢?衆所周知,從搜索引擎那裏點擊來的訪問客都是非常合格的預客戶,比那些看了新奇的廣告條點擊而來的要好得多。

2008-11-10 15:11:28 補充:
如果您能解決搜索客的問題,他們會滿意,會成爲您的客戶。這種銷售成功率是其他方法無法比擬的。
◆ 選擇正確關鍵詞的對策如下:
1、明確站點闡述的核心問題與概念;
2、分別羅列核心問題,想盡辦法找出訪問者在查詢時可能包含的詞和詞組,任何您未考慮到的關鍵詞都將使您潛在的客戶跑向您的競爭對手;
3、去競爭對手站點,看他們所選擇的關鍵詞;
4、檢查自己的站點,修改、調整自己的關鍵詞;
5、注意關鍵詞的組合和查詢的幾率大小;
6、再次強調,高訪問率的關鍵詞並不一定會帶來好的贏利,低訪問率的關鍵詞更准確,更能捕捉到合格的訪問者並形成銷售;
7、一旦明確了最終的關鍵詞(組),除去其他的不精確的詞組;

2008-11-10 15:11:43 補充:
8、長的關鍵詞容易獲得好的排名,太普通的關鍵詞對有經驗的老手也是個棘手的問題。

搜索引擎的十大秘密
要記住,在大多數情況下,登錄搜索引擎可不是宣傳和推廣你網站的唯一手段。要取得真正的成功,你還需要使用很多其他的技術和方法。然而,當你適當的登錄到搜索引擎後,也同樣可以爲你的站點帶來大量的流量,而你幾乎不需要花費什麽。當然,適當的登錄工作也會占用你一定的時間和精力,但回報將是成倍于你的這些投入的。每天都會産生數萬個新的站點。
想想看!多麽令人吃驚的數字。但它們其中的大多數都不曾適當的運用過META值,而搜索引擎的機器人就是根據META值來檢索站點的。

2008-11-10 15:12:03 補充:
下面是一些小技巧與竅門:
★ 在你的標題中使用你最常用的關鍵字。大部分搜索引擎都在它們的排名系統中爲這些關鍵字打出更高的分。
★ 用關鍵字的複數形式,(如,用"books"來代替"book",那麽,當有人查詢book或者books時,你的站點都會呈現在他面前)
★ 關鍵字的大寫和小寫多種拼寫方式都用上。(如:books,Books,BOOKS)同一個單詞的三種以上的拼寫方式並不會起到多大作用,盡管通常的錯誤拼寫倒能奏效。

2008-11-10 15:12:26 補充:
★ 用你選定的關鍵字的組合方式。人們經常使用包含2或2個以上關鍵字的短語來搜索。(如:"storage facilities", "STORAGE FACILITIES")爲了真正找准你的目標市場,加上"self, "SELF"和"你的城市/州" 等單詞。那些不需要你的産品和服務的訪問者即便再多,也沒有什麽價值。
★ 必須使用META值。許多搜索引擎都是根據這些META值爲你的站點做索引的。META值位于你頁面HTML中的HEAD之間,並不會在你的頁面中顯示出來。爲了更精確的使用這些META值。可以找一個排名最高的站點的源文件來做些參考分析。

2008-11-10 15:12:45 補充:
★ 使用你10到20個最好的關鍵字的組合。關鍵字豐富的META內容通常都是你站點排名的決定性因素。提示:如果可能,盡量在每一段的開頭或者搜索短語較靠前的位置使用你最具代表性的關鍵字。
★ 用關鍵字來填滿你圖象鏈接中的ALT值。
★ 你站點中的每一頁都應該單獨登錄到搜索引擎,而不僅僅是登 錄了首頁就結束了。提示:許多搜索引擎都會定期對你的站點重新檢索,如果站點上沒有變化你的排名可就會下降了,所以,保持你的站點常新。

2008-11-10 15:13:10 補充:
★ 警告!過去很多人投機取巧,濫用關鍵字來取得更高的排名。就是將自己的關鍵字一再重複使用,並改變文字顔色使之適應頁面背景色。現在如果一旦發現你這麽做了,大多數搜索引擎都會采取懲罰措施。
★ 爲你的每一個主要的關鍵字創造或定制一個獨立的頁面,並爲 每個主要的搜索引擎單獨設計。這會花上些時間,但是,一旦你做好了,將會令人不可置信的提高你的排名。提示:確保每個頁面都能直接鏈接到首頁以及其它一些相關頁面。
參考: WEBS


收錄日期: 2021-04-18 14:34:27
原文連結 [永久失效]:
https://hk.answers.yahoo.com/question/index?qid=20081110000051KK00765

檢視 Wayback Machine 備份