建站推廣熱線|在線留言

鄒經理    13697542592 

網站制作后期推廣您需要簡單的了解搜索引擎收錄的原理

發布時間:2018-06-01訪問人數:6471作者:海南創想未來文化傳媒有限公司
提起Search Engine Optimization(SEO),想必大家一定熟悉又陌生。SEO是最先被我們所熟悉的數字營銷概念之一。酒店市場部或數字營銷負責人在每月或每季度,也會收到來自總部的SEO報告;那為何又用 “陌生” 來形容它呢?
是因為從業以來,筆者發現,大多數酒店市場部或數字營銷負責人僅對SEO的部分概念和術語有所了解,而對搜索引擎如何工作,如何解讀日常所接觸到的SEO報告,如何發現問題,如何進行優化存在諸多盲點,對于如何針對酒店自身情況制定SEO策略,更是無從下手。

那么從今天起,筆者將通過一個系列文章,力爭為大家梳理SEO知識點,希望大家在讀完該系列文章后,能夠獲得些許啟發,更好地為所任職酒店服務。

作為第一篇,我們先來了解一些基礎內容,大家是否曾思考過以下問題:

SEO是什么?我們如何去定義它?

為什么要做SEO?

移動互聯時代,還需要做SEO嗎?

搜索引擎的工作原理是什么?在簡單的 “輸入-搜索” 這幾步簡單的操作后,搜索引擎是如何從海量的數據中,找尋到我們所需要的內容,并展現給我們的?

帶著這些疑問,一起√get今天的知識吧!

SEO的全稱是 “Search Engine Optimization”,中文譯為 “搜索引擎優化”。知識點1:SEO是什么?我們如何定義它?

簡單地理解,SEO是一個從自然搜索結果中獲取網站流量的手段和過程;

更加嚴謹地去定義的話,SEO是一個 “在了解搜索引擎自然排名機制的基礎上,對網站進行內部和外部的調整和優化,改進網站在搜索引擎中的關鍵詞自然排名,以便爭奪流量,進而促成網站銷售或品牌曝光” 的一個過程。

知識點2:為什么要做SEO?

網站所有者都希望自己的網站流量越大越好,無論網站盈利模式和目標是什么,有人訪問是前提。SEO則是給網站帶來訪問者的最好方法。讓我們一起來了解一下SEO的 “優勢”:

低成本:雖可能會產生費用,但成本相對較低

高回報:來自SEO的用戶多數情況下是在 “主動地找尋” 酒店,目標非常精準

可遷移:搜索引擎是用戶搜索、比較、購買商品的重要渠道,即便移動互聯網發展迅猛,SEO核心仍在,只不過載體有所變化

夠持久:精準廣告投放、付費搜索等類型推廣模式,一旦停止投放,流量將急劇下降;線上活動等事件營銷效果明顯,但話題過后流量隨即下降。而搜索排名一旦上去,可相對穩定地維持比較久的時間,流量也因此會源源不斷地輸送過來

可擴展:掌握關鍵詞研究和內容擴展方法后,我們可以持續地,為網站增加目標關鍵詞及流量 



知識點3:移動互聯時代,還需要做SEO嗎?

讓我們來看一些行業調查數據,了解一下SEO是否還有效?

2017 年上半年,即時通信、搜索引擎、網絡新聞作為基礎的互聯網應用,用戶規模趨于穩定,搜索引擎應用繼續保持移動化趨勢。

雖然即時通信作為移動互聯網流量核心入口的地位已經確立。在新網民各類應用中的滲透率排名第一,高于排名第二的搜索引擎16. 9 個百分點,但搜索引擎在目前仍舊穩居第二位。

截至 2017 年6 月,我國搜索引擎用戶規模達 6.09 億,使用率為81.1%,用戶規模較 2016 年底增加707 萬,增長率為 1.2%





數據取自《 2017 中國互聯網絡發展狀況統計報告》

知識點4:搜索引擎的工作原理?

面對數以萬億的信息,搜索引擎如何做到在 1 秒鐘甚至更短的時間內,返回我們想要的內容?回答這個問題,需要對搜索引擎工作原理做個分解,大致分為 3 個階段:

 
爬行和抓取:搜索引擎程序通過訪問網頁,獲得頁面HTML代碼存入數據庫

預處理:程序對數據庫網頁進行一系列處理,為排名程序調用做準備

排名:用戶輸入關鍵詞后,程序調用預處理好的數據,計算相關性,生成結果首先看第一階段,即 “爬行和抓取”

對于搜索引擎來說,首要任務是完成對互聯網內網頁數據收集。而用于數據收集的工具,就是我們常常聽到的 “蜘蛛”,它是搜索引擎用來爬行和訪問頁面的程序。蜘蛛發出頁面訪問請求后,服務器返回HTML代碼,蜘蛛把收到的代碼存入數據庫中。蜘蛛會對鏈接進行跟蹤,根據一個頁面上的鏈接,爬行(讀取)至下一個,這也是為什么被人稱之為 “蜘蛛”。



在數據收集過程中,聰明的蜘蛛為了提升效率,避免重復讀取網頁數據,搜索引擎會建立地址庫,記錄 “被讀取的”,和 “發現但未被讀取的” 頁面。構建原始頁面數據庫,以儲存讀取后的頁面數據。

讀取結束,構建好原始數據庫后,搜索引擎將進行第二階段的任務 - “預處理”。什么是 “預處理” 呢?原始數據庫中存在數以萬億的網頁數據,排名程序無法做到每時每刻,對數量如此龐大的數據進行分析,也就無法在1- 2 秒內返回搜索結果。因此必須處理這些數據,為最后排名程序調用做準備。

預處理的第一步是對數據進行篩選,去除無用的信息,提取文字。現在搜索引擎仍以文字內容為基礎,數據庫中的頁面數據,除了我們在網頁上看到的文字外,還包含HTML標簽、JavaScript程序等無法用于排名的內容。程序需要去除這些無用信息,提取出可用于排名的內容。除文字外,程序也會提取出一些特殊的包含文字信息的代碼,例如Meta標簽中的文字、圖片替代文字、Flash文件的替代文字、鏈接錨文字等。



隨后,我們需要介紹一個小知識,即中文搜索引擎所獨有的步驟 - “中文分詞”。“詞” 是程序處理數據、用戶查詢的單位和基礎。與英文不同,搜索引擎必須區分用戶搜索的中文內容里,哪幾個字組成一個單詞,才能進行下一步工作。

在分詞過后,程序需要進行另一個步驟,即剔除 “停止詞”。在任何語言里,都存在出現頻率高,但對內容影響不大的詞匯,例如中文 “的”、“啊”、“卻”;英文中 “the” “a” “and” “to”“of”等。這些被稱作 “停止詞”,程序會去除這些停止詞,使搜索內容更突出,減少程序計算上內耗。

此外程序會對版權聲明文字、導航欄文字等對搜索無用的內容進行剔除,消除噪聲。

緊接著,程序還會對網頁數據進行去重,同一內容可能會重復發布在多個網站,為了避免將多篇重復的內容返回給擁護,所以需要在預先剔除重復內容。

在完成上述后,程序得到的是 “獨特的,能反應頁面主題的,以詞匯為單位的” 內容,緊隨其后,程序將正向索引。通過提取關鍵詞,把內容轉化成 “以關鍵詞為單位” 的集合,同時記錄關鍵詞出現頻次、格式(黑體、加粗錨文字)、位置(標題、頁面段首、段尾)等屬性。然后將其轉化為如下結構,儲存進數據庫:

地址: 海口市龍華區國貿路海涯國際大廈9樓C室
網站地圖sitemap.html sitemap.xml

友情鏈接: 海南海口租車 宜昌網站建設 桂林seo 昆山網站建設 襄陽網站建設 營銷型企業網站 東莞網站建設 海南網站建設

海口市龍華區國貿路海涯國際大廈9樓C室 瓊ICP備16000519號-1

關注我們

  • 案例
  • 電話
  • 首頁
  • 留言
  • 房產案例
  • PC蛋蛋预测尽享