研究:比較來自8種SEO工具的數據
已發表: 2020-11-19您是否曾經有一個客戶(或老闆)指出您使用的SEO工具之間的差異?
作為SEO,進行對話非常困難。 沒有人喜歡聽到:“好吧,這些工具都以不同的方式衡量事物,永遠不會100%……yada yada yada。”
對於非SEO人士來說,這就像回答一個簡單問題的便捷解決方案:“您為什麼不能給我準確的數據?”
在過去十年中進行過如此多次對話之後,我決定比較一下工具之間的不同輸出,以確定在報告和製定決策時是否可以進行任何一致性或概括性的總結。
例如:我希望SEO能夠說:“根據SEMrush,這是您排名的Page 1關鍵字的總數。 請記住,平均而言,SEMrush報告的關鍵字數量比普通SEO工具少25%(或更高)。”
我還希望能夠證明不應將來自SEO工具的數據用於傳播福音,而應將其用於廣泛的趨勢識別和競爭對手的快速分析。
免責聲明:這項研究及其結果肯定不是要偏愛或抹黑任何特定的SEO工具。 它們都有優勢和劣勢的領域,當相輔相成時,它們可能非常強大。 在此測試中,我們僅查看三個輸出,因此了解此數據的局限性很重要。
讓我們看看我發現了什麼……
我如何設置測試
我查看了三個主要指標以進行工具比較:
- 鏈接根域。
- 在美國搜索中網域自然關鍵字排名1-10。
- 獎勵:估計的每月搜索量(進行中)。
我訪問了一個網站,比較了各種SEO工具的輸出。 例如,下圖顯示了每個工具報告的代理機構總鏈接根域的內容:

然後,我添加了其他9個域,並比較了它們的輸出以獲得更大的樣本量。 三個域的示例:

然後,我比較了10個域中每個域的每個工具和域相對於中位數的輸出差異。
例如,我的代理機構報告的根域中位數為5836。 Mangools報告了5280次RD,比中值低10%。
這是與報告的中位數RD進行比較的示例:

這表明Moz報告的RD數量高於這三個站點的中位數。 相反,Ubersuggest報告的RD小於相同三個站點中每個站點的RD。 有道理?
這是回答問題的一種簡單方法:“ X工具通常報告的數據比其他工具多還是少?”
最後,我計算了每個站點上每種工具與中位數的平均差異。 這有助於回答以下問題:“在所評估的10個站點中,每個站點(如果有的話)始終報告的數字低於/高於中位數? 多少錢?”
這個單一數字應該可以告訴我們一個工具報告的數據是否少於中位數。
學習資格
在這樣的測試中,更多數據總比少好。 在這種情況下,我使用了10個域來嘗試回答上述問題。 當然,更大規模的研究將得出更準確的結果,也許有一天,雄心勃勃的SEO將花費更多的時間和資源進行這項研究。
請理解,以下數據僅是對話開始者,而不是對話提供者。 它旨在描繪圖片的開始而不是確定的。
排除資格,讓我們看一下結果。
根域
我們密切關注鏈接到我們域的根域的數量和質量,因為強大的反向鏈接配置文件與排名潛力相關。 我們還監視競爭對手的反向鏈接配置文件,以進行基準測試。
因此,如果您打算將自己的網站與競爭對手進行比較,那麼知道您所使用的工具報告的數量通常比其他工具少還是多,將是一個額外的好處。 從下面的數據中可以看到,您還需要確保使用相同的工具來比較網站。
警告:芒果報導的異常值是392%,我懷疑這是一個小故障。 為了使數據具有代表性,我省略了此異常值。
以下是每個域的結果:

只看這些圖表,您就會發現Moz傾向於報告的根域數量明顯高於中位數。 Ubersuggest似乎始終報告根域數量少於中位數。
這是每種工具的平均鏈接根域報告的外觀:

那麼,這些信息告訴我們什麼?
平均而言,Moz和Ahrefs報告的根域數量高於競爭對手。 SEMrush報告幾乎完全在中值。 芒果,SERPstat和Ubersuggest報告的根域相對少於中位數。
儘管樣本量很小,但是有明顯的趨勢:
- Ahrefs報告的鏈接根域比中位數100%的時間更多。
- Moz報告的鏈接根域比中位數90%的時間更多。
- Ubersuggest報告的鏈接根域少於中位數100%的時間。
有了這些數據,我們可以說很可能 (不保證)Moz和Ahrefs將報告比其他工具更多的鏈接根域,而Ubersuggest和SERPstat在某種程度上將報告更少的鏈接根域。
這會使一個工具比另一個更好嗎? 不一定,但這肯定會增加上下文。
獲獎者:Moz和Ahrefs
關鍵字排名
對我們的客戶和老闆來說,最可訪問和最有趣的指標是關鍵字排名。 他們想知道其域為多少關鍵字排名,以及與競爭對手相比如何。
對您所在空間中關鍵字所有權的廣泛理解可以告訴您有關搜索範圍的大小以及衡量方式的大量信息。
如果您認為關鍵字景觀為你的市場規模和關鍵字所有權的市場份額,你將有你現在在哪裡,並要在未來的更強的理解。
但是,SEO工具在準確報告這些數字方面的能力非常有限。 這些工具雖然複雜,但必須依靠抓取Google來生成數據。 數據輸出的質量在很大程度上取決於抓取工具的功能及其數據庫的大小。 您將很快看到,每個工具的數據差異很大。
所有數據均以相同的方式收集。 我從以下每種工具(基於Moz,Ahrefs,SpyFu,Sistrix和SEMrush)的基於美國的搜索中得出的關鍵字總數排名為1-10。 不幸的是,我不得不將Sistrix排除在最終分析之外,因為它僅報告了總體中位數的11%,從而扭曲了該領域。
這是一些數據的示例:

正如您已經看到的,數據中存在很多差異,而且只會變得更糟。 使用相同的技術將每個工具的報告與中位數進行比較,我發現了以下幾點:

跳到你身上的第一件事可能是:“莫茲怎麼了?” 儘管Moz在以前的研究中報告的鏈接根域數量也比其競爭對手大,但這些數量並沒有過大地足以破壞模型。 以下是針對中位數的總體報告:

在這種情況下,Moz打破了模型。 我最初擔心的是Moz報告的是全球關鍵字排名,而不是美國關鍵字排名。 我向他們的團隊表達了這種擔憂,他們回答:

可以肯定的是,我請他們上報工程師。 他們回答:

根據Moz團隊的說法,這些數字確實在水平上。
那麼,這些信息告訴我們什麼?
平均而言,Moz報告的關鍵字比中位數多2.5倍。 Ahrefs正好落在中位數,而SEMrush緊隨其後。 SpyFu對小組進行了完善,佔中位數的81%,而忽略了Sistrix,僅佔中位數的11%。
同樣,儘管樣本量確實很小,但我們確實有一些明確的標記:
- Moz 100%的時間都擊敗了中位數。
- Sistrix擊敗中位數0%的時間。
- Ahrefs和SEMrush在中值附近顯示出很高的一致性。
如果Moz的專家是正確的,那麼我們可以做出一個概括性的聲明,即他們的工具可能會在每個域中報告更多的關鍵字。 我們也可以說,Ahrefs和SEMrush可能會(不會保證)報告相似且一致的結果。 SpyFu產生的結果也可能更少,而Sistrix的填充結果最少。

但是這些數字離真相有多近?
很難說,因為我們正在嘗試拍攝移動目標的快照。 關鍵字不斷流入和流出前10個結果。 在任何一天,一個工具都可以將關鍵字排名顯示在第9位,而另一種工具可以同時將關鍵字放在第11位。
因此,由於試圖固定移動目標的性質以及每種工具的抓取能力的可變性,研究的這一特定部分極易出現誤差。
幸運的是,非常感謝Marcus Tandler和Ryte的員工,我們可以看到我們網站排名的實際關鍵字數。 Ryte是一種複雜的工具,它集成了所有Google Search Console數據,並以能夠提供真實數據而不是抓取數據的方式對其進行處理。
在6月份,Ryte顯示Brafton實際上在美國的1-10排名中為16,567個關鍵字排名

報告的中位數指標僅為一個月真實數字的18.3%。

而這僅僅是一個月的數據。
SEO工具會累積數月和數年的關鍵字排名。 意思是,您的一種工具可能表明您當前對多年沒有人搜索過的關鍵字排名,也沒有產生印象。
這就是我們使用多年的關鍵字工具可能會報告我們仍對沒有人搜索的事物進行排名的原因,例如“ 2017年關鍵字研究技術”。
如果我們將時間跨度擴展到2020年的前六個月,則會為27,864個關鍵字產生印象。

因此,在任何給定的月份中,儘管盡了最大努力,但您可能只會看到真實數字的一小部分。
這是否表示SEO工具做得不好? 一點也不!
實際上,這些工具肯定會優先使用其數據庫中有意義的,數量較大的關鍵字,而不是較長數量的關鍵詞,而搜索量卻明顯較低。 但這也意味著我們需要了解它們的局限性,並了解我們看到的數字並不十分準確。
另一個提醒是,我們應該使用SEO工具進行宏觀分析,這將使我們對趨勢和競爭性基準測試具有廣泛的洞察力。
獲獎者:Moz
獎勵:預計流量
一些SEO工具試圖估算域驅動的每月自然訪問者的數量。 與之前的研究類似,估算自然搜索流量可能是有用的競爭對手基準測試實踐,並且是客戶難以置信的指標。
不幸的是,對於本研究而言,沒有太多工具可以做到這一點。 準確地做到這一點的人越來越少。
與以前的研究類似,我從各種工具收集了數據,並將其輸出與中位數數據點相對應。 我估計了2020年6月的美國有機訪客人數。
不幸的是,這次我們不得不忽略SpyFu的數據,因為它大大高估了每個域的搜索流量,平均增加了3,242%。 我還不得不從分析中省略TopRank,因為並非所有工具都能夠填充該域的數據。
這是一些數據的示例:

您可以立即了解為什麼我必須從分析中省略SpyFu。 對於SpyFu的所有方面,這個特殊的指標需要重新考慮!
對於其餘三個工具,以下是每個域的數據:

這是按工具報告的平均數與中位數:

與之前的兩項研究相反,在這種情況下,您可能會爭辯說更多的數據通常更好,在這種情況下,情況可能並非如此(如SpyFu編號所示)。
在這種情況下,準確性是關鍵。 平均而言,Ahrefs報告的估計流量數據比SameWeb和SEMrush都低得多。
但是我們真的不知道這些數字中的任何一個在沒有上下文的情況下是好是壞。 我們需要實際(準確)的數字進行比較。
幸運的是,我能夠從SparkToro.com,ShaneBarker.com和Brafton.com提取實際流量。 非常感謝Rand Fishkin和Shane幫助實現了這一目標。
以下是估算數字與實際數字:

讓我們從Brafton開始直觀地看一下。 要閱讀以下圖表,請將0%線視為實際流量,將大於0%的任何數字視為工具的高估,而將低於零的任何數字視為低估。



從外觀上看,在三個實例中的每個實例中,SimilarWeb都接近實際數字。 Ahrefs似乎一直都低估了,而SEMrush將大大高估而又低估了。
為了清理這些數字,我們可以通過平均相對於實際數字高估和低估的百分比來獲得每個工具的總體平均準確性。 按工具的總體準確度如下:

這裡的主要警告:我們需要更多的數據。 看看每個工具與實際數量的比較是很有趣的,但我們沒有足夠的數據得出任何結論。 乍一看,SimilarWeb估計相當準確,平均準確率達到91.7%。
那這告訴我們什麼呢?
SameWeb可能會報告更準確的流量估算。 在某些情況下,Ahrefs可能會低估流量。 到目前為止,應使用大量的鹽進行分析,並向其他六個位置進行標註,以進行此項研究。
現在,讓我們僅說這些工具顯示出很大的變化,直到進一步通知之前,我們應該繼續將此度量標準稱為:估算流量。
獲獎者:SimilarWeb處於初步發展
概要
再次提醒大家,這項限量測試的獲獎者如下:

本報告的目的不是要聲明所有SEO工具都是不准確且不值得投資的。 也不打算讚揚性能最佳的工具的功能。 相反,我的目的是演示工具之間的差異,以便在使用它們的編號進行報告時可以有更多的上下文。
例如,如果您要報告站點的根域數量,那麼一定要知道,Ubersuggest報告的數量可能比其他工具少得多。 考慮到這一點,您可能需要對數據進行警告。 您還應該注意不要在使用競爭性基準測試時混用工具。
您還應該告訴您的客戶,不要將這些工具中報告的指標用作福音。 它們應用於一般趨勢分析和競爭對手基準測試。 正確使用這些工具中的每一個都可能具有深遠的洞察力。
如果使用不當,它們可能會產生巨大的誤導。
本文表達的觀點是來賓作者的觀點,不一定是Search Engine Land。 此處列出了工作人員作者。