サイトアイコン Naoko Takano

「WordPress の CMS シェア54%」のソース、W3Techs のデータ収集手段

今日は WordCamp 関連の統計データ記事の訳を公開しましたが、数字ネタ関連ということでよく「どこにあるの?」と聞かれる情報のソースについて書き留めておきます。

WordPress 創始者のマットが WordCamp のスライドなどで使っている「WordPress の CMS シェア」「Web サイト全体でのシェア」という数字は、W3Techs – extensive and reliable web technology surveys というサイトの情報を利用しています。私も、イベントなどの時は CMS 利用率ページのデータをよく使います。

このデータは毎日更新されていて、今日の時点ではこのように書かれています。

68.1% of the websites use none of the content management systems that we monitor.
WordPress is used by 17.4% of all the websites, that is a content management system market share of 54.6%.

モニター中のサイトのうち、68.1%が CMS をまったく使っていない。
WordPress は調査対象サイト全体の17.4%で使われており、これは CMS マーケットシェアの54.6%にあたる。

以下は、FAQ より2013年7月30日追記: ブログ執筆時はトップ100万サイトが対象でしたが、現在はトップ1000万サイトが対象に変更になっているため数字を修正しました。)

どんなサイトが集計に含まれていますか?Web 全体をクローリングしているのですか?

Alexa に基づいたトラフィック量トップ1000万サイト調査に使っています。詳しくは技術概要のページをご覧ください。それ以外の多くのサイトもクローリングしていますが、定評あるサイトの代表サンプルを選ぶために Alexa のトップ1000万サイト情報を活用しています。より多くのサイト(例えば、既知のサイトすべて)を含めてしまうと「使い捨て」的サイトやドメインパーキング用サイト、その他のスパムドメインのサイトなどで使われている技術に偏ってしまう恐れがあることが分かったからです。

ここでリンクされている詳細ページにはさらに以下のように書かれています。

W3Techs では CMS シェアだけではなく、サーバーサイド言語クライアントサイド言語ソーシャルウィジェットアドネットワークアナリティクスツール… など、いろんな技術のシェアを調査しているので、プレゼン材料として役に立つかもしれません。各技術の集計情報についての詳細が書かれたページが用意されていますので、WordPress に限らずこちらのデータを使う場合は注意してください。

モバイルバージョンを終了