今日は WordCamp 関連の統計データ記事の訳を公開しましたが、数字ネタ関連ということでよく「どこにあるの?」と聞かれる情報のソースについて書き留めておきます。
WordPress 創始者のマットが WordCamp のスライドなどで使っている「WordPress の CMS シェア」「Web サイト全体でのシェア」という数字は、W3Techs – extensive and reliable web technology surveys というサイトの情報を利用しています。私も、イベントなどの時は CMS 利用率ページのデータをよく使います。
このデータは毎日更新されていて、今日の時点ではこのように書かれています。
68.1% of the websites use none of the content management systems that we monitor.
WordPress is used by 17.4% of all the websites, that is a content management system market share of 54.6%.モニター中のサイトのうち、68.1%が CMS をまったく使っていない。
WordPress は調査対象サイト全体の17.4%で使われており、これは CMS マーケットシェアの54.6%にあたる。
以下は、FAQ より(2013年7月30日追記: ブログ執筆時はトップ100万サイトが対象でしたが、現在はトップ1000万サイトが対象に変更になっているため数字を修正しました。)。
どんなサイトが集計に含まれていますか?Web 全体をクローリングしているのですか?
Alexa に基づいたトラフィック量トップ1000万サイト調査に使っています。詳しくは技術概要のページをご覧ください。それ以外の多くのサイトもクローリングしていますが、定評あるサイトの代表サンプルを選ぶために Alexa のトップ1000万サイト情報を活用しています。より多くのサイト(例えば、既知のサイトすべて)を含めてしまうと「使い捨て」的サイトやドメインパーキング用サイト、その他のスパムドメインのサイトなどで使われている技術に偏ってしまう恐れがあることが分かったからです。
ここでリンクされている詳細ページにはさらに以下のように書かれています。
- 個別の Web ページに対してではなく、サイト(訳注: 固有のドメイン)全体で使用されている技術しています。ある技術がサイト内のどこか1ページにでも使われていれば、使用中とみなしています。
- ドメインスパムの影響を受けないよう、トップ100万サイトのみの結果を含めています。これには、Alexa(Amazon.com 関連企業)の提供するサイト人気ランキングの3か月平均を使用しています。Alexa のランキングはサイトトラフィックの測定には不正確だと言われることもありますが、定評あるサイトの代表サンプルを取得する目的としては問題ないと考えています。
- サブドメインは別のサイトとしては集計していません。[中略] 例えば、blogger.com や wordpress.com などのサブドメインは、すべてひとつのサイトとして数えられています。
W3Techs では CMS シェアだけではなく、サーバーサイド言語、クライアントサイド言語、ソーシャルウィジェット、アドネットワーク、アナリティクスツール… など、いろんな技術のシェアを調査しているので、プレゼン材料として役に立つかもしれません。各技術の集計情報についての詳細が書かれたページが用意されていますので、WordPress に限らずこちらのデータを使う場合は注意してください。
コメントを残す