日本のEコマースサイト売上上位285社
Webサイト品質調査結果
調査データが示す、日本のEコマースサイトの伸びしろ
日本の売上上位300社のEコマースサイト(※)の内、自社サイトを持つ285社のWebサイトの品質を調査しました。
※「月刊ネット販売」2015年10月号(宏文出版株式会社)の「第15回ネット販売白書」に基づく。調査項目
- トップページのサイズ(容量)
- トップページの接続ホスト数
- トップページのTCPコネクション数
- トップページの接続オーバーヘッド
- トップページのオブジェクト数
- トップページのHTMLバージョン
- トップページのHTMLエラー数
- Webサーバの種類
- 一分あたりの売上額
調査期間
2016年1月4日〜1月22日
調査ツール
- HTML文法チェック…Nu Html Checker
-
Nu Html Checkerは、より良いHTMLの文法チェックツールとして継続的試験中のツールです。https://html5.validator.nu、https://validator.w3c.org/nuのバックエンドエンジンとして使われており、時代に合わなくなったW3C ValidatorのHTML5の対応を担うツールです。HTMLやXHTMLの複数のバージョンに対応しています。
このツールは、ソースコードやコンパイルされた実行可能ファイルがGitHub上に公開されており、ローカル環境で実行することが可能となっています。
- Webページ配信品質チェック…Catchpoint
-
Catchpointは、DoubleClikeやGoogleのサービス品質担当VPだった、Mehdi Daoudiが2008年に創業したWebサイトのパフォーマンスと可用性の品質管理測定サービスです。
統計的品質管理手法に基づき、実行可能データ(実際に改善の行動を起こすことが可能となるデータ)の提供を重点を置いて計測データを取得しています。テクノロジー企業をはじめとして、Eコマース、金融機関、メディア企業、通信キャリア、CDNサービスに24時間365日の計測・監視サービスを提供しています。
調査結果
トップページのサイズ(容量、単位はMB)
トップページのサイズ(容量)は、配信品質に影響を及ぼす要素です。
日本国内のインターネット環境が世界有数の高速・高品質であっても、物理的な法則から逃れることはできません。
容量が大きい「重い」ページは、Webサイトの表示速度や繋がりやすさにおいて悪影響を及ぼします。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の数 |
---|---|---|---|---|---|---|---|---|
3.633696 | 2.916155 | 2.421638 | 0.2141504 | 1.846305 | 2.866232 | 4.267942 | 111.580 | 286 |
以下のヒストグラムでは、最大値である111.580MBを除いて作成してあります。
トップページの接続ホスト数
トップページの接続ホスト数は、配信品質に影響を及ぼす要素です。
一般的に、Eコマースサイトはwwwもしくはドメインそのもののホスト1つ、もしくはそれに画像配信用のホストを組み合わせた2つのホストから成り立ちます。
(物理的なサーバ台数ではなく、論理的な「名前」としてのホスト数です。)
自社で管理しているホスト以外のものは、「サードパーティ」と呼ばれる、他社のサービスを利用することで追加されます。
一般的には
- Twitter、Facebook、Google+などのソーシャルメディアのボタン
(この3つのボタンを追加するだけで、12〜17ホストと接続されます。) - Googleアナリティクス、SiteCatalyst、Piwikなどのアクセス解析ツール
- 広告
- 各種効果測定ツール
などを追加することで、増加していきます。
サードパーティのツールを導入することで、自社以外のシステムによって遅延が発生するリスクが高まります。
弊社の調査では、現在のWebサイトの遅延要因の8割近くが、サードパーティのツールによって引き起こされています。
Webサイトの高速化のために、2015年2月17日にHTTP/2が正式な仕様としてIETFで承認されました。
しかしHTTP/2は、接続ホスト数が多い場合、SSLの接続確立のための手順がオーバーヘッドとなり遅延を引き起こすため、現状の日本のEコマースサイトでHTTP/2を導入すると、現状よりも大幅に遅延することが見込まれます。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の数 |
---|---|---|---|---|---|---|---|---|
28.8986 | 24.98836 | 30 | 2 | 11 | 21 | 41 | 138 | 286 |
トップページのコネクション数
トップページのコネクション数は、配信品質に影響を及ぼす要素です。
1つのコネクション毎に、「TCP 3ウェイ・ハンドシェイク」と呼ばれる、コネクション確立のための通信が行われます。
「HTTPキープアライブ」という設定をして、かつHTTPキープアライブを活用できるように適切にHTMLのコードを記述することで、コネクション数を最小化することが可能になります。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の数 |
---|---|---|---|---|---|---|---|---|
62.54545 | 60.71402 | 54.75 | 7 | 22 | 43 | 76.75 | 374 | 286 |
トップページの接続オーバーヘッド
接続オーバーヘッドとは、必要以上にコネクションを確立することでネットワーク負荷を高めていないかどうかを表す指標で、配信品質に影響を及ぼす要素です。
以下の計算式で算出されます。
接続オーバーヘッド = コネクション数 ÷ 接続ホスト数
最小値は1となり、これが理想の数値となります。
HTTP/1.1のキープアライブ、HTTP/2を使うと、一旦、コネクションを確立すれば、1つのホストから複数のファイルをそのコネクションを利用してダウンロードする事が可能になります。
「TCP 3ウェイ・ハンドシェイク」の手順を省略できるため、ネットワークの負荷の軽減に繋がります。
適切な設定が施されていれば、コネクション数は、接続ホスト数と同数となるはずです。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の数 |
---|---|---|---|---|---|---|---|---|
3.471619 | 5.844392 | 0.99893162 | 1 | 1.385684 | 1.629573 | 2.375 | 47.83333 | 286 |
上記のヒストグラムで、1.0〜4.0の区間に殆どのサイトが収まるため、ここだけを抜き出してヒストグラムを作成しました。
トップページのオブジェクト数
トップページのオブジェクト数とは、CSS、JavaScript、画像、動画などの、トップページを構成するファイル数を指します。
配信品質と情報品質、双方に影響を及ぼす要素です。
配信品質の観点では、オブジェクト数が増える程にページ容量が増え、また接続オーバーヘッドが高いと、ネットワークの負荷が増大し、遅延を引き起こします。
情報品質の観点では、特に画像については、情報を補完するために挿入されるべきです。もし、画像の数が多い場合、以下の事が懸念されます。
- 本来、文字として記述されるべき情報が、見た目を重視して画像化された
- 1つのページに、複数の主題の情報が記述されており、それによって画像の数が増えた
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の数 |
---|---|---|---|---|---|---|---|---|
226.6469 | 140.8388 | 135.5 | 21 | 145.25 | 205.5 | 280.75 | 1501 | 286 |
トップページのHTMLのバージョン
HTMLのバージョンは、直接的には、配信品質と情報品質、双方に影響を及ぼしません。
HTMLのバージョンによって、タグの仕様が異なるため、利用しているバージョンの仕様に準じたタグを使用すべきです。
次の項目のHTML文法エラーに関連してきます。
HTMLのバージョン | Webサイト数 | W3C勧告 | 全体に占める割合 |
---|---|---|---|
XHTML1.0 | 130 | 2000年1月26日 | 45.5% |
HTML4.01 | 80 | 1999年12月24日 | 28.0% |
HTML5 | 68 | 2014年10月28日 | 23.8% |
宣言なし・不明 | 5 | 1.7% | |
HTML4.0 | 2 | 1997年12月24日 | 0.7% |
XHTML1.1 | 1 | 2001年5月31日 | 0.3% |
合計 | 286 | 100% |
トップページのHTML文法エラー数
HTMLの文法エラー数は、情報品質に影響を及ぼす要素です。
HTMLは、構造化文書を記述するための言語です。機械に人間の記述した文書を理解してもらうためには、HTMLで適切なタグを選択して、正しく記述することが大きな助けとなります。
また、HTML文法エラー数は、コーディング品質として重要な指標です。
自社で開発している場合は、自社のエンジニアの、外部に委託している場合は、委託先のエンジニアの、コーディングの実力を示す指標となります。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の数 |
---|---|---|---|---|---|---|---|---|
145.3636 | 207.5657 | 141.75 | 0 | 26 | 76 | 167.75 | 1643 | 286 |
HTML文法エラー数が0から200の区間に殆どのサイトが収まるため、ここだけを抜き出してヒストグラムを作成しました。
トップページのWebサーバの種類
Webサーバの種類は、配信品質や情報品質には直接的には影響を及ぼしません。
現在、日本のEコマースサイトでどのWebサーバが使われているのか、参考としてご覧下さい。
尚、合計の数が286ではなく、287になっているのは、あるサイトでHTMLの配信サーバと画像の配信サーバで、使っているWebサーバの種類が異なっていたためです。
Webサーバの種類 | Webサイト数 | 全体に占める割合 |
---|---|---|
Apache | 175 | 61.0% |
非表示 | 64 | 22.3% |
IIS | 31 | 10.8% |
nginx | 14 | 4.9% |
IBM HTTP Server | 2 | 0.7% |
Oracle HTTP Server | 1 | 0.3% |
合計 | 287 | 100% |
1分あたりの売上額
参考までに、元資料である「第15回ネット販売白書」の年間売上額のデータを単純に365日÷24時間÷60分した数値を、1分あたりの売上額として以下に記載しました。
リストの中で、2つのサイトを記載しているものの、会社としては一つで、売上額は合算されて記載されているものがあったため、標本の数としては285となっています。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の数 |
---|---|---|---|---|---|---|---|---|
13858.63 | 21994 | 10261.75 | 1551.00 | 2942.25 | 8560.00 | 13204.00 | 158145.00 | 285 |
このデータを分析すると、多くのEコマースサイトは、1分あたりの売上が10,000を超えられない状況だということが分かります。
そこで、1分あたりの売上額が0円から10,000円の区間に殆どのサイトが収まるため、ここだけを抜き出してヒストグラムを作成しました。
このデータを見ると、半数以上のEコマースサイトが、1分あたりの売上が4,000円以下であることが分かります。
Eコマースサイトの運営において、第一の壁は、1分あたりの売上が4,000円を超えられるかどうか、第二の壁は、1分あたりの売上が10,000円を超えられるかどうかにあるようです。