株式会社Spelldata

ECサイトの品質データの可視化

日本のEコマースサイト売上上位285社
Webサイト品質調査結果

日本の売上上位300社のEコマースサイト(※)の内、自社サイトを持つ285社のWebサイトの品質を調査しました。

「月刊ネット販売」2015年10月号(宏文出版株式会社)の「第15回ネット販売白書」に基づく。

調査項目

調査期間

2016年1月4日〜1月22日

調査ツール

HTML文法チェック…Nu Html Checker

Nu Html Checkerは、より良いHTMLの文法チェックツールとして継続的試験中のツールです。https://html5.validator.nuhttps://validator.w3c.org/nuのバックエンドエンジンとして使われており、時代に合わなくなったW3C ValidatorのHTML5の対応を担うツールです。HTMLやXHTMLの複数のバージョンに対応しています。

このツールは、ソースコードやコンパイルされた実行可能ファイルがGitHub上に公開されており、ローカル環境で実行することが可能となっています。

Webページ配信品質チェック…Catchpoint

Catchpointは、DoubleClikeやGoogleのサービス品質担当VPだった、Mehdi Daoudiが2008年に創業したWebサイトのパフォーマンスと可用性の品質管理測定サービスです。
統計的品質管理手法に基づき、実行可能データ(実際に改善の行動を起こすことが可能となるデータ)の提供を重点を置いて計測データを取得しています。

テクノロジー企業をはじめとして、Eコマース、金融機関、メディア企業、通信キャリア、CDNサービスに24時間365日の計測・監視サービスを提供しています。

調査結果

トップページのサイズ(容量、単位はMB)

トップページのサイズ(容量)は、配信品質に影響を及ぼす要素です。
日本国内のインターネット環境が世界有数の高速・高品質であっても、物理的な法則から逃れることはできません。
容量が大きい「重い」ページは、Webサイトの表示速度や繋がりやすさにおいて悪影響を及ぼします。

平均値標準偏差四分位範囲0%25%50%75%100%標本の数
3.6336962.9161552.4216380.21415041.8463052.8662324.267942111.580286

以下のヒストグラムでは、最大値である111.580MBを除いて作成してあります。

トップページサイズのヒストグラム

トップページの接続ホスト数

トップページの接続ホスト数は、配信品質に影響を及ぼす要素です。
一般的に、Eコマースサイトはwwwもしくはドメインそのもののホスト1つ、もしくはそれに画像配信用のホストを組み合わせた2つのホストから成り立ちます。
(物理的なサーバ台数ではなく、論理的な「名前」としてのホスト数です。)

自社で管理しているホスト以外のものは、「サードパーティ」と呼ばれる、他社のサービスを利用することで追加されます。

一般的には

などを追加することで、増加していきます。

サードパーティのツールを導入することで、自社以外のシステムによって遅延が発生するリスクが高まります。
弊社の調査では、現在のWebサイトの遅延要因の8割近くが、サードパーティのツールによって引き起こされています。

Webサイトの高速化のために、2015年2月17日にHTTP/2が正式な仕様としてIETFで承認されました。
しかしHTTP/2は、接続ホスト数が多い場合、SSLの接続確立のための手順がオーバーヘッドとなり遅延を引き起こすため、現状の日本のEコマースサイトでHTTP/2を導入すると、現状よりも大幅に遅延することが見込まれます。

平均値標準偏差四分位範囲0%25%50%75%100%標本の数
28.898624.98836302112141138286
トップページの接続ホスト数のヒストグラム

トップページのコネクション数

トップページのコネクション数は、配信品質に影響を及ぼす要素です。
1つのコネクション毎に、「TCP 3ウェイ・ハンドシェイク」と呼ばれる、コネクション確立のための通信が行われます。
「HTTPキープアライブ」という設定をして、かつHTTPキープアライブを活用できるように適切にHTMLのコードを記述することで、コネクション数を最小化することが可能になります。

平均値標準偏差四分位範囲0%25%50%75%100%標本の数
62.5454560.7140254.757224376.75374286
トップページのコネクション数のヒストグラム

トップページの接続オーバーヘッド

接続オーバーヘッドとは、必要以上にコネクションを確立することでネットワーク負荷を高めていないかどうかを表す指標で、配信品質に影響を及ぼす要素です。
以下の計算式で算出されます。

接続オーバーヘッド = コネクション数 ÷ 接続ホスト数

最小値は1となり、これが理想の数値となります。

HTTP/1.1のキープアライブ、HTTP/2を使うと、一旦、コネクションを確立すれば、1つのホストから複数のファイルをそのコネクションを利用してダウンロードする事が可能になります。
「TCP 3ウェイ・ハンドシェイク」の手順を省略できるため、ネットワークの負荷の軽減に繋がります。
適切な設定が施されていれば、コネクション数は、接続ホスト数と同数となるはずです。

平均値標準偏差四分位範囲0%25%50%75%100%標本の数
3.4716195.8443920.9989316211.3856841.6295732.37547.83333286
トップページの接続オーバーヘッドのヒストグラム

上記のヒストグラムで、1.0〜4.0の区間に殆どのサイトが収まるため、ここだけを抜き出してヒストグラムを作成しました。

トップページの接続オーバーヘッドのヒストグラム

トップページのオブジェクト数

トップページのオブジェクト数とは、CSS、JavaScript、画像、動画などの、トップページを構成するファイル数を指します。
配信品質と情報品質、双方に影響を及ぼす要素です。

配信品質の観点では、オブジェクト数が増える程にページ容量が増え、また接続オーバーヘッドが高いと、ネットワークの負荷が増大し、遅延を引き起こします。

情報品質の観点では、特に画像については、情報を補完するために挿入されるべきです。もし、画像の数が多い場合、以下の事が懸念されます。

平均値標準偏差四分位範囲0%25%50%75%100%標本の数
226.6469140.8388135.521145.25205.5280.751501286
トップページのオブジェクト数

トップページのHTMLのバージョン

HTMLのバージョンは、直接的には、配信品質と情報品質、双方に影響を及ぼしません。
HTMLのバージョンによって、タグの仕様が異なるため、利用しているバージョンの仕様に準じたタグを使用すべきです。
次の項目のHTML文法エラーに関連してきます。

HTMLのバージョンWebサイト数W3C勧告全体に占める割合
XHTML1.01302000年1月26日45.5%
HTML4.01801999年12月24日28.0%
HTML5682014年10月28日23.8%
宣言なし・不明51.7%
HTML4.021997年12月24日0.7%
XHTML1.112001年5月31日0.3%
合計286100%
HTMLのバージョン

トップページのHTML文法エラー数

HTMLの文法エラー数は、情報品質に影響を及ぼす要素です。
HTMLは、構造化文書を記述するための言語です。機械に人間の記述した文書を理解してもらうためには、HTMLで適切なタグを選択して、正しく記述することが大きな助けとなります。

また、HTML文法エラー数は、コーディング品質として重要な指標です。
自社で開発している場合は、自社のエンジニアの、外部に委託している場合は、委託先のエンジニアの、コーディングの実力を示す指標となります。

平均値標準偏差四分位範囲0%25%50%75%100%標本の数
145.3636207.5657141.7502676167.751643286
トップページのHTML文法エラー数

HTML文法エラー数が0から200の区間に殆どのサイトが収まるため、ここだけを抜き出してヒストグラムを作成しました。

トップページのHTML文法エラー数 — 0から200まで

トップページのWebサーバの種類

Webサーバの種類は、配信品質や情報品質には直接的には影響を及ぼしません。
現在、日本のEコマースサイトでどのWebサーバが使われているのか、参考としてご覧下さい。

尚、合計の数が286ではなく、287になっているのは、あるサイトでHTMLの配信サーバと画像の配信サーバで、使っているWebサーバの種類が異なっていたためです。

Webサーバの種類Webサイト数全体に占める割合
Apache17561.0%
非表示6422.3%
IIS3110.8%
nginx144.9%
IBM HTTP Server20.7%
Oracle HTTP Server10.3%
合計287100%
トップページのHTML文法エラー数

1分あたりの売上額

参考までに、元資料である「第15回ネット販売白書」の年間売上額のデータを単純に365日÷24時間÷60分した数値を、1分あたりの売上額として以下に記載しました。

リストの中で、2つのサイトを記載しているものの、会社としては一つで、売上額は合算されて記載されているものがあったため、標本の数としては285となっています。

平均値標準偏差四分位範囲0%25%50%75%100%標本の数
13858.632199410261.751551.002942.258560.0013204.00158145.00285
1分あたりの売上額

このデータを分析すると、多くのEコマースサイトは、1分あたりの売上が10,000を超えられない状況だということが分かります。

そこで、1分あたりの売上額が0円から10,000円の区間に殆どのサイトが収まるため、ここだけを抜き出してヒストグラムを作成しました。
このデータを見ると、半数以上のEコマースサイトが、1分あたりの売上が4,000円以下であることが分かります。

1分あたりの売上額—1,000円から10,000円

Eコマースサイトの運営において、第一の壁は、1分あたりの売上が4,000円を超えられるかどうか、第二の壁は、1分あたりの売上が10,000円を超えられるかどうかにあるようです。