株式会社Spelldata

スマートフォンを使う女性

2017年
日本のEコマースサイト売上上位283社
Webサイト品質調査

2017年5月29日

日本の売上上位300社のEコマースサイト(*)の内、自社サイトを持つ283社、284のWebサイト(**)の品質を調査しました。

*「月刊ネット販売」2016年10月号(宏文出版株式会社)の「第16回ネット販売白書」に基づく。
** ディノスとセシールは、売上額としては合算されて掲載されているものの、サイトは別であるため。

調査項目

調査期間

2017年3月1日〜3月31日

調査ツール

HTML文法チェック…Nu Html Checker

Nu Html Checkerは、より良いHTMLの文法チェックツールとして継続的試験中のツールです。https://html5.validator.nuhttps://validator.w3c.org/nuのバックエンドエンジンとして使われており、時代に合わなくなったW3C ValidatorのHTML5の対応を担うツールです。HTMLやXHTMLの複数のバージョンに対応しています。

このツールは、ソースコードやコンパイルされた実行可能ファイルがGitHub上に公開されており、ローカル環境で実行することが可能となっています。

Webページ配信品質チェック…Catchpoint

Catchpointは、DoubleClikeやGoogleのサービス品質担当VPだった、Mehdi Daoudiが2010年に創業したWebサイトのパフォーマンスと可用性の品質管理測定サービスです。
統計的品質管理手法に基づき、実行可能データ(実際に改善の行動を起こすことが可能となるデータ)の提供を重点を置いて計測データを取得しています。

テクノロジー企業をはじめとして、Eコマース、金融機関、メディア企業、通信キャリア、CDNサービスに24時間365日の計測・監視サービスを提供しています。

調査結果

トップページのサイズ(容量、単位はMB)

トップページのサイズ(容量)は、配信品質に影響を及ぼす要素です。
日本国内のインターネット環境が世界有数の高速・高品質であっても、物理的な法則から逃れることはできません。
容量が大きい「重い」ページは、Webサイトの表示速度や繋がりやすさに悪影響を及ぼします。

トップページサイズ(MB) — 2016年
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
3.63362.91612.420.21411.8462.86624.2679111.580286
トップページサイズ(MB) — 2017年
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
4.43403.24973.410.19242.2293.3965.63919.4400284

全体的にページ容量が増加していることが分析から分かります。
最頻値は、3.0〜3.9MBです。

トップページサイズのヒストグラム
トップページサイズ(MB) — ヒストグラム

トップページの接続ホスト数

接続ホスト数は、トップページを構成するCSS、JavaScript、画像などの各種オブジェクトを配信しているサーバの数です。
配信品質に影響を及ぼす要素です。

Webサイトの高速化のために、2015年2月17日にHTTP/2が正式な仕様としてIETFで承認されました。
しかしHTTP/2は、接続ホスト数が多い場合、SSLの接続確立のための手順がオーバーヘッドとなり遅延を引き起こすため、接続ホスト数が多い場合はHTTP/2を使うとHTTP1.1より遅延します。

接続ホスト数 — 2016年
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
28.8924.98836302112141138286
接続ホスト数 — 2017年
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
34.2528.8435434.252142448.25206284

全体的に接続ホスト数が増加していることが分析から分かります。
最頻値は、30〜39です。

トップページの接続ホスト数のヒストグラム
トップページ接続ホスト数 — ヒストグラム

トップページのコネクション数

トップページのコネクション数は、TCP/IPの接続手続きの回数です。
1つのコネクション毎に、「TCP 3ウェイ・ハンドシェイク」と呼ばれる、コネクション確立のための通信が行われます。

HTTP1.1を使用しているサイトであれば、HTTP Keep-aliveという設定を行い、TCP接続を最大限に活用できるように、適切にHTMLのコードを記述することで、コネクション数を最小化することが可能になります。

コネクション数 — 2016年
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
62.5460.714054.757224376.75374286
コネクション数 — 2017年
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
44.5074.248356.2572744.583.25643284

最大値が643で、この値が、他のサイトより異様に大きいため、これを外してグラフを作成しています。
全体的にコネクション数が増加していることが分析から分かります。
最頻値は、30〜39です。

トップページのコネクション数のヒストグラム
トップページコネクション数 — ヒストグラム

トップページの接続オーバーヘッド

接続オーバーヘッドとは、必要以上にコネクションを確立することでネットワーク負荷を高めていないかどうかを表す指標です。
以下の計算式で算出されます。

接続オーバーヘッド = コネクション数 ÷ 接続ホスト数

最小値は1となり、これが理想の数値となります。

HTTP/1.1のKeep-alive、HTTP/2を使うと、一旦、コネクションを確立すれば、1つのホストから複数のファイルをそのコネクションを利用してダウンロードする事が可能になります。
「TCP 3ウェイ・ハンドシェイク」の手順を省略できるため、ネットワークの負荷の軽減に繋がります。
適切な設定が施されていれば、コネクション数は、接続ホスト数と同数となるはずです。

TCPは、TCP Slow Startといって、最初から、使用できる帯域を最大限には使いません。
通信を行いながら、徐々に、ウィンドウサイズと呼ばれる、1度に送受信できる通信量を増やしていきます。
大抵は、Webページを構成するオブジェクトファイルが小さいため、通信速度が最大に達する前に通信が終了します。

HTTP1.1のKeep-aliveやHTTP/2で、TCPのウィンドウサイズを広げて最大速度になったのを活用する上でも、接続オーバーヘッドを小さくする事は重要です。

接続オーバーヘッド — 2016
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
3.47165.84430.998911.38561.62952.37547.8333286
接続オーバーヘッド — 2017
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
2.9815.44750.99891.3301.5552.9812.22857.000284

全体的にコネクションのオーバーヘッドは増加していることが分かります。
最頻値は、2.0〜2.9です。

トップページの接続オーバーヘッドのヒストグラム
トップページ接続オーバーヘッド — ヒストグラム

トップページのオブジェクト数

トップページのオブジェクト数とは、CSS、JavaScript、画像、動画などの、トップページを構成するファイル数を指します。
配信品質と情報品質、双方に影響を及ぼす要素です。

配信品質の観点では、オブジェクト数が増える程にページ容量が増え、また接続オーバーヘッドが高いと、ネットワークの負荷が増大し、遅延を引き起こします。

情報品質の観点では、特に画像については、情報を補完するために挿入されるべきです。もし、画像の数が多い場合、以下の事が懸念されます。

オブジェクト数 — 2016
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
226.6140.8388135.521145.25205.5280.751501286
オブジェクト数 — 2017
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
242.2127.4737138.233161.0209.0299.2784284

全体的にオブジェクトの数は増加している事が分かります。
最頻値は、180〜189です。

トップページのオブジェクト数
トップページオブジェクト数 — ヒストグラム

トップページのHTMLのバージョン

HTMLのバージョンは、直接的には、配信品質と情報品質、双方に影響を及ぼしません。
HTMLのバージョンによって、タグの仕様が異なるため、利用しているバージョンの仕様に準じたタグを使用すべきです。
次の項目のHTML文法エラーに関連してきます。

HTMLのバージョン — 2016
HTMLのバージョンWebサイト数W3C勧告全体に占める割合
XHTML1.01302000年1月26日45.5%
HTML4.01801999年12月24日28.0%
HTML5682014年10月28日23.8%
宣言なし・不明51.7%
HTML4.021997年12月24日0.7%
XHTML1.112001年5月31日0.3%
合計286100%
HTMLのバージョン — 2017
HTMLのバージョンWebサイト数W3C勧告全体に占める割合
XHTML1.01002000年1月26日35.0%
HTML5982014年10月28日34.39%
HTML4.01841999年12月24日29.82%
HTML4.011997年12月24日0.35%
XHTML1.112001年5月31日0.35%
合計284100%

文字コード

HTMLの文字コードは、HTML5ではUTF-8が推奨されています。 UTF-8は、ASCIIコードと互換性があります。
ASCIIコードとの互換性があるUTF-8を使用することで、HTMLの解析時に誤動作や文字化け、プログラムのエラーの発生を防ぐ事ができます。

トップページの文字コード — 2016
文字コードサイト数全体に占める割合
UTF-818665.5%
Shift_JIS5820.4%
EUC-JP227.7%
Windows-31J176.0%
UTF-8、Shift_JIS混在10.4%
合計284100%

Shift_JISの拡張コードであるWindows-31Jを使用しているサイトが17もあります。
Windows-31Jは、NECとIBMがShift_JISを独自拡張したものを、1993年にMicrosoftがWindows3.1のリリースの際に独自拡張を禁じて、CP932として統合し、IANA(Internet Assigned Numbers Authority)に「Windows-31J」として登録しました。

Windows-31Jに限らず、上述のようなASCIIコードとの互換性の都合から、HTMLのバージョンがいずれであるかに限らず、UTF-8への移行が図られるべきでしょう。

トップページのHTML文法エラー数

HTMLの文法エラー数は、情報品質に影響を及ぼす要素です。
HTMLは、構造化文書を記述するための言語です。

Googleのような検索エンジンなど機械に人間の記述した文書を理解してもらうためには、HTMLで適切なタグを選択して、正しく記述することが大きな助けとなります。
これを「マシンリーダブル」(機械可読性)と言います。
HTMLのエラーを無くすことは、マシンリーダブルに必要な要素の一つです。

また、HTML文法エラー数は、コーディング品質として重要な指標の一つです。
自社で開発している場合は、自社のエンジニアの、外部に委託している場合は、委託先のエンジニアの、コーディングの実力を示す指標となります。

HTMLエラー数 — 2016
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
145.36207.5657141.7502676167.751643286
HTMLエラー数 — 2017
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
129.00222.0816112.45022.7548.50135.202264284

全般的にHTMLの文法エラーの数は減少している傾向にあります。
最頻値は、10〜19と20〜29です。

トップページのHTML文法エラー数
トップページHTMLエラー数 — ヒストグラム

トップページのWebサーバの種類

Webサーバの種類は、配信品質や情報品質には直接的には影響を及ぼしません。
現在、日本のEコマースサイトでどのWebサーバが使われているのか、参考としてご覧下さい。

尚、合計の数が286ではなく、287になっているのは、あるサイトでHTMLの配信サーバと画像の配信サーバで、使っているWebサーバの種類が異なっていたためです。

Webサーバの種類 - 2016
Webサーバの種類Webサイト数全体に占める割合
Apache17561.0%
非表示6422.3%
IIS3110.8%
nginx144.9%
IBM HTTP Server20.7%
Oracle HTTP Server10.3%
合計287100%
Webサーバの種類 - 2017
Webサーバの種類Webサイト数全体に占める割合
Apache18162%
非表示5920%
IIS2810%
nginx217%
IBM HTTP Server21%
合計290100%

nginxの採用数が少しばかり増加しています。

1分あたりの売上額

参考までに、元資料である「第16回ネット販売白書」の年間売上額のデータを単純に365日÷24時間÷60分した数値を、1分あたりの売上額として以下に記載しました。
自社サーバで運営しているかどうかに関わらず、全サイトの売上額データで分析したので、標本の大きさとしては300となっています。

1分あたりの売上額 - 2015
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
18,63093,769.179,6911,5512,8595,66012,5501,594,400300
1分あたりの売上額 - 2016
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
20,630111,292.910,1651,8463,1556,11513,3201,902,397300
1分あたりの売上額
1分あたりの売上額 - ヒストグラム

2015年、2016年、共に、最大値は、Amazonです。
この値だけ飛び抜けているため、ヒストグラムでは、Amazonは外してグラフを作成しています。

全般的に、売上額は向上している事が分かります。
しかし、50パーセンタイルで、6,115円と、300社中150社は、1分あたりの売上が6,000円以下であることが分かります。

1分あたりの売上が10,000円以上になるのは、売上額を小さい順から並べて199番目で、この位置は66パーセンタイルに相当します。
つまり、全体の2/3は、1分あたりの売上額が10,000に達していないです。
今年の分析でも、1分あたりの売上額が10,000円を超えるかどうかが、一つの区切りと出ました。

1分あたりの売上が10,000円以下の売上額のサイトの分析

そこで、1分あたりの売上額が0円から10,000円の区間を抜き出して分析しました。

1分あたりの売上額(10,000円以下) - 2016
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
4,5022,259.393,4331,8462,6643,8056,0979,893198

このデータを見ると、半数以上のEコマースサイトが、1分あたりの売上額が3,805円以下であることが分かります。

1分あたりの売上額—10,000円以下
1分あたりの売上額が10,000円以下のECサイトのヒストグラム

今回の分析でも、2016年同様、Eコマースサイトの運営において、第一の壁は、1分あたりの売上額が4,000円を超えられるかどうか、第二の壁は、1分あたりの売上額が10,000円を超えられるかどうかにあるようです。

前年対比の売上の増減率の分布

前年対比の増減率について、一次資料で掲載されている値が入っている会社のみを抜き出して分析しました。

前年対比の売上の増減率 - 2016
平均値標準偏差四分位範囲0%25%50%75%100%標本の大きさ
13.04017.926617.495-24.42.2759.65019.77084.500180

データを分析すると、増減率0%のサイトは、156の標本の中で33番目に位置し、33/158*100≒21パーセンタイルの位置になります。
つまり、全体の20%は、前年よりも売上が下がっているという事を意味します。

最頻値は、8〜12%で、ここを中心とした、ほぼ左右対称の分布を形成しています。
前年対比で、8〜12%の売上が向上しているのであれば、日本市場のECサイトとしては及第点と言えるのではないかと考えます。

1分あたりの売上額—10,000円以下
1分あたりの売上額が10,000円以下のECサイトのヒストグラム