2017年
日本のEコマースサイト売上上位283社
Webサイト品質調査
日本のEコマースサイトの品質の変動
2017年5月29日
日本の売上上位300社のEコマースサイト(*)の内、自社サイトを持つ283社、284のWebサイト(**)の品質を調査しました。
*「月刊ネット販売」2016年10月号(宏文出版株式会社)の「第16回ネット販売白書」に基づく。** ディノスとセシールは、売上額としては合算されて掲載されているものの、サイトは別であるため。
調査項目
- トップページのサイズ(容量)
- トップページの接続ホスト数
- トップページのTCPコネクション数
- トップページの接続オーバーヘッド
- トップページのオブジェクト数
- トップページのHTMLバージョン
- トップページの文字コード
- トップページのHTMLエラー数
- Webサーバの種類
- 1分あたりの売上額
- 前年対比の売上の増減率の分布
調査期間
2017年3月1日〜3月31日
調査ツール
- HTML文法チェック…Nu Html Checker
-
Nu Html Checkerは、より良いHTMLの文法チェックツールとして継続的試験中のツールです。https://html5.validator.nu、https://validator.w3c.org/nuのバックエンドエンジンとして使われており、時代に合わなくなったW3C ValidatorのHTML5の対応を担うツールです。HTMLやXHTMLの複数のバージョンに対応しています。
このツールは、ソースコードやコンパイルされた実行可能ファイルがGitHub上に公開されており、ローカル環境で実行することが可能となっています。
- Webページ配信品質チェック…Catchpoint
-
Catchpointは、DoubleClikeやGoogleのサービス品質担当VPだった、Mehdi Daoudiが2010年に創業したWebサイトのパフォーマンスと可用性の品質管理測定サービスです。
統計的品質管理手法に基づき、実行可能データ(実際に改善の行動を起こすことが可能となるデータ)の提供を重点を置いて計測データを取得しています。テクノロジー企業をはじめとして、Eコマース、金融機関、メディア企業、通信キャリア、CDNサービスに24時間365日の計測・監視サービスを提供しています。
調査結果
トップページのサイズ(容量、単位はMB)
トップページのサイズ(容量)は、配信品質に影響を及ぼす要素です。
日本国内のインターネット環境が世界有数の高速・高品質であっても、物理的な法則から逃れることはできません。
容量が大きい「重い」ページは、Webサイトの表示速度や繋がりやすさに悪影響を及ぼします。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
3.6336 | 2.9161 | 2.42 | 0.2141 | 1.846 | 2.8662 | 4.2679 | 111.580 | 286 |
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
4.4340 | 3.2497 | 3.41 | 0.1924 | 2.229 | 3.396 | 5.639 | 19.4400 | 284 |
全体的にページ容量が増加していることが分析から分かります。
最頻値は、3.0〜3.9MBです。
トップページの接続ホスト数
接続ホスト数は、トップページを構成するCSS、JavaScript、画像などの各種オブジェクトを配信しているサーバの数です。
配信品質に影響を及ぼす要素です。
Webサイトの高速化のために、2015年2月17日にHTTP/2が正式な仕様としてIETFで承認されました。
しかしHTTP/2は、接続ホスト数が多い場合、SSLの接続確立のための手順がオーバーヘッドとなり遅延を引き起こすため、接続ホスト数が多い場合はHTTP/2を使うとHTTP1.1より遅延します。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
28.89 | 24.98836 | 30 | 2 | 11 | 21 | 41 | 138 | 286 |
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
34.25 | 28.84354 | 34.25 | 2 | 14 | 24 | 48.25 | 206 | 284 |
全体的に接続ホスト数が増加していることが分析から分かります。
最頻値は、30〜39です。
トップページのコネクション数
トップページのコネクション数は、TCP/IPの接続手続きの回数です。
1つのコネクション毎に、「TCP 3ウェイ・ハンドシェイク」と呼ばれる、コネクション確立のための通信が行われます。
HTTP1.1を使用しているサイトであれば、HTTP Keep-aliveという設定を行い、TCP接続を最大限に活用できるように、適切にHTMLのコードを記述することで、コネクション数を最小化することが可能になります。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
62.54 | 60.7140 | 54.75 | 7 | 22 | 43 | 76.75 | 374 | 286 |
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
44.50 | 74.2483 | 56.25 | 7 | 27 | 44.5 | 83.25 | 643 | 284 |
最大値が643で、この値が、他のサイトより異様に大きいため、これを外してグラフを作成しています。
全体的にコネクション数が増加していることが分析から分かります。
最頻値は、30〜39です。
トップページの接続オーバーヘッド
接続オーバーヘッドとは、必要以上にコネクションを確立することでネットワーク負荷を高めていないかどうかを表す指標です。
以下の計算式で算出されます。
接続オーバーヘッド = コネクション数 ÷ 接続ホスト数
最小値は1となり、これが理想の数値となります。
HTTP/1.1のKeep-alive、HTTP/2を使うと、一旦、コネクションを確立すれば、1つのホストから複数のファイルをそのコネクションを利用してダウンロードする事が可能になります。
「TCP 3ウェイ・ハンドシェイク」の手順を省略できるため、ネットワークの負荷の軽減に繋がります。
適切な設定が施されていれば、コネクション数は、接続ホスト数と同数となるはずです。
TCPは、TCP Slow Startといって、最初から、使用できる帯域を最大限には使いません。
通信を行いながら、徐々に、ウィンドウサイズと呼ばれる、1度に送受信できる通信量を増やしていきます。
大抵は、Webページを構成するオブジェクトファイルが小さいため、通信速度が最大に達する前に通信が終了します。
HTTP1.1のKeep-aliveやHTTP/2で、TCPのウィンドウサイズを広げて最大速度になったのを活用する上でも、接続オーバーヘッドを小さくする事は重要です。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
3.4716 | 5.8443 | 0.9989 | 1 | 1.3856 | 1.6295 | 2.375 | 47.8333 | 286 |
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
2.981 | 5.4475 | 0.9989 | 1.330 | 1.555 | 2.981 | 2.228 | 57.000 | 284 |
全体的にコネクションのオーバーヘッドは増加していることが分かります。
最頻値は、2.0〜2.9です。
トップページのオブジェクト数
トップページのオブジェクト数とは、CSS、JavaScript、画像、動画などの、トップページを構成するファイル数を指します。
配信品質と情報品質、双方に影響を及ぼす要素です。
配信品質の観点では、オブジェクト数が増える程にページ容量が増え、また接続オーバーヘッドが高いと、ネットワークの負荷が増大し、遅延を引き起こします。
情報品質の観点では、特に画像については、情報を補完するために挿入されるべきです。もし、画像の数が多い場合、以下の事が懸念されます。
- 本来、文字として記述されるべき情報が、見た目を重視して画像化された
- 1つのページに、複数の主題の情報が記述されており、それによって画像の数が増えた
- 広告、効果測定やアクセス解析などのThird Partyのスクリプトが増えた
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
226.6 | 140.8388 | 135.5 | 21 | 145.25 | 205.5 | 280.75 | 1501 | 286 |
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
242.2 | 127.4737 | 138.2 | 33 | 161.0 | 209.0 | 299.2 | 784 | 284 |
全体的にオブジェクトの数は増加している事が分かります。
最頻値は、180〜189です。
トップページのHTMLのバージョン
HTMLのバージョンは、直接的には、配信品質と情報品質、双方に影響を及ぼしません。
HTMLのバージョンによって、タグの仕様が異なるため、利用しているバージョンの仕様に準じたタグを使用すべきです。
次の項目のHTML文法エラーに関連してきます。
HTMLのバージョン | Webサイト数 | W3C勧告 | 全体に占める割合 |
---|---|---|---|
XHTML1.0 | 130 | 2000年1月26日 | 45.5% |
HTML4.01 | 80 | 1999年12月24日 | 28.0% |
HTML5 | 68 | 2014年10月28日 | 23.8% |
宣言なし・不明 | 5 | 1.7% | |
HTML4.0 | 2 | 1997年12月24日 | 0.7% |
XHTML1.1 | 1 | 2001年5月31日 | 0.3% |
合計 | 286 | 100% |
HTMLのバージョン | Webサイト数 | W3C勧告 | 全体に占める割合 |
---|---|---|---|
XHTML1.0 | 100 | 2000年1月26日 | 35.0% |
HTML5 | 98 | 2014年10月28日 | 34.39% |
HTML4.01 | 84 | 1999年12月24日 | 29.82% |
HTML4.0 | 1 | 1997年12月24日 | 0.35% |
XHTML1.1 | 1 | 2001年5月31日 | 0.35% |
合計 | 284 | 100% |
文字コード
HTMLの文字コードは、HTML5ではUTF-8が推奨されています。
UTF-8は、ASCIIコードと互換性があります。
ASCIIコードとの互換性があるUTF-8を使用することで、HTMLの解析時に誤動作や文字化け、プログラムのエラーの発生を防ぐ事ができます。
文字コード | サイト数 | 全体に占める割合 |
---|---|---|
UTF-8 | 186 | 65.5% |
Shift_JIS | 58 | 20.4% |
EUC-JP | 22 | 7.7% |
Windows-31J | 17 | 6.0% |
UTF-8、Shift_JIS混在 | 1 | 0.4% |
合計 | 284 | 100% |
Shift_JISの拡張コードであるWindows-31Jを使用しているサイトが17もあります。
Windows-31Jは、NECとIBMがShift_JISを独自拡張したものを、1993年にMicrosoftがWindows3.1のリリースの際に独自拡張を禁じて、CP932として統合し、IANA(Internet Assigned Numbers Authority)に「Windows-31J」として登録しました。
Windows-31Jに限らず、上述のようなASCIIコードとの互換性の都合から、HTMLのバージョンがいずれであるかに限らず、UTF-8への移行が図られるべきでしょう。
トップページのHTML文法エラー数
HTMLの文法エラー数は、情報品質に影響を及ぼす要素です。
HTMLは、構造化文書を記述するための言語です。
Googleのような検索エンジンなど機械に人間の記述した文書を理解してもらうためには、HTMLで適切なタグを選択して、正しく記述することが大きな助けとなります。
これを「マシンリーダブル」(機械可読性)と言います。
HTMLのエラーを無くすことは、マシンリーダブルに必要な要素の一つです。
また、HTML文法エラー数は、コーディング品質として重要な指標の一つです。
自社で開発している場合は、自社のエンジニアの、外部に委託している場合は、委託先のエンジニアの、コーディングの実力を示す指標となります。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
145.36 | 207.5657 | 141.75 | 0 | 26 | 76 | 167.75 | 1643 | 286 |
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
129.00 | 222.0816 | 112.45 | 0 | 22.75 | 48.50 | 135.20 | 2264 | 284 |
全般的にHTMLの文法エラーの数は減少している傾向にあります。
最頻値は、10〜19と20〜29です。
トップページのWebサーバの種類
Webサーバの種類は、配信品質や情報品質には直接的には影響を及ぼしません。
現在、日本のEコマースサイトでどのWebサーバが使われているのか、参考としてご覧下さい。
尚、合計の数が286ではなく、287になっているのは、あるサイトでHTMLの配信サーバと画像の配信サーバで、使っているWebサーバの種類が異なっていたためです。
Webサーバの種類 | Webサイト数 | 全体に占める割合 |
---|---|---|
Apache | 175 | 61.0% |
非表示 | 64 | 22.3% |
IIS | 31 | 10.8% |
nginx | 14 | 4.9% |
IBM HTTP Server | 2 | 0.7% |
Oracle HTTP Server | 1 | 0.3% |
合計 | 287 | 100% |
Webサーバの種類 | Webサイト数 | 全体に占める割合 |
---|---|---|
Apache | 181 | 62% |
非表示 | 59 | 20% |
IIS | 28 | 10% |
nginx | 21 | 7% |
IBM HTTP Server | 2 | 1% |
合計 | 290 | 100% |
nginxの採用数が少しばかり増加しています。
1分あたりの売上額
参考までに、元資料である「第16回ネット販売白書」の年間売上額のデータを単純に365日÷24時間÷60分した数値を、1分あたりの売上額として以下に記載しました。
自社サーバで運営しているかどうかに関わらず、全サイトの売上額データで分析したので、標本の大きさとしては300となっています。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
18,630 | 93,769.17 | 9,691 | 1,551 | 2,859 | 5,660 | 12,550 | 1,594,400 | 300 |
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
20,630 | 111,292.9 | 10,165 | 1,846 | 3,155 | 6,115 | 13,320 | 1,902,397 | 300 |
2015年、2016年、共に、最大値は、Amazonです。
この値だけ飛び抜けているため、ヒストグラムでは、Amazonは外してグラフを作成しています。
全般的に、売上額は向上している事が分かります。
しかし、50パーセンタイルで、6,115円と、300社中150社は、1分あたりの売上が6,000円以下であることが分かります。
1分あたりの売上が10,000円以上になるのは、売上額を小さい順から並べて199番目で、この位置は66パーセンタイルに相当します。
つまり、全体の2/3は、1分あたりの売上額が10,000に達していないです。
今年の分析でも、1分あたりの売上額が10,000円を超えるかどうかが、一つの区切りと出ました。
1分あたりの売上が10,000円以下の売上額のサイトの分析
そこで、1分あたりの売上額が0円から10,000円の区間を抜き出して分析しました。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
4,502 | 2,259.39 | 3,433 | 1,846 | 2,664 | 3,805 | 6,097 | 9,893 | 198 |
このデータを見ると、半数以上のEコマースサイトが、1分あたりの売上額が3,805円以下であることが分かります。
今回の分析でも、2016年同様、Eコマースサイトの運営において、第一の壁は、1分あたりの売上額が4,000円を超えられるかどうか、第二の壁は、1分あたりの売上額が10,000円を超えられるかどうかにあるようです。
前年対比の売上の増減率の分布
前年対比の増減率について、一次資料で掲載されている値が入っている会社のみを抜き出して分析しました。
平均値 | 標準偏差 | 四分位範囲 | 0% | 25% | 50% | 75% | 100% | 標本の大きさ |
---|---|---|---|---|---|---|---|---|
13.040 | 17.9266 | 17.495 | -24.4 | 2.275 | 9.650 | 19.770 | 84.500 | 180 |
データを分析すると、増減率0%のサイトは、156の標本の中で33番目に位置し、33/158*100≒21パーセンタイルの位置になります。
つまり、全体の20%は、前年よりも売上が下がっているという事を意味します。
最頻値は、8〜12%で、ここを中心とした、ほぼ左右対称の分布を形成しています。
前年対比で、8〜12%の売上が向上しているのであれば、日本市場のECサイトとしては及第点と言えるのではないかと考えます。