株式会社Spelldata

〒100-0004
東京都千代田区大手町一丁目7番2号
東京サンケイビル27階
Tel: 03-3242-3150
Fax: 050-3488-8836
営業時間: 土日・祝日を除く 9:00〜17:30

情報品質の検査

Webページの情報品質を調べてみよう!

2016年6月20日
著者: 竹洞 陽一郎

情報品質とは?

情報品質とは、今日のところは、簡単に「良質なコンテンツかどうか」と覚えておいて下さい。
詳細な定義や指標があるのですが、今日のところは、まずは情報品質に興味を持ってもらうために、皆さんのWebページの情報品質を実際にチェックする方法を解説します。

ステップ0. Firefoxをダウンロードしてインストールする

もし、WebブラウザのFirefoxをお持ちでなければ、まずは、Firefoxをダウンロードしてインストールして下さい。

Mozilla JapanのWebサイト

ステップ1. FirefoxにWeb Developerをインストールする

次に、Firefoxにアドオンと呼ばれる追加機能を付与できるプログラムをインストールします。
そのアドオンの一つ、「Web Developer」をインストールします。

もし、この動画のように検索しても、上手く見つけられなかった方は、こちらのリンクをクリックしても、ダウンロード・インストールが出来ます。

ステップ2. Web Developerで文章と文章構造をチェックする

人は見た目で物事を判断してしまいますが、機械は見た目で情報を判断しません。
機械は、文章を解析します。
ですから、画像を非表示にしてみて、文章として、どんな情報が残るのかを確認することが重要です。

また、文章の構造を、見出しを見ることで確認することが出来ます。
優れた文章は、適切な見出しが設定されています。
見出しは、人も、機械も、文章を理解する上で、大事なガイド役を果たします。

ステップ3. W3C UnicornでHTML文法チェック

機械は、単語や熟語は容易に理解することが可能ですが、文書を解釈するのは苦手です。
特に、日本語は、英語のようなスペースで単語が区切られる言語ではないので、余計に難しいのです。

Webサイトを作る際に使う、HTMLという言語は、構造化言語と言って、文書の題名、見出し、段落、表、引用文、画像や図表の意味を定義するものです。
その定義を読み込んで、Webブラウザは、文書を解釈して表示してくれます。
それは、単にWebページの表示だけではなく、その文書の意味を解釈する上でも、非常に有用なのです。

もし、その定義に間違い(文法ミスや使い方の間違い)があったら、どうなるでしょう?
検索エンジンは、正しくWebページの内容を理解できなくなってしまいます。

改善の結果は、ゆっくりと現れてきます

以上が、情報品質管理の最初の一歩、基礎中の基礎です。
これだけでも、Webページの情報の品質を改善する効果があります。

下のグラフは、長野県の住宅施工会社での改善の例です。
トップページのHTML文法エラーが167個あったのを、まずは半分ぐらい修正してもらいました。
それによって、時間の経過と共に、Googleでの検索の表示回数が著しく改善しています。

Googleでの検索表示回数が上昇

その理由は、HTMLの文法エラーを修正することで、より正しく文章が解釈され、下の図にあるように検索の順位が向上したからです。
特に、住宅施工会社としては重要な「新築 <市町村名>」のキーワードについては、最低でも10位、最高で100位向上しています。

検索順位が10〜100位向上

情報品質を向上させる意義

このような構造化文書としてのHTMLの文法を直すことに、どのような意味があるのでしょうか?
それは、Webページは、人が読む以前に、検索エンジンなどの機械が先に読むという事を念頭に置くと理解できます。

情報の品質には、二つの要素があります。

定量的な要素: 情報価値
情報の内容が受け手にとって、どれだけの価値があるか。
定性的な要素: 情報品質
情報の内容が、どれだけ客観的で、正確で、信頼できるか。

Googleは、情報の価値と品質も検索結果で担保するために、情報品質の学会に参加して、その研究成果を検索のアルゴリズムに取り入れています。
では、Webページに書かれた情報を解釈するときに、文法エラーのないHTMLでマークアップされた構造化文書にするということは、文書の内容を解釈する上で非常に重要な事なのです。
これを「マシンリーダブル」と言います。

情報品質関連の書籍

情報品質については、日本では、北海道大学名誉教授の関口恭毅先生が自著を2冊、翻訳本を1冊出されています。

上記の本は、内容的には、情報品質よりデータ品質の方の意味合いが強いです。
広義の情報品質には、データ品質が含まれる考え方もありますが、狭義の情報品質とは異なります。

この分野については、英語の本の方が、今、MIT(マサチューセッツ工科大学)が主導で行っている情報品質の内容に沿ったものが多いです。

こちらの本は、Googleからも3名のメンバーが参加している論文集です。情報品質の分析アルゴリズムの話も出てきます。
もしも学習されるなら、こちらの本がお勧めです。

[前のページに戻る]