ホームページを誰が閲覧したのかわかりますか?

今日の質問はアクセスログについてです。最近ではTwitterなどで名誉毀損の書き込みに対し、個人が訴えられるといった事例もありました。

それでは、ホームページを誰が閲覧しているのかわかるのか?どうやって個人まで特定するのか?について解説したいと思います。

これは、ウェブサイト運営にあたりアクセス解析のポイントにもなります。

ホームページ閲覧の足跡

ホームページを閲覧すると、その足跡をアクセスログと言われる形式で残すことができます。

しかし、このアクセスログの取り方にもいくつかの手法があり、かかる手間やコスト、取得できる情報が変わってきます。

一般的なアクセスログには以下の様な種類があります。

  • アクセスログ型
  • ビーコン型
  • パケットキャプチャ型

また、それぞれの特徴は以下の通りです。

アクセスログ型

サーバが取得したユーザーの情報を、サーバ上に履歴として保存しているアクセスログ。
サーバが取得できる情報のみしか記録できない。

ビーコン型

ブラウザがウェブサイトを表示した際にスクリプトによってユーザー情報を取得し、専用のサーバに履歴として保存するアクセスログ。
ユーザーがブラウザ上で行った行動をリアルタイムに記録することができますが、スクリプトが正常に動作しなければユーザー情報を取得できません。

パケットキャプチャ型

サーバーの置かれているネットワークに流れる通信情報からユーザー情報を取得し、専用のサーバに履歴として保存するアクセスログ。情報としてはアクセスログと同じ。分散型の大規模サーバに適している。

このように、様々な方法でログを取得できますが、パケットキャプチャ型は大規模サーバー向けのため、あまり一般的ではありません。

共有型のレンタルサーバーなどではアクセスログ型の機能が最初からついていることが多いため、敷居も低く利用しやすいです。

ビーコン型だと、有名なのがGoogleが提供している「Google Analytics」です。誰でも無料で使うことができ、複数サイトのログを取ることも可能です。にも関わらず高機能なため、多くのウェブサイトで採用されています。

アクセスログにはどこまで残るのか?

種類によって取得できる情報は異なりますが、重要なのは以下の項目でしょう。

  • 訪問者のIPアドレスまたはドメイン名
  • アクセスした日時
  • アクセスしたページURL
  • HTTPステータスコード
  • アクセス元のURL(リファラ)
  • OS、ブラウザ情報

最初に「訪問者のIPアドレス」とありますが、これはあなたの端末のIPアドレスではなく、あなたの家や会社が取得している「グローバルIPアドレス」になります。

アクセスした日時はあなたのパソコンの時間ではなく、サーバー側の時間です。

HTTPステータスコードはちゃんとページが開ければ「200」が返り、ページが見つからないと「404」が返るなどです。

リファラとは、あなたのページを開く前に見ていたページのURLです。同じドメインなら同じウェブサイト内での遷移になりますし、別のドメインなら外部リンクで遷移してきたことになります。

OS、ブラウザの情報はOSのバージョンやブラウザのバージョンが細かく出力されます。

アクセスログからわかる情報

上記のアクセスログから、ユーザーがどこから、何月何日に、どのページを、どういった経路で、どのようなパソコン・ブラウザを利用して、アクセスしたのかがわかります。

ここで一つの疑問が湧くのではないでしょうか。

「どこから」がなぜわかるのでしょうか?これはブローバルIPアドレスによって解決することができるのです。

グローバルIPアドレスは、インターネットの中で他と重複しない一意のIPアドレスです。これは、あなたやあなたの会社が契約しているプロバイダーごとに番号が割り振られており、その中から各ユーザーに一時的に貸し出しています(固定することも可能です)。

また、グローバルIPアドレスを割り振る際、地域によっても割り振りが決まっており、都道府県程度の地域を特定することができます。ただし、細かい住所までは特定できないのと、実際と異なる場合もあります。

個人は特定できない?

上の項目でも書いた通り、アクセスログに残されるグローバルIPアドレスだけでは個人を特定することはできません。では、最初に書いたTwitterの事件ではなぜ個人が特定できたのでしょうか?

ここは、事件が故の個人情報開示が関わってきます。

これも先に書いた通り、グローバルIPアドレスはあなた、ないし企業が契約しているプロバイダーによって割り振られます。また、アクセスログから、あなたのウェブサイトにアクセスした日時もわかります。

プロバイダーには何月何日にどのグローバルIPアドレスを誰に割り当てたかという情報が記憶されているので、プロバイダーに問い合わせてそれらを照らし合わせれば契約者を特定することができるわけです。

また、契約者がインターネットカフェや企業の場合、各々のインターネット接続機器にどの端末がどこに接続したかといったログが残っています。

そこから端末を割り出し、その日時にその端末を使用していた人を割り出すことで、個人を特定できるわけです。

ただし、これは事件なので個人情報が開示されただけで、誰でも問い合わせれば教えてくれるものではないことに注意してください。基本的にはどの地域から程度で考え、個人は特定する必要はないでしょう。

でも実は、、、

アクセスログ型では今までの情報が全てなのですが、ビーコン型は実は話が変わってきてしまいます。

特に、Google Analyticsではもっと多くの情報を知ることができます。例えば、ユーザーが男性なのか女性なのか。何才くらいなのか。詳しい地域などです。

それはなぜだと思います?ちょっと考えてみてください。

シンキングタイム

答えは、アクセスログとGoogleのアカウント情報を紐づけているからです。全員ではないにしろ、個人も特定できているかも知れません。

しかし、個人情報保護の観点からか、そこまでの情報は開示していません。そう考えると、ちょっと怖いですね。

様々な情報を取得し紐づけることで、個人を丸裸にしてしまう。これがGoogleの強みであり、恐ろしいところですね。

まとめ

アクセスログにはウェブサイトを閲覧したユーザーの情報が記録されていますが、それだけで個人を特定することはできません。

ただし、事件となれば話は別で、プロバイダーに問い合わせることで個人情報を開示してくれ、そこから個人を特定することが可能です。なので、アクセスログをしっかり保存しておくことが大切です。

アクセスログは日々増えていくので、アクセス数の多いウェブサイトではファイルサイズが大きくなり、サーバーを圧迫する場合もあるので注意しましょう。

そして、Googleは私たちが見ている以上の情報を持っていることも忘れずに。

 

こちらの記事も読まれています

ネット集客解析士/マーケティングパートナー協会認定パートナー

千葉県市川市在住/鴨川市出身 中小企業のウェブ担当者、経営者に向けて、ネット集客で成果を出せる人材の育成をお手伝いしています。一緒に継続的に売上を伸ばす事のできる社内体制を作りましょう。

浦安・市川 売上アップ実践会

浦安・市川でビジネスをされている経営者の方へ

あなたのビジネスがすぐに売上アップする
具体的なノウハウがわかる勉強会を開催します!

マーケティングが専門のナビゲーターと一緒に、
学ぶだけでなく、その場でブレストしながら実践方法を考える
すぐに結果につながる勉強会です。

こちらの記事も読まれています


浦安・市川 売上アップ実践会について詳しくはこちら

SNSでもご購読できます。

コメントを残す

*

CAPTCHA