呑んべえ柴やんのセキュリティABC

情報漏洩を防ぐ大人の嗜み

教えて欲しいものだなグーグルアナリティクスに現れる顔文字の意味を

f:id:BighelpSecurity:20150601114133j:plain
大漁だと確信した潮干狩り、台所で選別したら中身のない貝殻だけが結構混じってて酒蒸し二皿分くらい晩酌のアテを損した柴やんです。

さてブログの立上げから数ヶ月。気持ちに余裕が出てきたのでそろそろグーグルアナリティクスとやらでアクセス解析でもしてみるかと考えている方に向けて。

本日の大人の嗜み

・自社ウェブサイトが対象とするお客様を特定することで不要なアクセスを制限しデータ解析の精度低下や無用なアクセス負荷で被るSEO対策上の損失リスクを防止しよう。

グーグルアナリティクスに表示される不要なデータ

自社のウェブサイトに訪れてくるのはあなたのウェブサイトに興味がある人だけではありません。他人が特定のウェブサイトへ故意に誘導させる目的でそのウェブサイトのURLを足跡のように残す場合も少なからずあるからです。

俗に言うリファラースパムと呼ばれるものや検索キーワードスパムと呼ばれているもので不要で迷惑なアクセスです。なおリファラースパムの意味については、ググってもらえば分かると思いますので割愛します。

リファラースパム等対策

実際に自社のウェブサイトにアクセスしてくる場合と実際には自社のウェブサイトにアクセスしていない場合とで区別します。

実際にアクセスしてくる場合の一つ目はそもそも不要な訪問者を自社のウェブサイトにアクセスさせないという考え方で.htaccessファイルが使える環境の場合となります。

リファラースパムの多くは主として海外からのアクセスなので各国に割り振られているIPアドレス、ホスト名あるいは言語設定などを参考に海外からのアクセスを制限する方法です。

※国内利用者のみを顧客と想定するウェブサイトで.htaccessが使える環境の方は下記URLにて、日本に付与されているIPアドレスだけを現時点でまとめたデータをダウンロードして自社で設定している.htaccessファイルに追加してください。

二つ目は既にグーグルがスパムとして識別しているものについては記録しないように自動的に除外してもらう方法です。

グーグルアナリティクスの「アナリティクス設定」→「ビュー設定」→「ボットのフィルタリング」の直下にある「既知のボットやスパイダーからのヒットをすべて除外します」の隣にあるチェックボックスにチェックを入れてから「保存」を押すことで有効になります。以後既知のボットのアクセスは記録されなくなります。

ただし既知のスパムのみに効力を発揮するもので、新たに現れたスパムについてはグーグルが認識するまでの間は除外することはできません。

三つ目は新たなスパムを対象とした手動での対策になります。
グーグルアナリティクスの「フィルタ」を活用してスパムのIPドレス、ホスト名または言語設定(特定の言語名が設定されている場合もあるが、通常は“not set”が多い)などをフィルタのキーワードとして除外対象とし、以後解析データとして記録されないようにする方法です。

さて、次は実際には自社のウェブサイトにアクセスしていない場合ですが、例えば「集客」→「キャンペーン」→「オーガニック検索」で検索キーワードを表示させた場合に、こんなのが表示されていませんか?

vitaly rules google ☆*:.。.゚゚・*ヽ(^ᴗ^)丿*・゚゚.。.:*☆ ¯\_(ツ)_/¯(•ิ_•ิ)(ಠ益ಠ)(ಥ‿ಥ)(ʘ‿ʘ)ლ(ಠ_ಠლ)( ͡° ͜ʖ ͡°)ヽ(゚д゚)ノʕ•̫͡•ʔᶘ ᵒᴥᵒᶅ(=^. .^=)oo

これは検索キーワードスパムなどと呼ばれているものであり、海外記事ですが同じ悩みを抱えるユーザが対策方法として活用している記事を紹介します。

上記のvitaly rules googleを対象としたフィルタ設定の具体的な手順ですが、グーグルアナリティクスにログイン済みの状態で「アナリティクス設定」をクリック。
次に縦3列で項目が表示される画面で一番右列の中盤にある「フィルタ」をクリック。

フィルタ設定画面の上部に赤枠で表示されている「新しいフィルタ」をクリック。
「フィルタ名」は任意、例えば「vitaly rules google」とし、「フィルタの種類」は「カスタム」、「フィルタフィールド」は「キャンペーンのキーワード」を選択、「フィルタパターン」に「vitaly rules google」のみを指定して画面一番下の「保存」をクリックでOKです。指定キーワードを含むものを意味するので顔文字まで含める必要はありません。

そして最後の四つ目ですが、フィルタ設定以前に記録されている各種スパムのアクセスを含まずに純粋なアクセス解析を行なう方法です。

詳細手順は別途調べていただくとして、グーグルアナリティクスのアドバンストセグメント機能を使って、自分のドメイン参照元とするトラフィックのみを抽出することでスパムを含まない純粋なアクセスデータを解析することができます。                   

ちなみに、今年の4月後半に開設した当ブログのアクセスデータに対してアドバンストセグメントを適用したものとそうではない統計データの比較実例を恥ずかしながら公開します。これもリファラースパム等の迷惑度合いを見て感じてもらいたいが為。。。

f:id:BighelpSecurity:20150601130534p:plain

いかがでしょうか!?
・全体セッション100%のうち純然たるアクセスは44.45%、つまり55%が不要なアクセス。
・ユーザについては3倍弱の水増し!
・ページビューは2倍の水増し!
・平均セッション時間は二分の一弱に低下!

開設して2ヶ月弱の当ブログでもこのありさまです!!
いかに不要なアクセスが多く、また解析精度を妨げているのかご覧になれるかと思います。
もっとユーザ数やアクセス数が多い人気ブログでは更に大変なことになるのではないでしょうか!?

                

まとめ

導入以後から現時点まで自社のウェブサイトにどこから何人くらい訪れてどんなコンテンツをどのくらいの時間をかけて読んでいるのか、検索流入してくるキーワードは何かなど、アクセス解析ツールによりウェブサイトの仕事ぶりを目に見える形で知ることができます。

言うまでもなくwordpressサイトではグーグルアナリティクス等の解析ツールを自分で導入しておかない限りアクセス解析はできません。また解析ツール導入以降のデータしか解析することができません。

ウェブサイトを集客に活用したいはずなのにアクセス解析ツールを導入していないなんて事がないように、ウェブサイトを立ち上げたらすぐにグーグルアナリティクス等のアクセス解析ツールを導入しましょう。もちろんスパム対策も忘れずに!


今夜は新鮮なイカをワタごとホイル蒸しにしてチビチビ冷酒で決まりの柴やんでした!? また来週!