こんにちは! せがひろです。
今回はデータ分析で
よく出てくる、
「異常値」「外れ値」
について話したいと思います。
イメージ的には、
「例外」ですよね。
データを基に分析する際に
一番大事なのが、
「正しいデータであること」
それが大前提です。
いくら努力しても
成果が出ないというのは、
正しい努力が
できていないからです。
それはなぜか?
正しい知識が
備わっていないからです。
じゃあ、正しい知識を
どうやって手に入れるかですが、
データ(情報)を
正しく分析することです。
それでは解説して
いきましょう!
データ分析における異常値とは
例えば、読者のアンケートで、
参考になったら、0を選択
参考にならなかったら、1を選択
その時に「2」と
書いてしまったとします。
これが予定されていなかった
入力なので「異常値」となります。
これは回答者が間違えるケース、
データ入力者が入力ミスする
といったケースも考えられます。
この時の対処方法としては、
除去するか、
正しい値に修正する
ことになります。
プログラミング的に
考えれば、
0と1意外入力できない
ようにするか、
記入式であれば、
マークシートするといった、
事前の予防策を取ります。
ここで伝えたいことは、
あなたが何かアンケートを取り、
データ収集する際に、
異常値が発生しないためには、
記述式ではなく、
選択式にしましょう。
ということですね。
データ分析における外れ値とは
平均から大きく外れた値のことを
「外れ値」といいます。
例えば、アンケート回答者の
平均年齢が20代に対して、
50歳、80歳といった、
平均年齢からかけ離れた、
アンケートデータが
混じっている状態です。
外れ値は異常値とは
異なります。
大多数の意見とは、
かけ離れたデータということです。
この大多数とかけ離れた意見
というものは無視した方が良いのか?
実は、このかけ離れた外れ値こそが、
データ分析では大事になってきます。
データ分析のポイント
平均から外れた部分は、
無視するなんて勿体ないことです。
なぜ、平均から外れたのか?
上振れを分析すれば、
平均を底上げすることができ、
下振れを分析すれば、
良くない所が改善できるわけです。
例えば、客入り・・・、
集客について、
ある特定の日に
上振れしていたとします。
その時の要因を
分析するわけです。
平日か?休日か?祝日か?
何かのイベントがトリガーか?
商品やサービスに
特別な理由があったのか?
などなど、
平均値と何が違うのか?
徹底的に分析するわけです。
商品を仕入れて
販売する商売であれば、
無駄なく仕入れる量を決める
目安にできるわけです。
特に個人でやるビジネス
でしたら、
マーケティングの知識を
身につけて、
データをしっかり
分析することが大事です。
大手と競っても、
資金力で叶わないので、
お客さんのニーズを
しっかりと把握し、
些細な変化も見逃さず、
改善・対応していくことが
必要だということです。
外れ値を分析もせず、
除去するのではなく、
そこにこそ、
宝のヒントが隠されている
ことが多いのです。
自分がやりたいことで稼ぐ
趣味や自分がやってみたい
ということで、
ビジネスをやるべきです。
興味を持ってやることは、
長続きして、
イヤイヤやる仕事よりも、
成長が早いです。
しかし、自分が好きで
やっていることが、
認知されなければ、
大勢の人に見て貰えなければ、
売上げには
繋がらないわけです。
その多くの人に見て貰う
ためにやるのが、
マーケティングだと
いうことですね。
そのためには、
データ分析は欠かせません。
データ分析スキルを
身につけ、
思ったような結果が
出せるようになると、
近未来を予測できたような
喜びに遭遇できます。
ぜひですね、
統計に興味を持って、
ビジネスに活かしてください。
他にも統計に関する
発信をしていますので、
カテゴリ一覧の
「マーケティング知識」
を覗いてみてください。
この内容が参考になれば嬉しいです。
動画紹介
今回の内容について、
参考になる動画を紹介します。
ぜひ、視聴してみてください。
以下のブログも参考になります。