こんにちは! せがひろです。
今回は、「ベイズ統計学」を基に
未来を予測する考え方の知識を
伝えていきたいと思います。
最初にザックリ説明しますと、
「確からしさ」を知るためには、
多くの情報を集めないとわかりません。
「正しいこと」を知るためには、
「正しくないこと」を知る必要もあります。
なので、結果を得る時間を
短縮するために、
「成功者の真似をしましょう!」
「なぜ?」と疑問に思っても、
とにかく真似をしましょう!
それが最短距離で成功する方法です。
という風に伝えることが多いです。
しかし、多くの人が「なぜ?」と
疑問に思ってしまうと、
そこで思考停止してしまいます。
私もどちらかというとそうです(笑)。
納得しながら行動したい、
判断したいと考えてしまいます。
スポーツの世界でも、
コーチや指導者の言う通りに
することで、
最短で成功できたり
しますよね。
短い現役時代、
同じだけの時間しかない。
そんな状態でトップアスリートに
なるのは不可能です。
確かに才能もあると思います。
ですが、本人が才能に
気づけるかと考えると、
何も知識が無かったら、
無理な話です。
知識がある誰かが、
導かない限り無理な話です。
ただ、途中でも触れたように、
納得感があることでなければ、
「やる気」になれないのも
事実です。
そこで、
少ない時間、データでも、
「今のところ、これが有力!」
それを知る方法の一つが、
「ベイズ統計学」だということです。
ベイズ統計学は、
実際に多く利用されています。
漢字変換、Google検索、
Amazonなどのお勧め商品表示、
AIなどなど、
あなたが求めているであろう
答えに近いものを表示させて
いるわけです。
つまり、人間の思考プロセスに
近い性質を持っているわけです。
詳細については、
この後で解説していきます。
興味がある方は、
最後まで読んでみてくださいね。
ベイズ統計学の良いところ
最初に冒頭でも話した、
ベイズ統計学の良い部分をまとめると、
・データが少なくても推測できる。
・データが多くなるほど正確になる。
・入ってくる情報に反応して推測を改善する。
そう言った性質を持つことから、
・少ない情報で未来予測できる。
・時間が掛かる分析手法を使わずできる。
といえます。
オオカミ少年のベイズ推定モデルとは
ベイズ統計学の考え方を使って
推測することを「ベイズ推定」といいます。
単語は覚えなくてもいいですが、
良く用いられる例を紹介したいと思います。
・今、目の前に初対面の人がいるとします。
・その人が嘘つきが正直者かを見極めたいとします。
当然、初対面なのでその人物が
どういう人なのか分かりません。
なので、「半信半疑」という言葉もあるように、
それぞれの可能性を半々に設定します。
(ちなみに、主観的に決める
確率なので「主観確率」といいます。
「大体このぐらいだろう」
事前にそう決めておく確率のことは
「事前確率といいます。」)
仮に事前アンケートや
既存データを基に
嘘つきが、
本当のことを言う確率20%
嘘をつく確率80%だったとします。
また、正直者が、
本当のことを言う確率90%
嘘をつく確率10%だったとします。
(これを「条件付確率」といいます。)
ここまでの情報が得られた状態で、
もし、その人が「一回嘘をついた」という、
情報が得られたとします。
そうすると、
可能性としては、
①嘘つきでウソを言った。
②正直者でウソを言った。
この2つの可能性があります。
これを確率的に計算してみると、
①嘘つきでウソを言った確率
事前確率50%×条件付確率80%=40%
②正直者でウソを言った確率
事前確率50%×条件付確率10%=5%
このようになります。
つまり、①(嘘つき):②(正直者)は、
40%:5%=8:1となります。
(この8:1というのは、
正確には確率ではなく、
「オッズ比」といいます。)
ただ、前述のように8:1
というのはオッズ比です。
これを確率に戻すためには、
足して100%になるように
丸めれば良いわけなので、
8/9、1/9と置き換えれば
良いことになります。
(この2つの数字を足せば、
「1」になりますよね。)
そうすると、
8/9≒約90%、1/9≒約10%
ということになります。
よって、情報が何もない状態では、
嘘つきである確率が50%だったものが、
「一回嘘をついた」情報より、
約90%の確率でウソつきである。
という風に、
変化したことになります。
(ちなみに、「一回嘘をついた」
という情報により、
変化した確率のことを
「事後確率」といいます。
このように事前確率から、
事後確率にへんかすることを
「ベイズ更新」といいます。)
ここで更に、
嘘をついたとしましょう。
この場合は、
一回目のウソの後なので、
事前確率は、
嘘つき:正直者=90%:10%
となります。
後は同じように計算すると、
嘘つきである確率が、
99%ということになります。
このように、最初は何の情報も無く、
テキトーに確率を設定したとしても、
観測データが集まれば集まる程、
ベイズ更新(事後確率修正)により、
時間を掛けて統計学で調査した結論と
ほぼ等しくなるということです。
実務で使い勝手が良いとされるポイント
従来の統計解析では、
溜まったデータを
解析にかけ結論を出し、
また情報が溜まってきたら
解析にかけるといったように、
時間が掛かっていました。
それがベイズ統計学では、
直近の「事後確率」さえ
分かっていれば、
アップデートされた確率を
導き出せるわけです。
AIでよく耳にする、
ディープラーニングの
基になっている考え方です。
統計学ってやつは
今回、説明のために
計算式をいくつか使いました。
でも、実際の生活の中でも、
同じようなことをやっています。
例えば、性格ですよね。
「あの人は忘れっぽい。」
これは過去の事象(事実・実績)から、
そのように思うわけです。
統計学の考え方に「最尤(さいゆう)原理」
というものがあります。
世の中で起きていることは、
起こる確率の高いことである。
といった考え方です。
もし、神様によって予め確率が
決められているとしたら、
「確率が高いモノ」から観測される
ということです。
私は、まだまだ確率
というものについて、
疑問なところが
いっぱいあります。
数学で教えているため、
確率の話には、
必ず、「同様に確からしい」
といった条件が付きます。
例えば、コイントスでしたら、
50%の確率で表カウラが出る。
誰もが直感的に分かります。
しかし、実際のコインには、
デザインが施されていて、
両面が一様でなかったり、
投げる人の「癖」みたいな
ものも考えられます。
そうすると現実問題としては、
「同様に確からしい」状態では
無いということです。
確率論だけで考えると、
「机上の空論」とも言えます。
じゃあ、なるべく正確な
確率を知るためには
どうすれば良いのか?
それを担保するのが、
「統計学」だと思っています。
ただ、統計学も条件が
ちょっと違うだけで、
全然、異なる結果がでます。
なので条件設定が重要で、
思った結果にならなかったら、
条件設定の見直しをやるといった、
結局のところ、
PDCAサイクルを
繰り返し行うようになります。
これもまた、人間の普段の行動と
同じことを強いられるということです。
なんとも面白い学問です。
これからも学習して
いきたいと思います。
この内容が参考になれば嬉しいです。
動画紹介
今回の内容について、
参考になる動画を紹介します。
ぜひ、視聴してみてください。
以下のブログも参考になります。