Student-Business

プログラミング・フィリピン留学・海外旅行など自分の体験を記事にしています

マーケティング 意思決定理論 統計・機械学習勉強 統計学

ベイズ統計学入門・初心者にオススメの書籍と僕の勉強軌跡

2018/03/12

mcmurryjulie / Pixabay

 

機械学習周りの勉強していて、ベイズの公式らへんでなんか解釈に苦しむことが多かったので、ベイズ統計学を1からしっかり学んでみようかと思います。

尤度とか使ってなんかやってるのは、計算は簡単だけどしっくりこないことが多い感覚でした。

なので急がば回れということで、本当に基礎のキソから学んでいきます。

まずは基礎的な理論の部分を意味の理解を大事にしながら学んで、徐々に発展的な理論の勉強をR、Pythonを使いながらやっていくことになると思います。

 

ベイズ統計学学習手順

 

入門編

まず一冊目から書いていきます。

掛け算と割り算だけで、わかりやすく教えてくれます。さわり程度の統計学の知識とベイズの定理を知っていると、なお勉強になります。

事後確率と尤度と事前確率の関係、あるいはそれらの意味を理解したい方にはドンピシャな本です。

特に、ネイマン・ピアソン統計学とベイジアン統計学の棲み分けもしっかりしていて、その点も学ぶことができました。

チャチャッと二日くらいで読むことができます。文字ばかりで内容薄そうなんですが、最初に読んでおいて本当によかったですよ。

ちなみに、文字ばっかりのこの本を友達にオススメしたら、「この本はないわ」、「バカっぽい」なんて言われましたが、皆さんは食わず嫌いしないように!笑

数式ばかり追いかけていても、理解は深まらないことが多いので。

内容に関してですが、14講まではベイズ推定を掛け算と割り算を駆使して理解します。次に、14〜18講でベイズの公式や連続型の確率分布の解説。19〜21講でベータ分布と正規分布を使ったベイズ推定となっています。

▽巻末の文献案内で面白そうだった本

意思決定理論の入門から発展までの参考書

 

(2018/1/19, ここまで)

 

この本は、書店で立ち読みしただけです。見た感じとして、会話+カラフルなイラストでストレスなく読めるなと感じました。

目次を見ると、上の「完全独習 ベイズ統計学入門」とだいぶ範囲が被っているし内容量的にも遜色ないものなので、買うならどちらかで十分です。こっちの本はコンパクトで、持ち歩きしやすいというメリットはある。

僕は買う予定もないですが、超入門の知識を固めるために、暇つぶし程度に図書館で読みます。

基礎

次に読んでいく予定の本としては、以下の二冊ですかね。

おそらくどちらも買います。

ですが、ひとまずは豊田先生の「基礎からのベイズ統計学」は立ち読みして、質を把握してるのでこっちから手をつけると思います。松原先生の本は、意思決定ってタイトルに入ってて、ものすごく興味を書き立ててきますが後回しにします。

「基礎からのベイズ統計学」はパッと見はお堅かったですが、難易度的は全く問題ないと思います。姉妹本も出ているので次に繋げる際も役立ちそう。

(2018/1/21 「基礎からのベイズ統計学」購入)
基礎的な高校数学と統計学以外に予備知識を必要とせず、文科系学部生を対象にした本のようです。本書自体も早稲田大学文学部の学部心理学演習という講義のための資料をしっかりまとめ直したものです。

主な内容は、ハミルトニアンモンテカルロ法を利用したベイズ統計学です。

1章:この章をやればベイズの定理を知らない状態から読めるようになります。また、主観確率の危険性と魅力について「完全独習 ベイズ統計学入門」より形式的にまとまっています。また、「完全独習 ベイズ統計学入門」では有耶無耶になっていた3囚人問題がしっかりと説明されている点も良い。

2章:基本的な確率分布についての解説の章。章末に最尤推定法が載っているが非常に良い説明。例えば、尤度関数を急に導入して解説を始める参考書が多いが、本書では「現実場面で観測されるデータによってxは固定されるが、母数θは未知であるため、データを定数として母数は変数として取り使う」として前置きをしっかり挟んでいる。ちょっとしたところだが、初心者がしっかり理解する上では必要な解説だと思う。

3章:ベイズ推定に関する説明の章。カーネル、共役事前分布、EAP、MAP、MED、無情報的事前分布、予測分布などの説明の後、3囚人問題を再考する。この章では、標本比率の標本分布がベータ分布で近似できるということで話が勧められているが、そこの解説も数式で欲しかった。この章で特によかったのは、ポアソン分布・指数分布・ガンマ分布を”授業内課題提出”というテーマに沿って関連付けて紹介している点。また、後に紹介する「Rで学ぶベイズ統計学入門」の2章を読みコーディングして可視化してみると理解が捗った。逆に悪かった点は、ミスリードを生じさせてる章末問題。この章末問題のおかげで理解は捗るし、解答や問題レベルも最適なのだが、章末問題の文章自体があまり良くない気がする。

4章:マルコフ連鎖モンテカルロ法(MCMC)の中のメトロポリス・ヘイスティング法(MH)に関する章。理解するために何度か読み返す必要がありました。特に、詳細釣り合い条件のところに時間がかかりました。MHを理解するのは大変で心が折れかけましたが、「道具としてのベイズ統計」という本を読んだところようやく理解することができました。この本は先に読んでおくべきだったかもしれません。また、「Rで学ぶベイズ統計学入門」の6章の該当する箇所をさらっと読みコーディングしました。

・・・あとで書評を個別の記事に切り分けます。

感想:ベイズ統計学では、至る所で伝統的な統計学(ネイマン・ピアソン)との対比がなされています。そのため、ベイズ統計学を学んでいると伝統的な統計学に関しても理解が深まっている気がします。

中級編

「基礎からのベイズ統計学」の姉妹本。レビューで「これ読んだ後、Journal of Mathematical Psychologyで専門性を深めよう」って書いてあって興奮した。心理学も興味ある分野なので、踏み込んで行きたいです。

 

豊田先生の本二冊をやった後にやると良さそう。

見た感じだと、だいぶわかりやすそう。書店で見て買おうと思ったけど、本の構成?が慣れてないものだったので思いとどまった。難易度的には、中級編の最初の一冊でやった方がいいのかもしれない。

どちらかというと基礎を抑えたプログラマ向き?まだ見てないので、情報0です。オライリーなので、毎度のごとく買ってしまうかもしれない。

上級

購入済み。並列して進めていく予定です。

この本だけでベイズを理解しようとするのは、不可能でしょう。説明に関してはあまり詳しくはなく、必要最低限の見通しの良い要約と言った感じです。ですが、知識を整理するのに非常に役立ちます。また、Rによる演習が十二分に載っているので、実際のコーディングを行いながら理論理解のための演習、理解を深めるための演習として活用できます。

 

「基礎からのベイズ統計学」ではモデル選択や高度なモデリングは扱っていないので、こちらの姉妹本も参照する必要が出てきそう。

最上級

最高級の教科書。おそらくやる日はこない。

おまけ

最近出たっぽいなんかかっこいい本。あとで確認します。

-マーケティング, 意思決定理論, 統計・機械学習勉強, 統計学

おすすめ記事

1
【ホワイトニング】自宅で歯の黄ばみを白くするなら歯磨き粉トゥービーホワイトがおすすめ!理由と効果まとめ

  自宅で、歯磨きするだけで歯を白くできる市販の歯磨き粉をみなさんはご ...

2
ポイントたまりすぎ!マクドナルドで楽天ポイントカードが使用可能に!マックでの使い方・活用方法まとめ

  早くて安くておいしいマクドナルドを、よく利用しているという方も多い ...

3
【Aukey PL-WD06】スマートフォン用カメラレンズなら旅行で風景写真が綺麗にとれる!

いい写真を撮りたくて、一眼レフやコンデジを買いたいと思う方は多いでしょう。しかし ...

4
【在宅ワーク】在宅で記事を書くライターになり1文字1円以上の収入を得る方法

最近、文章を書く力・文章構成力にオシャレさを見出してきました。 文章を書くのにも ...

5
初心者のためのWebデザイン独学の方法と参考書を現役エンジニアに聞いてみた

今回は、htmlとcssといったWebデザインに関してどうやって学べば良いかを、 ...