Student-Business

プログラミング・フィリピン留学・海外旅行など自分の体験を記事にしています

統計学

入門・基礎レベルから統計学を学べて成長できる本・参考書・サイトとやり方を完全紹介!|数学が苦手な初心者にもおすすめな勉強方法

2017/06/04

Tumisu / Pixabay

統計学を学んでいると、どこかのタイミングで数学が難しく感じて、勉強に滞りを感じるものです。

そんな時に、色々な統計学の参考書を手にとってもどのみち理解はできません。僕もそのような経験をしていた時期があり、本の解説が悪いせいにして、色々な本を買い漁ってしまいました。

そこで、この記事では、統計学の基礎となる数学を1から計算を通して学べる参考書を、順番に紹介していきたいと思います。もちろん統計学を1から勉強できる方法でもあります。

この手順は、結構試している方がいて、挫折率が低いものです。なので、ぜひ、皆さんにもこの方法を通して勉強していただき、数学のストレスなく統計学の専門書を読めるようになる基礎を築いていただけたらなと思います。(この記事の後半)

一度数学に恐怖を覚えると、数学を学ぶ気が失せてしまいますが、基礎からちゃんとした手順で学べば誰でも習得できますのでご安心を。

また、統計の勉強をしていると、この手法どういったときに使うのかわからないという時も出てきます。数学はできるから統計学の本を読めるけど、実際には使い方わからないといった場合もあるでしょう。

そういった方は、統計の知識の使い方がわかるようになる手順も紹介するのでぜひ参考にしてください。(この記事の前半)

統計学の意味を知りそれを使えるようになる本・参考書・サイト

※一応、ほんの少しは統計学を学んだことがあるのは前提です。しかし、その本を理解できた気がしない人、途中で挫折した人にドンピシャな本達を紹介していきます。

※また、僕自身が実際にこの手順・参考書で勉強をやり直したので、ここに載っている本達を終えれば入門〜基礎的な内容はガッチリ固めると確信しています。また、僕が一押しだと思う本もおすすめしたいと考えております。

ハンバーガー統計・統計学がわかる (ファーストブック)

統計学がわかる (ファーストブック)シリーズの一冊目です。とにかく、「平均と分散、信頼区間、カイ2乗検定、t検定(対応なし)、t検定(対応あり)、分散分析(1要因)、分散分析(2要因)」の意味と使い方がよくわかるようになります。数式展開はほぼなく、意味を理解させることに重点を置いてます。

一例ですが、「対応ありのt検定と対応なしのt検定の意味の違いはなに?」と言うのがわからない人などは、この本・Webサイトで学ぶといいでしょう。また、ここで得た知識を使ってなら、簡単な分析ならできるようになります。

この本を読まずに、少しお堅い本から分散分析などを学ぶと、少し腑に落ちない部分が出てしまったりするのですが、先のこの本(サイト)をやっとおけば無敵です。とにかく目から鱗!

知識が固まるまでは何度も読み直しましょう。

かかった時間:計6時間 (問題はやり方を考えるだけで解いてない)

参考サイトhttp://kogolab.chillout.jp/elearn/hamburger/

Pythonを使いながら勉強したいなら、「ハンバーガー統計学にようこそ!」をPythonでお勉強も参考にするといいでしょう。

アイスクリーム統計学 統計学がわかる 【回帰分析・因子分析編】

統計学がわかる (ファーストブック)の2冊目です。

回帰直線を、相関1と相関0に分けるところと因子分析の因子得点の部分の解説が不十分で分かりずらかった。そこ以外は、さすがのデキで、楽しく気楽に勉強させていただきました。これに関しても、他の本を読む際にもう一度は振り返って見ようと思いました。

学んだことは、「散布図と相関、相関係数、無相関検定、回帰直線、偏相関、重回帰、相関行列、因子分析」についてです。

かかった時間:計4時間(問題はやり方を考えるだけで解いていない)

参考サイトhttp://kogolab.chillout.jp/elearn/icecream/

ここまでのシリーズ本2冊では、基礎的なことを分かりやすく学べるだけでなく、「統計の知識ってこうやって使えるのか!統計学って面白い!」と少し楽しさを垣間見ることができました。カンフル本的な役割もしっかり果たしてくれました。

 

統計学の本は、同じ範囲でも難易度が違う本が出版されています。ですので、復習の必要性からも、本を変えながらレベルアップしていく必要が絶対的にあります。しかし、この際に初級レベル1から中級レベルに飛び級したり、範囲が違うものを急にやってしまうと痛い目を見るので注意しましょう。

 

完全独習 統計学入門

1冊目のハンバーガー統計の本を復習するのに役立ちます。超入門書として、非常に人気の本です。Amazonでベストセラーになっていることからもその人気はみて取れます。また、本の読みやすさなども踏まえて、負荷をできるだけ減らしているのが特徴です。ハンバーガーより体系だっている入門書。

とは言え、ハンバーガー統計をやっている人は、範囲が被っているのでやる意味がそこまで感じられないかもしれません。それでも、ハンバーガー統計は意味を理解する点を重視した本だったので、完全独習 統計学入門はやっておくべきでしょう。以降も、統計学の意味を知りそれを使えるようにする本を僕がやった手順・レベル順に書いて行きますが、この本をやった後ならスムーズに繋げられますし、統計学に必要な数学の基礎も身につけられる本(後述)を並列して始める事も可能だと思います。

ちなみに、統計学を全く学んだことがないと言う人は、ハンバーガー統計だと少し説明が足りないところもあると感じたので、迷わずこちらの本を選択してください。逆に、少しは知識がある人は、ハンバーガー統計を選べば、完全独習 統計学入門ではカバーしきれていない範囲の本アイスクリーム統計もシリーズで学べる利点があります。

両方やるのが絶対的にベストではあるんですけどね。

 

ここまでの3冊、あるいは1、2冊を終えた時点で、統計学の入門は果たせたことかと思われます。しかし、まだまだ十分ではないことはお分かりのことでしょう。まだ入門レベルです、勉強負荷もあまり高くはありませんでした。次の段階では、基礎レベルに移行します。少し立ち入った話も出てきますが、数学でゴリゴリやるという本ではないので、頑張っていきましょう。

また、統計学の勉強は参考書を多く使う必要がありますが、自己投資だと割り切っていただけたらなと思います。本当は数を絞って紹介したいところですが、統計学は手順良く学ばないと、途端に理解できなくなり挫折しがちなので、このようなスタイルでの紹介となっております。

では、早速復習×レベルアップに入ります。

よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)

これは、難易度的には「統計学がわかる (ファーストブック)完全独習 統計学入門」での内容を詳解した本で、昔から統計学の入門書として定評があります。そして、「Rによるやさしい統計学(後述)」というほとんどのデータサイエンティストが持っているような本を世に生み出した著者だけあって、さすがの分かりやすさです。

また、内容の範囲も推定・検定といったもので被っています。ですので、「ハンバーガー統計・統計学がわかる」の次にやるとより理解が深まることでしょう。追加で学べたことはだいぶありました。

具体的な内容ですが、前半部分では推定について詳しくやり、最終的に点推定・区間推定について簡潔にわかるようになります。そして後半部分で、統計的仮説検定についての話があります。正規分布を利用した検定、t分布を利用した検定、相関係数の検定、カイ二乗検定、分散分析を詳しくやりました

体系立って学べるので、これをやり終えた次にもっと深い内容・数学が入ってくる本を勉強する際にも援護射撃してくれます。

この本のレベルに関してですが、この本の冒頭で、「レベル分けすると、統計屋(研究者)>統計屋+心理屋>心理屋(使い手)>心理屋のたまご(学生など)がいて、心理屋に対しての分かりやすい本は出てきているけど、心理屋のたまご(学生)には分かりにくいことが多いとあります。そして、「本書は、心理屋のたまごが分かりやすい本を目指す」とあります。(僕が勝手に解釈したものなので大体のニュアンスだけ掴んでください)

  • レベル1:専門書
  • レベル2:専門家の視点から書かれた入門書
  • レベル3:非専門家の視点から書かれた入門書
  • レベル3.5:本書のレベル
  • レベル4:とにかくポップな入門書(ファーストブックなど)

ただ、買ってみると少し大きめの本だなと思う人もいるかもしれません。しかし、この本は、余白をたくさんとってあるので、読んでみると見かけより断然大変ではないことが分かります。

また、この本は出版されてから少し年数が経っていると思う方もいるでしょう。表紙のデザインもダサい。しかし、内容は全く古くも間違ったりもしていません。私たちがここで勉強する検定などの手法は、すでにだいぶ昔に確立されているからです。

加えて、心理統計と言えども完全に統計学の入門書で、しかも文系の数学にアレルギーを持ちかねない方を対象にして書かれています。

さらにさらに、この本の著者(山田剛史)は、「Rによるやさしい統計学(後述)」を書いた方でもあるので、内容が対応しています。ですので、「Rによるやさしい統計学」の基礎編でRを使いながらやると、良い演習になりRで実際に検定などを行うことができます。「Rによるやさしい統計学(後述)」の応用編は、回帰分析・因子分析などになってくるので、そちらを学んでから活用できます。

もう、お分かりですよね?これは、完全なる良書です。

かかった時間:計14時間(復習しながら読み進めました。)

※この記事の最初の方でも言いましたが、僕は統計学の本(統計学がわかる (ファーストブック)のように意味を掴む用の本以外)を既にご自身で1冊はやってみた人を対象に参考書のオススメをしています。この本は数式の変形・計算などはほぼ出てきませんが、統計学についてほんの少しは知っていないと逆に分かりづらいかもしれません。

※t検定(母分散が未知)においては、標本から母分散を推定した不偏分散を出して使います。そして、それをサンプルサイズで割ったものが、標本平均の分散になります。このような過程はわかりづらいですが、「統計学がわかる (ハンバーガー統計))」では図示されていて大変わかりやすいものでした。忘れてしまいがちですが、これをしっかり理解しながら本書「よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」を読んでいただければ、検定をしっかり理解できるでしょう。信頼区間の話に関しても同様です。

※次で紹介する「心理統計学の基礎―統合的理解のために 」は多くのサイトで入門書として紹介されていますが、この本は「心理統計学の基礎―統合的理解のために」をしっかり著者が読んだ上で、「心理統計学の基礎―統合的理解のために」と少し差異が出るように書かれています。レベル的には、「よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」<「心理統計学の基礎―統合的理解のために」です。

 

以下の2冊は、今までの範囲の発展編とも言える内容です。なので、これより先に統計学に必要な数学を簡単なものから勉強できる本と、実際にR言語というものを用いてデータ分析しながら勉強できる本をやると良いかと思われます。発展的な内容を数式に頼りすぎず紹介しているので、少し数学や長文に免疫がある方なら、かなり有益で効率的に読める事かと思われますが、そうでない方は後回しにした方が、後々効率よく勉強できるのでいいでしょう。

心理統計学の基礎―統合的理解のために (有斐閣アルマ)

よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」で、だいぶ基礎知識をつけることができたでしょう。しかし、まだ足りないと感じる方の方が多いのが現状です。ここからは、若干の数学も交えた本やR言語を用いて実習するのもありかもしれませんが、個人的にはこの名著も読んでいただきたいなと思います。

この本を読むと、ワンランクレベルアップできるのでおすすめです。というのは、一つ前に紹介した「よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」の内容を含んでいる上に、信頼性と妥当性の話、回帰分析や因子分析、発展モデルである共分散構造分析まで取り上げられているからです。また、他の統計学書籍に載ってないが知っておくべきことについても、しっかり言及できていて素晴らしく、今までに生じた「なぜ?」という疑問を解消してくれます。

読んでいただきたいと最初に述べましたが、正直なところ統計学の勉強には必須の本だと思っています。(しかし、差し当たっては覚えておいても仕方ない知識も多く、かつ文量も多いので、他の本と並列して用いて長期的に読んでいくのが好ましいです。)

よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」を読んだ方はお分かりだと思いますが、この本の中で南風原さんの「心理統計学の基礎―統合的理解のために (有斐閣アルマ)」をなんども引き合いに出していました。そして、巻末では次にやるべき本として推薦されていました。

統計学がわかる (ファーストブック)」、「よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」が気に入った方はこちらも必ずや気にいるでしょう。ですが、個人的に気になったのは、少し分量が多い点と内容が一部難しく感じた点です。数式(式変形とかではなく)の理解が少し大変なんです。でも、この対策も僕はバッチリ考えました。それが、次で紹介する「心理統計学ワークブック―理解の確認と深化のために」です。

ちなみに、ここまで紹介した主な三書の包括関係は以下に示す図のようになっています。参考程度にご覧ください。

三書の包括関係

三書の包括関係

 

心理統計学ワークブック―理解の確認と深化のために

この本も南風原さんが書いた本です。タイトルの通り問題演習用の本です。しかし、数学初心者でもわかるようにしっかりした解説付きですので、着実に演習を通して基礎統計から共分散構造分析まで理解できます。

内容に関してですが、先ほど紹介した「心理統計学の基礎―統合的理解のために (有斐閣アルマ)」用の演習本なので、内容を補完しつつ、演習を通して理解を手助けしてくれるでしょう。

ここまでで統計学の基礎への入門は果たせたといえるでしょう。ですので、次にやることとしては、数学をかじりながら統計学を学んでいく、Rを用いて今までやってきたことをプログラムできるようにする(感覚的にできるので難しくない)、Rを用いながら少し高度な統計学を理解していく、などが挙げられます。

R言語を用いた統計学勉強方法・基礎編

ここからRも踏まえとの勉強方法となります。そもそも統計学を学んでいて、RもしくはPythonを使わないのはナンセンスです。なんのために勉強しているのか分かりません。Excelを使いたい人もいるかもしれませんが、あまり効率的なものではありません。

また、R・Pythonを使ってデータ・グラフを可視化すれば、格段に難しい概念の理解が捗ります。「専門書を読んで理解できなかった概念も驚くほどに、理解できた!」なんてことも多々出てきます。また、これらを用いることで、統計学の知識を用いてデータ分析ができるようになり、実務・研究において役立つことでしょう。

Rによるやさしい統計学

先ほど、「よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」のところで少し紹介していた本ですが、R言語を学ぶならまずはこの本です。Rを使う方なら大体の方が持っているど定番書籍です。

初心者向けの本で、R言語と統計学についてバランスよく学ぶことができます。本書の基本編の範囲は、主に検定ですが、応用編では、簡単な回帰分析、因子分析、共分散構造分析などが出てきます。加えて、応用編では、検定力分析なども取り扱っていたので、「よくわかる心理統計 (やわらかアカデミズム・わかるシリーズ)」のコラム8などと合わせて読むと面白いでしょう。

Rによる統計解析

Rによるやさしい統計学と代替可能な本ですが、こちらは少し硬派な本です。Rによるやさしい統計学より、基礎的な分析、多変量解析の解説が詳しいので非常に重宝しています。また、著者は非常に有名な方で、R言語を用いた統計解析といったら必ず名前が上がります。

統計学に必要な数学の基礎を身につけられる本・参考書

今まで紹介してきた本は、数式は使うためだけに載っていました。大半の人にとっては、正直それで充分でしょう。しかし、より高度な統計を理解するには、数学は避けては通れません。

また、とは言っても急に難しい数学が出てきては、勉強も何もあったもんではありませんよね?そこで、簡単なレベルの数学を使って統計を勉強できる本から順にここでは紹介していきたいと思います。

※前提として、基礎的な微分積分・線形代数の知識を必要とします。

基本的には、統計学に必要な基礎知識を数式展開を行いながら学べる構成になっています。

今までおざなりになっていた、確率密度、モーメントボ関数、周辺確率密度、正規分布、大数の法則、中心極限定理、t分布、F分布、不偏推定量、有意水準、カイ二乗分布などなど、確率と統計における少し専門的な内容が飛び込んできますが、解説が尋常ではなく丁寧(図や数式の展開ごとに詳しい解説がある)なので不思議と理解できます。

そして、これらを理解すると、今までただ見てきただけの統計学の入門書にある数式の意味がわかるようになってきます。そして、難しい本を読んでいくにあたっての導入ともなるでしょう。

簡単な数学と言われても不安な方もいるでしょうが、重積分の簡単な計算ができる方は、問題なく取り組み始めることができます。

(随時更新、しばしお待ちを)

おわりに

すぐに書き足しますので、しばらくお待ちください。ご迷惑をおかけします。

-統計学

おすすめ記事

giftcard 1
Amazonのギフトカードが格安で買えるサービスが発足!密林での買い物がよりお得に!

最近始まったギフトカードの個人間取引ができるサービス「ギフル」ってご存知ですか? ...

71-iFIHKV6L._SL1500_ 2
【Aukey PL-WD06】スマートフォン用カメラレンズなら旅行で風景写真が綺麗にとれる!

いい写真を撮りたくて、一眼レフやコンデジを買いたいと思う方は多いでしょう。しかし ...

StockSnap / Pixabay 3
【在宅ワーク】在宅で記事を書くライターになり1文字1円以上の収入を得る方法

最近、文章を書く力・文章構成力にオシャレさを見出してきました。 文章を書くのにも ...

2 4
初心者のためのWebデザイン独学の方法と参考書を現役エンジニアに聞いてみた

今回は、htmlとcssといったWebデザインに関してどうやって学べば良いかを、 ...