放送大学全科目感想 011 統計学(’19)

  • 情報コース
  • ラジオ科目
  • 藤井良宜先生(宮崎大学教授)
  • 難易度 ★★★★☆
  • おすすめ度 ★★★☆☆

統計教育について研究している教授による統計学。数式をできるだけ少なくして、概念を掴んでもらうことを重視したという。扱う範囲は広範でそれなりに高度であるため、各分野を詰めていこうとすると結局それなりに数学が必要になる。数式が苦手な人にとってはそれなりに出てくる数式にひるみ、数学が好きな人にとっては物足りない授業になっているように感じる。

第1回

数Iの統計の復習をしつつ、統計学が何を目的とするのかを説明している。全体的な話が多くふわっとしていてびっくりするようなことはあまりないんだけど、どうも今後確率が重要になってくるらしい。個人的には数学的な内容を濃い目でやってほしい。

第2回

高校の確率論の復習。大学では全事象をΩで表すこと、∩はハット、∪はカップと読むことを覚えた。非常にやさしい解説で、初学者に良い。統計学的には、確率モデルをいかに作るべきかが大事、そしてモデルはあくまでもモデルであることを意識しないといけないことが大事のようだ。

第3回

確率分布について。数Bの確率論に加えて一部、積分表示の累積確率密度関数も扱う。さすがに印刷教材がないと苦しくなってきた。後半戦の離散型確率関数の平均や分散の考え方は何とか理解できた。できるだけわかりやすく説明してくださっており助かる。独立事象だと分散は和をとっても良いというのは忘れていた。式を使って証明してみたいものだ。

第4回

二項分布。最初の分布のところまでは、確か正規分布に近い形、真ん中の膨らんだ形になるんだなってとこまではイメージできたけど、信頼区間のあたりでだいぶついていけなくなった。この節で一番大事な式は E(X) = np かな。

第5回

多項分布モデル。変数の種類が多いと種類数の階乗で場合の数がかかってくるので、一気に分母が大きくなり、大変な計算量になることが分かった。あとχ二乗検定は独立か否かを調べる指数であること、帰無仮説→棄却の流れは、背理法に近いことがわかった。統計でもある関係が成り立つことを証明するのは難しいから、無いことを否定するって手法になるんだろうな。

第6回

ポアソン分布モデル。λとeの-λ乗を使って偶然発生する事象をモデル化する。二項分布を分割し、極限を取るとポアソン分布になる。つまり無限に細かい二項分布ってわけ。定義より平均はちょうどλ、分散はλ/nになる。わかりやすいね。

第7回

正規分布モデル。いままでのモデルがどれも離散的な値を取り扱うのに対して、正規分布は連続的な値を扱う(そうだったのか)。あれ、じゃあ試験の点数って離散的だから正規分布よりポアソン分布モデルの方がいいんじゃ。。?まあ仮定的に正規分布に従うってことでいいのかな。しかしいままでいろんな試験の点数分布を見てきたけど、正規分布には全然従ってないですよね。だから偏差値ってあくまで参考程度で、あんまりあてにならないのかもしれない。特に外れ値の場合なんかはそう。

第8回

正規分布モデルでの統計的推測。正直、ラジオ音声では片側検定・両側検定のところ以外ほとんどわからず。印刷教材で復習が必要。たぶん、標本が正規分布に従うと仮定して、そこから平均・分散を推定する際に、得られた値が妥当かどうかをカイ二乗検定を使って調べる、ってことなんだろうけど。。

第9回

正規分布モデル間の群間の比較について。t検定とは、複数の群間の平均に違いがあるかどうか調べること。結局それだけのことについていろんな式をごちゃごちゃやって、有意水準5%に達してるかどうかを見てるだけってことでいいのかな。エクセルだったら関数一発の所を、できるだけ数学的に正確に知りたい気持ちはあるが、大変そうだ。

第10回

回帰分析。ようやく馴染みのある話題になった。相関があるからと言って因果関係があるわけではないという有名な話も出てきた。平方和の偏微分=0を解くって書くんだったらせめて印刷教材では式を最後まで書いてほしいなー。すっきりしない。

第11回

重回帰分析。2以上の変数を使って統計を説明すること。モデルが複雑になればなるほど、いろんな罠が待ち受けている(多重共線性とか)。寄与率ってのは見かけだましの値にあることも多い。だいたい君はただの相関係数の二乗だ。相変わらず偏微分=0のところは参考文献参照と言って飛ばしている。本当の所、そこが知りたい。

第12回

モデル選択の話。変数増減法はコンピュータの発展で採用できるようになったが、手動だと単純に計算が無理に思える。最尤法も、素直な方法に見えるが、これを発展させたAICは、係数に2がついているところが全然意味わからん。

第13回

ロジスティック回帰分析。確率自体が変数によって変化する場合のグラフを考えるんだけど、式の形を見ても直観的にグラフの形が浮かんでこない。なんじゃこりゃ。0/1で表される二値の統計量に対して、Y=0である確率、=1である確率をlog(もしくはeの何乗か)を使って表すことができる、というところまではわかったが、、

第14回

主成分分析と因子分析。主成分分析は各変数の統計量への説明の度合いを按分してできるだけ少ない成分で統計量を説明できるようにすること。因子分析は、各変数の背景となる因子を定義して、各変数を因子を使って表現すること。似ているようで、発想が全然違うということが分かった。

第15回

全体の復習。本講義は数学的な説明をなるべく少なくして、概念を掴んでもらうことに重きを置いたという。でもテキストを見る限りだと、数式が中途半端に出現し、文系の人はつらくなるし、私のような人にはもうすこし厳密に話をしてほしいなあという感じがする。

コメントを残す

メールアドレスが公開されることはありません。