UoPeopleでIntroduction to Statistics(統計学入門)を修了した
オンライン大学 University of the People でIntroduction to Statistics (MATH1280) を修了したのでその感想を書きます。
これまでのUoPeople関連の記事はこちら:
UoPeople カテゴリーの記事一覧 - えんぴつぶろぐ
はじめに
Rを使いながら記述統計学と推計統計学の基礎を学ぶコースです。
言葉の定義や概念をきちんと確認しつつ、Rを使って様々な演習をこなし、Discussion課題で実世界の事例に適用する…といったバランスの取れた構成になっていて良いコースでした。
↓のようにつぶやきましたが、MATHコースの割に計算はほぼRを使うので数式は簡単な公式を覚えるくらいでOKでした。
また、必修コースのせいかプログラミングに不慣れな学生も多いため、Rのセットアップや使い方については手厚いサポートがありました。
ようやく今週分のテキストを読み始めましたが今回は確率分布の話でポアソン分布のだの指数分布だのでめちゃめちゃ数式が出てきて白目。#MATH1280 #UoPeople
— えんぴつ (@empitsu88) 2021年5月11日
学ぶ内容
- 記述統計学、確率・推計統計学の違い
- 母数、パラメーター、統計量
- 度数、相対度数、累積相対度数
- 平均、中央値、分散、偏差、パーセンタイル、四分位範囲、外れ値
- 確率変数、標本空間、期待値、確率
- 母平均と標本平均、母分散と標本分散の違い
- 離散型確率分布:二項分布とポワソン分布
- 連続型確率分布:一様分布と指数分布
- 確率密度関数
- 正規分布、標準正規分布、正規近似
- サンプリング分布
課題について
Assignment
Assignment(他のコースで言うWritten Assignmentに相当する)は隔週なので課題の量はそこまで多くないと思います。
問題数が多くて面くらいますが、簡単な計算問題や語彙の確認がほとんどです。
また、あるUnitのAssignmentで、Rでなく手計算で求めることが必須の問題があったので注意してください。
Rと手計算で結果が変わります。
指示には「Rを使わないで自分で計算してね!」と書いてあるのですがわかりづらいので、その週のCourse Forumは「Official Solution間違ってるでしょ!?」と書き込む生徒が続出していました…。
Self-Quiz
いつもテキストをざっとしか読んでない状態でSelf-Quizに臨んでいたので初回は全然わからず量も多く、毎回泣きながら解いていました。
ですが人間不思議なもので何度も同じような問題を解かされるのでだんだん覚えてきます。
計算は基本的にRを使いますが、mean()やsd()、var() などの関数を使わずに平均や標準偏差を算出することを求める(度数分布表や確率分布表のみが提示されているなど)問題が多いので、平均や分散を求める様々な方法をおさえておきましょう。
Discussion Assignment
とある分布を使用する事例を挙げるとか、実世界の課題を統計学的に考えた時にどう考えますかみたいな問が多いです。
私は毎週水曜日夜や木曜日ギリギリに投稿していたせいか、雑に書いても10点をもらえることが多かったです。
ただこのコースでも、例を挙げるだけでなく自分でシミュレーションしてRコマンドとヒストグラムも貼るようなガチ勢は若干名いました。
(↓はUnit8だけガチ勢として参加したときのツイート)
うーん今週の統計学、また面倒な課題だ!と思いつつ自分でランダムサンプリングについてRでシミュレーションしてヒストグラム作って各用語についてもわかりやすい例を交えつつ説明したがそんなことしてるのクラスに2人くらいしかおらんかったの巻😇#MATH1280 #UoPeople
— えんぴつ (@empitsu88) 2021年6月3日
Learning Journal
Learning Journalは振り返り+簡単な演習の形式が多かったです。
私のインストラクターは、Rのコマンドと出力を貼らないと減点してくる方だったので、とにかく試したコマンド(テキストやSelf-Quizと全く同じやつ)や学んだことのSummaryを貼りまくったら満点をくれました。
Graded QuizとFinal Exam
Graded QuizがUnit3, Unit6、そしてUnit8と3回もあります。
ですがSelf-Quizの数値違いのような問題が多いです。
Final ExamはSelf-Quizにはない問題が多かったですが、Self-Quizをちゃんと理解していれば解けそう問題でした。
スコアはGraded QuizとFinal Examの比重がかなり高いので、とにかく手を動かしてRの演習をこなしSelf-Quizを理解するのが大切かと思います。
Discussion AssignmentとAssignmentのGrading Weightsはそれぞれたった5%でした…。
役立ったもの
Annotated bookとNote
コースではテキストのAnnotated bookとNoteが配布されます。
Annotated bookは「ここが大事!」とか「ここの数式は覚えなくていい」とか書かれているので基本的にはこっちのテキストを見ておいたほうが効率的かもしれません。
Noteは結局最後までほとんど見ませんでしたが、テキストをまとめ直したり様々なRのサンプルコードが載っているので理解を深めるのに役立ちそうです。
完全独習 統計学入門
このコース受講中にちょうどDMMブックスの70%オフセールがやっていたので参考書として買いました。
「超入門書」と銘打っているため、敢えて確率について触れない方針の本だそうです。
標準偏差や平均を算出する様々な方法やサンプリング分布について易しく解説されていました。
統計WEB
確率分布(二項分布や指数分布など)についてはこちらのサイトがわかりやすく解説しておりお世話になりました。
データ分析のための統計学入門
Twitterでシェアしてくれた方がいたのですが、「データ分析のための統計学入門」の日本語訳がなんと無料で公開されており、こちらも役立ちそうです。
私は余裕がなくてまったく見れなかったのですが、
目次を見る限りUoPeopleのコースは第4章あたりまでの内容となります。
アメリカのデータサイエンティストが書いた「データ分析のための統計学入門」の日本語訳が、訳者である東大の国友先生のホームページで無料公開されています。
— 上原@外銀→投資家 (@uehara_sato4) 2021年4月9日
全418ページがすべて無料です。普通に有料の書籍なんですが、統計の基礎勉強はこのPDFで網羅できると思います。https://t.co/kMF0nHMScl pic.twitter.com/JQfzXuA0St
学習時間
学習に費やした時間は6〜10時間程度でした。
成績
今期とった3コース中、かけた時間は一番少なかったですが、Self-Quiz周回のおかげで幸いにもGraded QuizやFinal Examで満点がとれたのでA+が取れました。
これまでに受講したコース
ということで以下のコースが修了できました!
- ENGL0101 English Composition 1
- UNIV1001 Online Education Strategies
- CS1101 Programming Fundamentals
- CS1102 Programming1
- MATH1201 College Algebra
- MATH1302 Discrete Mathematics
- MATH1280 Introduction to Statistics ←今期取れたやつ
- CS1103 Programming2 ←今期取れたやつ
- CS2203 Databases ←今期取れたやつ
+前の大学から単位移行したコース