- 次回:#2 確率分布(確率関数)
【数学】Fwd:ほぼゼロから学び直す高校数学 #2>確率分布(確率関数) - 音ゲー、fps、DTM、プログラミング雑記置き場
本記事の注意点
- 筆者は統計学も大学の応用数学もまじめに専攻してません!
- 自分が理解するためにかみ砕いた記事の為語弊もあります。
- 各単語や公式の成り立ちや背景にフォーカスをあてて書いているので、
この記事を読んで○○が解けるとかはないです。- 参考書というよりはエッセー感覚で読んでいただけると幸いです。
単語のおさらい
分散と標準偏差の関係
分散がある母集団のデータのばらつきを示すなら、標準偏差なんて指標いらないのでは?
- 分散を算出する際の兼ね合いで標準偏差を使用せざるを得なくなる
分散も平均と同じように各データの偏差をデータ数で割ればデータ全体の 指標(=分散)が求められそう
- ただ偏差は平均に対してのプラスマイナスの値なのですべて足し合わせると0に収束してしまう
- そうなると計算式(2)の分子が0となり、結果分散も0なり指標として使用できない
- 偏差がすべてマイナス、プラスというケースはありえず、もしそうなるなら
平均自体が下がるか上がるはず。 - 平均に対しプラスorマイナスが混在することで初めて
データのばらつき(分散)という概念が生まれる
そのため、分散をべき乗ベースで考えれば正負がなくなるので有用な値が取得できる
以下、分散(標準偏差)を求める式
- (2)で分かるように分散も平均と同じように各データの偏差を
求めて、その和をデータ数nで割っている
- (2)で分かるように分散も平均と同じように各データの偏差を
(1),(2)が分散、(3)が標準偏差の算出式
よくきく偏差値の式を考えてみる
- 上記の式がイメージしづらいから百分率の計算と照らし合わせる
- MAX=500、MIN=0の250というデータを%表現する際を考える
- 下記式だと250:実値、500:全量、100:百分率に落とし込む重みづけの定数
偏差値の式(4)に当てはまると、
- :特定データの偏差(実値)
- :全データを加味した偏差(全量)
- :標準偏差10に固定するための重みづけの定数
式(4)の最後の
+50
は何してるの?- 偏差値の対象のある母集団の平均点が50になる場合を考える
- 当然、すべて同じ値なら各データの偏差も0になる
- となり (6)より
+50
が必要なのがイメージしやすい
- となり (6)より
あとがき
- 分散の2乗の値でも有効に使用できるケースがあるらしい(確率関数絡み)
- だから、本文にかいてある分散の値は有用でないみたいな書き方してるのでだいぶ語弊あり
- 高校時代は数学の定義は暗記でゴリ押しして、大学数学で無事撃沈した
- 数学の数式は定義以外は証明(導出)できるので、
結果でなくプロセスに焦点をあてて学習すべきと今更反省
- 数学の数式は定義以外は証明(導出)できるので、
- というか高校で分散とか確率分布とかやった記憶がない
6/20 追記(有識者の知人のフィードバック反映)
- 連続した値など一意に値を出せない>身長:170.3333みたいになる
- 実験等では平均±標準偏差で使用するデータで扱う
(1回だけの試行データを結果として扱うべきでない)
- 実験等では平均±標準偏差で使用するデータで扱う
- 偏差をすべて足したら0になる問題、絶対値でもいけるけどべき乗のが計算の都合がいいからってだけらしい
参考サイト
書き文字をLaTex記法に変換してくれるWebサービス [https://webdemo.myscript.com/views/math/index.html:title]
上記記事のサイトを知った記事+はてなブログにおけるTex記法のチートシートを紹介してくれている記事 shizenkarasuzon.hatenablog.com
はてなブログとLaTex記法の微妙な差異を説明してくれている記事
- 自分は添え字のハイフンに半角スペースの処置でインライン数式が表示してくれるようになった 7shi.hateblo.jp