나의 작은 valley

[통계학] 확률변수의 분산과 표준편차 본문

Math/통계학

[통계학] 확률변수의 분산과 표준편차

붕옥 아이젠 2022. 12. 22. 12:35
728x90

분산이란)

확률변수가 갖는 값들 각각이 평균에서 얼마나 떨어져있는지 확률분포를 고려하여 계산한 값.

즉 확률 변수가 평균에 가까울수록 편차가 작아지므로 분산은 작아지고, 멀리 떨어져있을수록 편차는 커지고 분산 또한 증가한다.

 

formula)

$$ Var(x) = E[(x-E(x))^2] $$

 

i.e)

i) E(x) = 0 x 0.64 + 1 x 0.32 + 2 x 0.04 = 0.4

 

ii) Var(x) = 0.16 x 0.64 + 0.36 * 0.32 + 2.56 * 0.04 

 

 

 

알아두면 좋은 formula)

 

o) E[aX+b] = aE[X] + b

o) E[aX+bY] = aE[X] +bE[Y]

o) Var(aX+b) = a^2Var(X)

o) Var(aX+bY) = a^2Var(X) + b^2Var(Y)

 

 

 

분산의 다른 표현)

$$ Var(x) = E[X^2]-(E[X]^2) $$

 

 

 

표본평균의 기댓값과 분산)

- 기댓값

$$ E(\bar{x}) = E[(x_{1}+x_{2}+...+x_{n})/n] = E[X_{1}/n] + ... + E[X_{n}/n] = \mu/n +...+ \mu/n = \mu $$

- 분산

$$ Var(\bar{x}) = \sigma ^2/n $$

cf) 지난 시간에 해본 100000개의 변수인 경우는 n = 100000인 경우와 동치이다. 분자가 점점 커질수록 시그마 제곱값은 상수이기에 분산은 0에 수렴해간다. 분산이 0이라는 의미는....

 

 

728x90
Comments