원문 보기: https://dawoum.duckdns.org/wiki/정규분포
이항분포에서, 독립사건의 실험 횟수가 커짐에 따라, 그의 분포가 종 모양으로 바뀜을 볼 수 있습니다. 그 외에도 많은 사회 현상 또는 과학 현상에서 데이터가 많아짐에 따라, 그의 분포가 종 모양을 띄는 경우가 많습니다.
비록 이항분포는 확률변수의 값이 유한 개를 다룰지라도, 연속확률변수는 무한 개의 확률변수의 값을 다룹니다. 게다가, 확률변수가 가질 수 있는 값이 알려져 있지 않기 때문에, 모든 구간을 포함하는 구간 \([-\infty, \infty]\)에 대해 정의가 되어야 하고, 구간 안에서 정적분 값(이산확률 분포에서 모든 확률의 합)은 1이어야 합니다. 이런 조건에 부합되는 대표적인 분포가 정규분포(Normal distribution)입니다.
정규분포 곡선은 연속확률분포 \(X\)가 모든 실수 값을 취하고, 평균과 분산에 따라, 그 확률밀도함수가 \(f(x)\)가 종 모양을 갖는 함수로 정의됩니다.
\(\quad\)\(\displaystyle f(x) = \frac{1}{\sqrt{2\pi\sigma^2} } e^{ -\frac{(x-m)^2}{2\sigma^2} }\)
여기서
- \(e=2.71828\cdots\)는 오일러-마르케로니 상수입니다.
- \(m\)은 분포의 평균(mean) 또는 기댓값(expectation) (그리고 역시 그의 중앙값(median) 및 최빈값(mode))입니다.
- \(\sigma\)는 표준 편차(standard deviation)입니다. 그리고
- \(\sigma^2\)은 분산(variance)입니다.
한편, 확률밀도함수가 조금 복잡하기 때문에, 보다 간편한 기호로, 다음과 같이 나타냅니다.
\(\quad\)\(N(m, \sigma^2)\)
정규분포곡선의 성질
정규분포의 그래프는
- 기댓값, \(x=m\)에 대해 대칭인 종 모양의 곡선입니다.
- \(x\)-축이 점근선입니다.
- \(x\)-축 위에 그려지고, 곡선과 \(x\)-축 사이의 넓이는 1입니다.
- 표준편차, \(\sigma\)에 따라 그의 폭이 결정됩니다.
이때, 전체의 정적분 값이 1로 정해져 있기 때문에,
- 표준편차가 클수록 중심에서 낮고 펑퍼짐한 종 모양이 됩니다.
- 표준편차가 작을수록 중심에서 높고 뾰족한 종 모양이 됩니다.
한편, 분산이 같고, 평균이 변하면, 그래프의 모양은 동일하고, 대칭축이 평행이동한 모양이 됩니다.
댓글
댓글 쓰기