통계란,
어느 집단에 대한
경향이나 특징을 알기 위해
관측하거나 조사하거나 실험한 결과를
숫자나 문자(이것을 자료나 데이터라 한다.)로 정리한 것이다.
아래 그림에서 3번 과정을 통계라고 할 수 있다.
통계에서는 자료의 특징을 수로 표현해야 하는데
자료 전체의 특징을 대표적으로 나타내는 값을
대푯값이라고 한다.
대푯값에는
평균, 중앙값, 최빈값과 같이
여러 가지가 있으나
평균이 가장 많이 쓰인다.
평균은
변량의 총합을 변량의 개수로
나눈 것이다.
다르게 말하면 평균은
자료의 값을 평평하게 고른 값이다.
위의 자료의 평균은 (10+12+17)/3 = 13이다.
A의 변량의 경우 평균보다 값이 3 작고
B의 변량은 평균보다 값이 4 많고
C의 변량은 평균보다 값이 1 작다.
이와 같이 변량과 평균의 차를
편차라고 한다.
편차 = 변량 -평균
A, B, C의 편차는 각각
-3, +4, -1 이므로
편차의 합=0 이라는 것을
알 수 있다.
대표값으로 평균이 제일 유명하고 많이 쓰이지만
평균을 대푯값으로 쓰기
적절하지 않은 상황이 있다.
아래 오래 매달리기 시간 자료를 살펴보자.
오래 매달리기 시간 평균을 구하면
16초이다.
위의 7개의 기록 중 6개는
16초보다 기록이 낮고
1개는 16초보다 기록이 너무 높다.
즉, 16초라는 평균은
위의 오래 매달리기 자료를 대표한다고 보기
어렵다.
이와 같이 변량 중에서 매우 크거나
매우 작은 값이 있는 경우에
평균은 극단적인 값에 영향을 크게 받는다.
이런 경우에는 변량을 작은 값부터
크기순으로 나열한 다음 중앙에 있는 값,
여기서는 9초를 대푯값으로 사용하는 것이
적절하다.
이처럼 변량을 작은 값부터
크기순으로 나열할 때,
중앙에 놓인 값을 중앙값이라고 한다.
중앙값을 구할 때
변량의 개수가 홀수일 때는 가운데 값이
중앙값이고
변량의 개수가 짝수일 때는
가운데 놓이는 값이 2개이므로
그 두 값의 가운데 값!
즉, 그 두 값의 평균을 중앙값으로 한다.
또 다른 대푯값으로는 최빈값이 있다.
여러분이 신발가게 사장님이라고 하자.
신발 사이즈를 대표할 수 있는 값은
평균, 중앙값이 아닌
가장 많이 팔린 신발 사이즈일 것이다.
이처럼 변량 중 가장 많이 나타나는 값을
그 자료의 최빈값이라고 한다.
대푯값 중 평균, 중앙값은
하나로 정해지지만
최빈값은 자료에 따라 두 개 이상일 수도 있다.
1, 2, 1, 2, 3, 4, 5 변량에서
최빈값은 1,2로 총 2개이다.
대푯값의 개념은 통계에서
가장 이해하기 쉬운 개념이다.
대푯값을 확실히 이해했다면
다음 시간에는
자료의 분포상태를 알아볼 수 있는
산포도에 대해서 공부해보자!
'수학 이야기 > 중3수학' 카테고리의 다른 글
[중학교 3학년 수학 영역별 복습]함수(이차함수) (0) | 2023.02.01 |
---|---|
[통계]산포도(분산, 표준편차, 평균편차) 개념설명 (0) | 2022.10.13 |