통계 - 자료의 정리와 해석
줄기와 잎 그림, 도수분포표
줄기와 잎 그림
나이, 키, 점수 등과 같이 자료를 수량으로 나타낸 것을 변량이라고 한다.
다음은 건우네 반 학생들의 수학 성적을 나타낸 자료이다.
학생들의 성적 분포 상태를 쉽게 알아볼 수 있도록 아래 순서에 따라 정리해 보자.
- 변량을 줄기와 잎으로 구분한다. 이때 줄기는 십의 자리 숫자, 잎은 일의 자리 숫자로 한다.
- 세로선을 긋고, 세로선의 왼쪽에 줄기를 작은 수부터 세로로 나열한다.
- 세로선의 오른쪽에 잎을 작은 수부터 일정한 간격을 두고 가로로 나열한다. 이때 중복되는 자료의 값은 중복된 횟수만큼 나열한다.
이와 같은 방법으로 그린 그림을 줄기와 잎 그림이라고 한다.
줄기와 잎 그림에서 줄기와 잎을 정할 때, 변량을 자릿수를 기준으로 두 부분으로 나누어 큰 자리의 숫자를 줄기로, 나머지 자리의 숫자를 잎으로 정하는 것이 일반적이다.
도수분포표
변량의 값의 범위가 크거나 변량의 수가 많은 자료는 줄기나 잎의 개수가 많아져 줄기와 잎 그림으로 나타내기 불편하다. 따라서 이러한 정보를 쉽게 알아보려면 수집한 자료를 목적에 맞게 정리할 필요가 있다.
다음은 윤성이네 학교 1학년 학생들의 키를 조사한 자료이다.
위 자료를
cm 부터
cm까지를 간격이
cm인 구간으로 나누고, 각 구간에 속하는 학생 수를 구하여 나타낸 것이다.
- 계급:
cm 이상 cm 미만 등과 같이 변량을 일정한 간격으로 나눈 구간 - 계급의 크기: 구간의 너비
- 도수: 각 계급에 속하는 자료의 수를 그 계급의 도수라고 한다.
이와 같이 자료를 정리하여 계급과 도수로 나타낸 표를 도수분포표라고 한다.
한편 도수분포표에서 각 계급의 가운데 값을 그 계급의 계급값이라고 한다.
한편 도수분포표에서 각 계급의 가운데 값을 그 계급의 계급값이라고 한다.
도수분포표에서 자료에 대한 분포의 특징을 잘 나타내기 위해서는 계급의 크기를 적절히 정해야 한다.
다음은 위 자료에서 계급의 크기를 cm로 하여 만든 도수분포표이다. 이와 같이 계급의 크기가 너무 크면 계급의 개수가 적어지므로 자료에 대한 분포의 특징을 알아보기 어렵다.
다음은 위 자료에서 계급의 크기를
일반적으로 도수분포표를 만들 때는 계급의 크기는 같게 하고, 계급의 개수는 자료의 양에 따라 보통
개 정도로 한다.
1 / 3