변량을 줄기와 잎으로 구분한다. 이때 줄기는 십의 자리 숫자, 잎은 일의 자리 숫자로 한다.
세로선을 긋고, 세로선의 왼쪽에 줄기를 작은 수부터 세로로 나열한다.
세로선의 오른쪽에 잎을 작은 수부터 일정한 간격을 두고 가로로 나열한다. 이때 중복되는 자료의 값은 중복된 횟수만큼 나열한다.
이와 같은 방법으로 그린 그림을 줄기와 잎 그림이라고 한다.
줄기와 잎 그림에서 줄기와 잎을 정할 때, 변량을 자릿수를 기준으로 두 부분으로 나누어 큰 자리의 숫자를 줄기로, 나머지 자리의 숫자를 잎으로 정하는 것이 일반적이다.
도수분포표
변량의 값의 범위가 크거나 변량의 수가 많은 자료는 줄기나 잎의 개수가 많아져 줄기와 잎 그림으로 나타내기 불편하다. 따라서 이러한 정보를 쉽게 알아보려면 수집한 자료를 목적에 맞게 정리할 필요가 있다.
다음은 윤성이네 학교 1학년 학생들의 키를 조사한 자료이다.
위 자료를 cm 부터 cm까지를 간격이 cm인 구간으로 나누고, 각 구간에 속하는 학생 수를 구하여 나타낸 것이다.
계급: cm 이상 cm 미만 등과 같이 변량을 일정한 간격으로 나눈 구간
계급의 크기: 구간의 너비
도수: 각 계급에 속하는 자료의 수를 그 계급의 도수라고 한다.
이와 같이 자료를 정리하여 계급과 도수로 나타낸 표를 도수분포표라고 한다.
한편 도수분포표에서 각 계급의 가운데 값을 그 계급의 계급값이라고 한다.
도수분포표에서 자료에 대한 분포의 특징을 잘 나타내기 위해서는 계급의 크기를 적절히 정해야 한다.
다음은 위 자료에서 계급의 크기를 cm로 하여 만든 도수분포표이다. 이와 같이 계급의 크기가 너무 크면 계급의 개수가 적어지므로 자료에 대한 분포의 특징을 알아보기 어렵다.
일반적으로 도수분포표를 만들 때는 계급의 크기는 같게 하고, 계급의 개수는 자료의 양에 따라 보통 개 정도로 한다.