Statistics 통계

  • The science of collecting, analyzing, interpreting, and presenting data.
  • 데이터를 수집, 분석, 해석, 그리고 표현하는 학문입니다.

Measures of Central Tendency and Spread

  1. Mean 평균
    • The sum of all data values divided by the number of values.
    • 데이터 값의 합을 데이터 개수로 나눈 값입니다.
  2. Median 중앙값
    • The middle value of a data set when arranged in order.
    • 데이터를 크기 순으로 배열했을 때 중간에 위치한 값입니다.
  3. Mode 최빈값
    • The most frequently occurring value in a data set.
    • 데이터에서 가장 자주 나타나는 값입니다.
  4. Range 범위
    • The difference between the largest and smallest values in a data set.
    • 데이터 집합에서 가장 큰 값과 가장 작은 값의 차이입니다.
  5. Variance 분산
    • A measure of how far each value in a data set is from the mean.
    • 데이터 집합의 값들이 평균으로부터 얼마나 떨어져 있는지를 나타내는 지표입니다.
  6. Standard Deviation 표준편차
    • The square root of the variance; it measures the dispersion of a data set.
    • 분산의 제곱근으로, 데이터 집합의 흩어짐 정도를 측정합니다.

Question: 문제:
The following data shows the time students in Rick's class spent watching TV over the weekend. If the average viewing time is hours, what is the sum of the median and the mode?
다음은 지효네 반 학생 명이 주말동안 TV를 시청한 시간을 조사하여 나타낸 자료이다. TV를 시청한 시간의 평균이 시간일 때, 중앙값과 최빈값의 합을 구하시오.
Explanation: 해설:
Since the average is hours, Arranging the data in ascending order: The sum of the median and the mode is: 평균이 시간이므로 오름차순으로 정리하면, 중앙값 최빈값
Question: 문제: The following data shows the time 10 students in Rick's class spent watching TV over the weekend. If the average viewing time is 8.3 hours, what is the sum of the median and the mode? '' 다음은 지효네 반 학생 10명이 주말동안 TV를 시청한 시간을 조사하여 나타낸 자료이다. TV를 시청한 시간의 평균이 8.3시간일 때, 중앙값과 최빈값의 합을 구하시오. '' Explanation: 해설: Since the average is 8.3 hours,(x+73)/(10)=8.3,quad x=10Arranging the data in ascending order:[5,6,7,7,8,9,10,10,10,11]The sum of the median and the mode is:(8+9)/(2)+10=8.5+10=18.5 평균이 8.3시간이므로 (x+73)/(10)=8.3,quad x=10오름차순으로 정리하면, [5,6,7,7,8,9,10,10,10,11]중앙값 + 최빈값 =(8+9)/(2)+10=8.5+10=18.5

Data Analysis

  1. Confidence Interval 신뢰 구간
    • A range of values within which a population parameter is expected to lie with a certain level of confidence.
    • 특정 신뢰 수준에서 모집단 모수가 속할 것으로 예상되는 값의 범위입니다.
  2. Confidence Level 신뢰 수준
    • The probability that the confidence interval contains the true population parameter.
    • 신뢰 구간이 실제 모집단 모수를 포함할 확률입니다.
  3. Population 모집단
    • The entire group of individuals or objects being studied.
    • 연구의 대상이 되는 모든 개인이나 객체의 전체 집합입니다.
  4. Sample 표본
    • A subset of the population used to represent the whole.
    • 모집단을 대표하기 위해 선택된 부분 집합입니다.
  5. Standard Error 표준 오차
    • The standard deviation of the sampling distribution of a statistic.
    • 통계량의 표본 분포의 표준편차입니다.

Question: 문제:
A population follows a normal distribution with a variance of . A random sample of size is taken to estimate the population mean with a confidence interval given by . Find the minimum value of such that . (Given: ) 분산이 인 정규분포를 따르는 모집단에서 크기가 인 표본을 임의추출하여 모평균 을 신뢰도 로 추정한 신뢰구간이 이다. 이때 를 만족시키는 의 최솟값을 구하시오. (단,
Explanation: 해설:
Question: 문제: A population follows a normal distribution with a variance of 16. A random sample of size n is taken to estimate the population mean m with a 99% confidence interval given by a <= m <= b. Find the minimum value of n such that b-a <= 5. (Given: "P"(|Z| <= 2.58)=0.99) 분산이 16인 정규분포를 따르는 모집단에서 크기가 n인 표본을 임의추출하여 모평균 m을 신뢰도 99%로 추정한 신뢰구간이 a <= m <= b이다. 이때 b-a <= 5를 만족시키는 n의 최솟값을 구하시오. (단, "P"(|Z| <= 2.58)=0.99) Explanation: 해설: {:[2xx2.58 xx(4)/(sqrtn) <= 5],[sqrtn <= 4.13 cdots],[n <= 17.0404],[n=18]:} {:[2xx2.58 xx(4)/(sqrtn) <= 5],[sqrtn <= 4.13 cdots],[n <= 17.0404],[n=18]:}