1.1 통계학이란?
통계학은 모집단의 특성을 파악하기 위해 모집단으로부터 일부의 자료를 수집, 정리, 요약, 분석하여 표본의 특성을 파악하고 이를 이용하여 모집단의 특성에 대해 추론하는 원리와 방법을 제공하는 학문이다. 사실 데이터 분석의 가장 기초, 기본이 되는 학문이다.
위 개념은 일차적으로 두가지로 나뉘어 진다. 기술 통계학과 추론 통계학이다.
기술 통계학: 수집된 자료의 특성을 쉽게 파악할 수 있도록 자료를 표나 그림 또는 특성값 등을 통하여 정리, 요약하는 방법을 다루는 분야
추론 통계학: 모집단으로부터 추출된 표본의 정보를 사용하여 모집단의 특성을 파악하는 분야이다.
방법론적인 측면에서는 연역적 방법과 귀납적 방법으로 구분되다.
연역적 방법: 모집단 정보를 이용하여 모집단으로부터 추출된 표본의 특성을 파악하는 방법이다.
귀납적 방법: 표본의 정보를 이용하여 모집단의 특성을 파악하는 방법이다.
1.2 통계학의 실질적인 문제
그렇다면 실생활에서 어떻게 통계가 사용되는가. 이는 각 분야의 사례를 통해서 살펴볼 수 있다. 시장조사분야에서 각 브랜드의 담배를 선호하는 흡연자들의 비율 추정, 산업분야에서 구매된 물건들과 생산된 물건들 간 불량률 차이의 추정 등이 있다. 이 두가지는 모두 표본 조사를 통해 정보를 획득하여 모집단 전체의 특성을 파악할 수 있다.
1.3 모집단과 표본
모집단은 연구대상이 되는 모든 가능한 관측값이나 측정값의 전체 집합이다. 모집단의 특성을 나타내는 미지수를 모수라고 하고 모평균, 모표준편차, 모비율 등이 있다. 모집단은 알려져 있지 않고 완전하게 구성되어 있지 않다. 모집단을 조사하는 것은 얻을 수 있는 정보에 비해 시간과 비용 측면에서 비효율적이기 때문이다. 이 경우 표본을 일부 추출하여 모집단의 특성을 추정해보는 것이 더 효율적이다.
표본은 모집단 전체의 특성을 파악하기 위하여 모집단으로부터 추출된 일부분이다. 표본의 특성을 나타내는 변수를 통계량이라고 하고 표본평균, 표본표준편차, 표본비율 등이 있다.