기술통계(Descriptive Statistics)와 추론통계(Inferential Statistics)
기술통계(Descriptive Statistics)와 추론통계(Inferential Statistics)는 통계학에서 중요한 개념 중 하나입니다. 이 두 가지는 데이터 분석에서 서로 보완적인 역할을 하며, 데이터의 특징을 파악하고 추론하는 데 사용됩니다.
기술통계 (Descriptive Statistics) 기술통계란 데이터를 요약하고 그래프나 통계량을 통해 데이터의 특성을 파악하는 방법입니다. 대표적인 기술통계는 다음과 같습니다.
- 평균(Mean): 데이터의 총합을 데이터 개수로 나눈 값입니다.
- 중앙값(Median): 데이터를 크기순으로 정렬했을 때 중간에 위치하는 값입니다.
- 최빈값(Mode): 데이터에서 가장 자주 등장하는 값입니다.
- 분산(Variance): 데이터의 흩어진 정도를 나타내는 값으로, 각 데이터와 평균값의 차이를 제곱한 값의 평균입니다.
- 표준편차(Standard Deviation): 분산의 제곱근으로, 데이터의 흩어진 정도를 나타내는 값입니다.
- 범위(Range): 데이터의 최대값과 최소값의 차이입니다.
- 백분위수(Percentile): 데이터를 크기순으로 정렬했을 때, 해당 백분율에 위치하는 값입니다.
기술통계는 데이터를 이해하는 데 중요한 역할을 합니다. 데이터의 분포를 파악하고 이상치(outlier)를 찾아내는 데 사용됩니다.
추론통계는 모집단(population)에서 얻은 표본(sample) 데이터를 기반으로 모집단의 특성을 추론하는 통계적 기법입니다. 즉, 모집단의 특성을 파악하기 위해 일부 표본 데이터를 분석하여 모집단의 특성을 추측하고자 하는 것입니다.
추론통계에서 가장 기본적인 개념은 가설검정(hypothesis testing)입니다. 가설검정은 특정 가설에 대한 적절성을 검증하는 통계적 방법입니다. 예를 들어, 두 집단 간의 평균 차이가 있는지, 특정 변수와 결과 변수 간의 상관관계가 있는지 등을 검정할 수 있습니다.
또한, 추론통계에서는 신뢰구간(confidence interval)을 사용하여 모수(parameter)의 값에 대한 추정을 수행합니다. 신뢰구간은 표본으로부터 얻은 통계량(statistic)으로부터 모수의 값을 예측하는 구간으로, 일반적으로 95%나 99%의 신뢰수준(confidence level)로 구성됩니다. 이를 통해 모수의 값이 어느 범위 안에 있을 가능성이 높은지를 파악할 수 있습니다.
추론통계는 대규모의 모집단에서 적용되며, 통계적 추론을 통해 모집단의 특성을 파악하고, 모집단에 대한 결론을 내리는 데 사용됩니다.
[AI/Machine Learning] - 선형 회귀 모델의 데이터 변환
선형 회귀 모델의 데이터 변환
선형 회귀(Linear Regression)는 데이터 분석에서 가장 기본적이면서도 강력한 기법 중 하나입니다.하지만 현실의 데이터는 반드시 선형적인 형태를 가지지 않기 때문에, 단순한 선형 모델만으로는
com-flex.tistory.com
[AI/Machine Learning] - 다중 회귀(Multiple Regression)의 정규 방정식(Normal Equation)
다중 회귀(Multiple Regression)의 정규 방정식(Normal Equation)
다중 회귀(Multiple Regression)의 정규 방정식(Normal Equation)1. 다중 회귀란?다중 회귀(Multiple Regression)는 독립 변수(X)가 두 개 이상인 선형 회귀 모델을 의미합니다. 단순 선형 회귀(Simple Linear Regression)
com-flex.tistory.com
[AI/Machine Learning] - 다중선형회귀 vs. 다변량 선형 회귀
다중선형회귀 vs. 다변량 선형 회귀
Multivariate(General) Linear Regression vs. Multiple Linear Regression1. 개요선형 회귀(Linear Regression)는 머신러닝에서 가장 기본적인 모델 중 하나입니다. 그러나 선형 회귀에는 여러 가지 변형이 있으며, 특히 Mu
com-flex.tistory.com