본문 바로가기
728x90
반응형

분산3

분산(Variance) 분산이 큰지 아닌지를 어떻게 확인하지?데이터 분석이나 머신러닝을 하다 보면 자주 듣는 말 중 하나가 "이 데이터의 분산이 크다"는 표현입니다.그런데 막상 실무나 공부를 하다 보면, "분산이 크다"는 게 정확히 어떤 의미인지 헷갈릴 수 있습니다.이 글에서는 "분산이 크다는 게 뭘까?", "어떻게 확인하지?"에 대해 차근차근 알아보겠습니다.분산이란?분산(Variance)은 데이터가 평균을 기준으로 얼마나 퍼져 있는지를 수치로 표현한 값입니다.수식적으로는:$$\text{분산} = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2$$$x_i$ : 각 데이터 값$\bar{x}$ : 평균분산이 크다는 것은 → 데이터가 평균에서 많이 떨어져 흩어져 있다는 뜻입니다.분산이 큰지 확인하는 .. 2025. 4. 7.
Bias-Variance Trade-off in python Bias-Variance Trade-off를 이해하는 파이썬 예제와 설명머신러닝 모델의 성능을 결정짓는 중요한 이론 중 하나가 바로 Bias-Variance Trade-off입니다. 이번 글에서는 이 개념을 직접 코드로 구현해보며, 시각적으로 어떻게 작동하는지 확인해보겠습니다.목표다양한 복잡도를 가진 모델이 편향과 분산에 어떤 영향을 미치는지 확인파이썬 코드 예제import numpy as npimport matplotlib.pyplot as pltfrom sklearn.preprocessing import PolynomialFeaturesfrom sklearn.linear_model import LinearRegressionfrom sklearn.metrics import mean_squared_err.. 2025. 4. 7.
Bias-Variance Trade-off Bias-Variance Trade-off: 머신러닝 모델의 핵심 균형머신러닝에서 중요한 목표는 모델이 주어진 데이터에 잘 맞으면서도 새로운 데이터에도 잘 작동하도록 만드는 것입니다.이때 꼭 알아야 하는 개념이 바로 Bias-Variance Trade-off (편향-분산 균형)입니다.Bias(편향)란?편향은 모델이 데이터의 실제 패턴을 얼마나 잘 포착하지 못하는지를 나타냅니다.편향이 높으면 모델은 지나치게 단순하며 복잡한 관계를 무시합니다.이 경우 과소적합(Underfitting)이 발생해 예측력이 떨어집니다.예: 복잡한 곡선을 단순한 직선으로 예측하려는 경우Variance(분산)란?분산은 모델이 훈련 데이터에 얼마나 민감한지를 나타냅니다.분산이 높으면 모델은 데이터의 작은 변화에도 반응합니다.이로 인해.. 2025. 4. 7.
728x90
반응형