원핫 인코딩(One-Hot Encoding)
원핫 인코딩(One-Hot Encoding)머신러닝이나 딥러닝을 공부하다 보면 자주 접하게 되는 개념 중 하나가 원핫 인코딩(One-Hot Encoding)입니다. 데이터 전처리 단계에서 범주형 데이터를 숫자로 바꿔야 할 때 유용하게 사용되죠. 이 글에서는 원핫 인코딩이 무엇인지, 왜 필요한지, 그리고 어떻게 디코딩하는지까지 한 번에 정리해드립니다.원핫 인코딩이란?원핫 인코딩(One-Hot Encoding)은 범주형 데이터를 이진 벡터(binary vector)로 표현하는 방법입니다.예를 들어, 다음과 같은 카테고리가 있다고 해봅시다:['사과', '바나나', '포도']이를 원핫 인코딩하면 아래와 같이 표현됩니다:과일원핫 벡터사과[1, 0, 0]바나나[0, 1, 0]포도[0, 0, 1]즉, 하나의 값만 1..
2025. 4. 13.
Python 축(axis)
Python에서 axis란?Python의 axis 개념은 주로 NumPy와 pandas 같은 라이브러리에서 다차원 배열을 다룰 때 중요하게 사용됩니다. 데이터 분석과 머신러닝을 할 때, axis를 올바르게 이해하면 연산을 보다 효율적으로 수행할 수 있습니다.1. axis(축)의 개념axis는 다차원 배열에서 연산을 수행할 방향을 결정하는 기준입니다.axis=0: 행을 따라 연산 (세로 방향)axis=1: 열을 따라 연산 (가로 방향)이를 더 쉽게 이해하기 위해, 2차원 배열(행렬)을 예로 들어 보겠습니다.import numpy as np# 3x3 행렬 생성arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])print..
2025. 3. 28.