본문 바로가기
프로그래밍/파이썬(Python)

파이썬(Python) Pandas Series, Dataframe 관계

by comflex 2022. 12. 30.
728x90
반응형

 

Pandas Series와 Pandas DataFrame은 서로 연관이 있는 자료구조입니다. Pandas Series는 하나의 컬럼을 갖는 구조이고, Pandas DataFrame은 여러 개의 컬럼을 갖는 구조입니다.

Pandas Series는 색인과 값으로 이루어져 있습니다. 색인은 각 요소를 식별하는 고유한 값이고, 값은 실제 저장할 데이터가 저장되는 공간입니다. Pandas DataFrame은 색인과 컬럼으로 이루어져 있습니다.

 

Pandas DataFrame은 색인과 컬럼으로 이루어져 있습니다. 색인은 각 행을 식별하는 고유한 값이고, 컬럼은 각 요소를 식별하는 고유한 값이고, 각 컬럼은 하나의 Pandas Series로 구성됩니다.

 

아래의 코드는 Pandas DataFrame을 생성하는 예입니다.

import pandas as pd

# Pandas DataFrame 생성
df = pd.DataFrame({
    'name': ['John', 'Jane', 'Jim', 'Joan'],
    'age': [30, 25, 35, 40],
    'gender': ['Male', 'Female', 'Male', 'Female']
})
print(df)
#    name  age  gender
# 0  John   30    Male
# 1  Jane   25  Female
# 2   Jim   35    Male
# 3  Joan   40  Female

 

Pandas DataFrame은 컬럼을 선택하거나 추가/삭제할 수 있습니다. 아래의 코드는 Pandas DataFrame의 컬럼을 선택하는 예입니다.

import pandas as pd

# Pandas DataFrame 생성
df = pd.DataFrame({
    'name': ['John', 'Jane', 'Jim', 'Joan'],
    'age': [30, 25, 35, 40],
    'gender': ['Male', 'Female', 'Male', 'Female']
})

# 컬럼 선택
name_column = df['name']
print(name_column)  # 0    John
                   # 1    Jane
                   # 2     Jim
                   # 3    Joan
                   # Name: name, dtype: object

age_column = df[['age']]
print(age_column)  #    age
                   # 0   30
                   # 1   25
                   # 2   35
                   # 3   40

# 여러 개의 컬럼 선택
selected_columns = df[['name', 'age']]
print(selected_columns)
#    name  age
# 0  John   30
# 1  Jane   25
# 2   Jim   35
# 3  Joan   40

 

Pandas DataFrame에서 새로운 컬럼을 추가할 수 있습니다. 아래의 코드는 새로운 컬럼을 추가하는 예입니다.

import pandas as pd

# Pandas DataFrame 생성
df = pd.DataFrame({
    'name': ['John', 'Jane', 'Jim', 'Joan'],
    'age': [30, 25, 35, 40],
    'gender': ['Male', 'Female', 'Male', 'Female']
})

# 새로운 컬럼 추가
df['country'] = ['USA', 'UK', 'Japan', 'Canada']
print(df)
#    name  age  gender country
# 0  John   30    Male     USA
# 1  Jane   25  Female      UK
# 2   Jim   35    Male   Japan
# 3  Joan   40  Female  Canada

위의 코드에서는 새로운 컬럼 'country'를 추가하였습니다. 새로운 컬럼을 추가할 때는 기존의 Pandas DataFrame에 새로운 컬럼 이름을 지정한 값을 할당하면 됩니다.

 

Pandas DataFrame에서 컬럼을 삭제할 수 있습니다. 아래의 코드는 컬럼을 삭제하는 예입니다.

import pandas as pd

# Pandas DataFrame 생성
df = pd.DataFrame({
    'name': ['John', 'Jane', 'Jim', 'Joan'],
    'age': [30, 25, 35, 40],
    'gender': ['Male', 'Female', 'Male', 'Female']
})

# 컬럼 삭제
df = df.drop(columns=['age'])
print(df)  #    name  gender
           # 0  John    Male
           # 1  Jane  Female
           # 2   Jim    Male
           # 3  Joan  Female
반응형

2022.08.03 - [프로그래밍/파이썬(Python)] - 파이썬(Python) Pandas Series

 

파이썬(Python) Pandas Series

Series Series는 파이썬 Pandas의 자료 구조 중 하나이다. 코드 import pandas as pd import numpy as np pd.__version__ #Pandas version 확인 s = pd.Series([0, 1, 2, 3, 4, 5]) print(s) 현재 사용중인 Pandas 의 버전은 version 명령으

com-flex.tistory.com

2022.12.30 - [프로그래밍/파이썬(Python)] - 파이썬(Python) Pandas Series index

 

파이썬(Python) Pandas Series index

Pandas Series는 색인(index)를 이용해서 각 요소에 접근할 수 있습니다. 색인은 문자열 값이나 정수 값을 사용할 수 있으며, 정수 값을 이용한 색인은 NumPy 배열과 유사합니다. 아래의 코드는 Pandas Seri

com-flex.tistory.com

2022.12.30 - [프로그래밍/파이썬(Python)] - 파이썬(Python) Pandas Series 산술, 논리 연산

 

파이썬(Python) Pandas Series 산술, 논리 연산

Pandas Series는 다양한 연산을 지원합니다. 이들 연산은 요소별로 수행되며, 색인이 같은 요소끼리 연산이 수행됩니다. 이들 연산은 산술 연산, 비교 연산, 논리 연산, 집계 연산 등이 있습니다. 산

com-flex.tistory.com

2022.08.03 - [프로그래밍/파이썬(Python)] - 파이썬(Python) Pandas Dataframe

 

파이썬(Python) Pandas Dataframe

Dataframe Dataframe은 파이썬 Pandas의 자료 구조 중 하나이다. 다수의 Series를 하나의 Dataframe에서 관리할 수 있다. 코드 d1={'a':1, 'b':2, 'c':3, 'd':4, 'e':5, 'f':6} d2={'a':7, 'b':8, 'c':9, 'd':10, 'e':11, 'f':12} s1 = pd.Ser

com-flex.tistory.com

 

728x90
반응형