Pandas Series와 Pandas DataFrame은 서로 연관이 있는 자료구조입니다. Pandas Series는 하나의 컬럼을 갖는 구조이고, Pandas DataFrame은 여러 개의 컬럼을 갖는 구조입니다.
Pandas Series는 색인과 값으로 이루어져 있습니다. 색인은 각 요소를 식별하는 고유한 값이고, 값은 실제 저장할 데이터가 저장되는 공간입니다. Pandas DataFrame은 색인과 컬럼으로 이루어져 있습니다.
Pandas DataFrame은 색인과 컬럼으로 이루어져 있습니다. 색인은 각 행을 식별하는 고유한 값이고, 컬럼은 각 요소를 식별하는 고유한 값이고, 각 컬럼은 하나의 Pandas Series로 구성됩니다.
아래의 코드는 Pandas DataFrame을 생성하는 예입니다.
import pandas as pd
# Pandas DataFrame 생성
df = pd.DataFrame({
'name': ['John', 'Jane', 'Jim', 'Joan'],
'age': [30, 25, 35, 40],
'gender': ['Male', 'Female', 'Male', 'Female']
})
print(df)
# name age gender
# 0 John 30 Male
# 1 Jane 25 Female
# 2 Jim 35 Male
# 3 Joan 40 Female
Pandas DataFrame은 컬럼을 선택하거나 추가/삭제할 수 있습니다. 아래의 코드는 Pandas DataFrame의 컬럼을 선택하는 예입니다.
import pandas as pd
# Pandas DataFrame 생성
df = pd.DataFrame({
'name': ['John', 'Jane', 'Jim', 'Joan'],
'age': [30, 25, 35, 40],
'gender': ['Male', 'Female', 'Male', 'Female']
})
# 컬럼 선택
name_column = df['name']
print(name_column) # 0 John
# 1 Jane
# 2 Jim
# 3 Joan
# Name: name, dtype: object
age_column = df[['age']]
print(age_column) # age
# 0 30
# 1 25
# 2 35
# 3 40
# 여러 개의 컬럼 선택
selected_columns = df[['name', 'age']]
print(selected_columns)
# name age
# 0 John 30
# 1 Jane 25
# 2 Jim 35
# 3 Joan 40
Pandas DataFrame에서 새로운 컬럼을 추가할 수 있습니다. 아래의 코드는 새로운 컬럼을 추가하는 예입니다.
import pandas as pd
# Pandas DataFrame 생성
df = pd.DataFrame({
'name': ['John', 'Jane', 'Jim', 'Joan'],
'age': [30, 25, 35, 40],
'gender': ['Male', 'Female', 'Male', 'Female']
})
# 새로운 컬럼 추가
df['country'] = ['USA', 'UK', 'Japan', 'Canada']
print(df)
# name age gender country
# 0 John 30 Male USA
# 1 Jane 25 Female UK
# 2 Jim 35 Male Japan
# 3 Joan 40 Female Canada
위의 코드에서는 새로운 컬럼 'country'를 추가하였습니다. 새로운 컬럼을 추가할 때는 기존의 Pandas DataFrame에 새로운 컬럼 이름을 지정한 값을 할당하면 됩니다.
Pandas DataFrame에서 컬럼을 삭제할 수 있습니다. 아래의 코드는 컬럼을 삭제하는 예입니다.
import pandas as pd
# Pandas DataFrame 생성
df = pd.DataFrame({
'name': ['John', 'Jane', 'Jim', 'Joan'],
'age': [30, 25, 35, 40],
'gender': ['Male', 'Female', 'Male', 'Female']
})
# 컬럼 삭제
df = df.drop(columns=['age'])
print(df) # name gender
# 0 John Male
# 1 Jane Female
# 2 Jim Male
# 3 Joan Female
2022.08.03 - [프로그래밍/파이썬(Python)] - 파이썬(Python) Pandas Series
파이썬(Python) Pandas Series
Series Series는 파이썬 Pandas의 자료 구조 중 하나이다. 코드 import pandas as pd import numpy as np pd.__version__ #Pandas version 확인 s = pd.Series([0, 1, 2, 3, 4, 5]) print(s) 현재 사용중인 Pandas 의 버전은 version 명령으
com-flex.tistory.com
2022.12.30 - [프로그래밍/파이썬(Python)] - 파이썬(Python) Pandas Series index
파이썬(Python) Pandas Series index
Pandas Series는 색인(index)를 이용해서 각 요소에 접근할 수 있습니다. 색인은 문자열 값이나 정수 값을 사용할 수 있으며, 정수 값을 이용한 색인은 NumPy 배열과 유사합니다. 아래의 코드는 Pandas Seri
com-flex.tistory.com
2022.12.30 - [프로그래밍/파이썬(Python)] - 파이썬(Python) Pandas Series 산술, 논리 연산
파이썬(Python) Pandas Series 산술, 논리 연산
Pandas Series는 다양한 연산을 지원합니다. 이들 연산은 요소별로 수행되며, 색인이 같은 요소끼리 연산이 수행됩니다. 이들 연산은 산술 연산, 비교 연산, 논리 연산, 집계 연산 등이 있습니다. 산
com-flex.tistory.com
2022.08.03 - [프로그래밍/파이썬(Python)] - 파이썬(Python) Pandas Dataframe
파이썬(Python) Pandas Dataframe
Dataframe Dataframe은 파이썬 Pandas의 자료 구조 중 하나이다. 다수의 Series를 하나의 Dataframe에서 관리할 수 있다. 코드 d1={'a':1, 'b':2, 'c':3, 'd':4, 'e':5, 'f':6} d2={'a':7, 'b':8, 'c':9, 'd':10, 'e':11, 'f':12} s1 = pd.Ser
com-flex.tistory.com
'프로그래밍 > 파이썬(Python)' 카테고리의 다른 글
파이썬(Python) Pandas Series, Dataframe index #2 (5) | 2022.12.30 |
---|---|
파이썬(Python) 문자열 다루기 (0) | 2022.12.30 |
파이썬(Python) Pandas Series 산술, 논리 연산 (0) | 2022.12.30 |
파이썬(Python) Pandas Series, Dataframe index #1 (0) | 2022.12.30 |
셀레니움(Selenium) (2) | 2022.12.28 |