Pivot table
Pivot table은 데이터프레임의 열을 행 인덱스, 행을 열 인덱스, 값으로 데이터를 나타내는 테이블을 생성하는 Pandas 함수입니다.
Pandas의 pivot_table() 함수를 사용하여 pivot table을 생성할 수 있습니다. 함수는 다음과 같은 매개변수를 사용합니다.
- data: pivot table을 생성할 데이터프레임
- values: 집계할 열
- index: 행 인덱스로 사용할 열
- columns: 열 인덱스로 사용할 열
- aggfunc: 집계 함수
- fill_value: 결측값 대체 값
Cross Tab
Cross Tab은 두 개 이상의 요인에 대한 빈도표를 생성하는 Pandas 함수입니다. 두 열 간의 교차 빈도표를 만들어서 두 변수 사이의 관계를 시각화하고, 요인 간의 상호 작용을 파악하는 데 유용합니다.
Pandas의 crosstab() 함수를 사용하여 Cross Tab을 생성할 수 있습니다. 함수는 다음과 같은 매개변수를 사용합니다.
- index: 교차 빈도표의 행 인덱스를 지정하는 열
- columns: 교차 빈도표의 열 인덱스를 지정하는 열
- values: 교차 빈도표의 값으로 사용할 열
- aggfunc: 집계 함수
- margins: 총계 행과 열 추가 여부
- normalize: 빈도표의 값들을 정규화할지 여부
import pandas as pd
# 식사 선호도 데이터 로드
meal_data = pd.read_csv('meal_data.csv')
# Cross Tab 생성
meal_cross_tab = pd.crosstab(
index=meal_data['Gender'], columns=meal_data['Meal Preference'])
print(meal_cross_tab)
Pivot table, CrossTab, groupby 모두 같은 결과물을 낼 수 있기 때문에 편한 걸 쓰도록 하자.
'AI > Pandas' 카테고리의 다른 글
Merge & Concat, persistence (0) | 2023.03.12 |
---|---|
Group by (0) | 2023.03.12 |
map, replace, apply, built-in 함수들 (0) | 2023.03.12 |
Series, Dataframe 생성, indexing, selection (0) | 2023.03.12 |