AI/Pandas

Pivot table, Crosstab

LTSGOD 2023. 3. 12. 11:20

 

Pivot table 

 

Pivot table은 데이터프레임의 열을 행 인덱스, 행을 열 인덱스, 값으로 데이터를 나타내는 테이블을 생성하는 Pandas 함수입니다.

 

 

Pandas의 pivot_table() 함수를 사용하여 pivot table을 생성할 수 있습니다. 함수는 다음과 같은 매개변수를 사용합니다.

  • data: pivot table을 생성할 데이터프레임
  • values: 집계할 열
  • index: 행 인덱스로 사용할 열
  • columns: 열 인덱스로 사용할 열
  • aggfunc: 집계 함수
  • fill_value: 결측값 대체 값


Cross Tab

 

Cross Tab은 두 개 이상의 요인에 대한 빈도표를 생성하는 Pandas 함수입니다. 두 열 간의 교차 빈도표를 만들어서 두 변수 사이의 관계를 시각화하고, 요인 간의 상호 작용을 파악하는 데 유용합니다.

 

Pandas의 crosstab() 함수를 사용하여 Cross Tab을 생성할 수 있습니다. 함수는 다음과 같은 매개변수를 사용합니다.

  • index: 교차 빈도표의 행 인덱스를 지정하는 열
  • columns: 교차 빈도표의 열 인덱스를 지정하는 열
  • values: 교차 빈도표의 값으로 사용할 열
  • aggfunc: 집계 함수
  • margins: 총계 행과 열 추가 여부
  • normalize: 빈도표의 값들을 정규화할지 여부
import pandas as pd

# 식사 선호도 데이터 로드
meal_data = pd.read_csv('meal_data.csv')

# Cross Tab 생성
meal_cross_tab = pd.crosstab(
    index=meal_data['Gender'], columns=meal_data['Meal Preference'])

print(meal_cross_tab)

 

Pivot table, CrossTab, groupby 모두 같은 결과물을 낼 수 있기 때문에 편한 걸 쓰도록 하자.