본문바로가기


페이지 위치

블로그

Home 블로그

블로그






[파이썬(Python)]

pivot_table() 함수를 이용한 집단별 기술통계량

  • 2021-10-29   의견나누기 0

# 패키지 로딩하기

import numpy  as np

import pandas as pd

 

 

# 분석 데이터 읽어오기

diamonds = pd.read_excel(io    = "d:/customs/diamonds.xlsx",
                         sheet_name = 0,
                         header       = 0)

 

# 범주형 자료 : cut, color, clarity

# 수치형 자료 : carat, depth, table, price, x, y, z

 

 

# 판다스(panas)에서 제공하는 pivot_table() 함수의 사용법

# pd.pivot_table(data = ,
#                     values = "기술통계량을 구하고 싶은 수치형 자료",

#                     index  = "행에 들어갈 범주형 자료",

#                     columns = "열에 들어갈 범주형 자료",
#                     aggfunc = {기술통계량을 위한 함수명})

 

 

# cut별 carat에 대한 데이터의 개수, 평균, 표준편차 구하기

pd.pivot_table(data = diamonds,

                   values = "carat",

                   index  = "cut",

                   aggfunc = {len, np.mean, np.std})

 

 

#파이썬

#집단별기술통계량

#pandas

#pivot_table()

Comment 0

닉네임과 이메일은 현재 사용기기에 저장되어 다음부터 편리하게 글을 공유할 수 있습니다.



빠른메뉴



페이지 맨 위로 이동