[pandas 🐼] - 기본 데이터 구조

1.판다스 데이터 구조

판다스 데이터 구조는 Series, 1차원, DataFrame, 2차원으로 나누어져있다.

데이터 처리 시 필요한 데이터 세트는 2차원 데이터로 구성 되어있다.

1차원 Series : 같은 유형의 배열로 표시된 1차원 데이터
2차원 DataFrame : 유형이 지정되어있으며 크기가 가변적인 테이블 형식으로 행렬 형태

판다스 핵심 객체는 DataFame이다.

1.2 index와 Series

-Index는 RDMS의 PK처럼 개별 데이터를 고유하게 식별하는 Key값

-Series는 칼럼이 하나뿐인 데이터 구조체

Series와 DataFrame의 가장 큰 차이는 Series는 컬럼이 한 개, DataFrame은 칼럼이 여러 개 데이터 구조체

1.3 pivot_table

엑셀에서 피벗테이블 기능을 생각하면 될 것 같다.

행, 열, 값으로 나누어서 데이터를 재구성한다.

데이터를 재구성하여서 지정된 집계 함수들을 사용해서 합계나 평균등을 낸다.

pivot_result = m.data.pivot_table(
    values=["Y_YY_DFN_MEDI_KCUR_AMT"],  # 집계 대상 열
    index=["OFFC_NM"],                  # 행 기준 열
    aggfunc="sum"                       # 집계 함수
)
print(pivot_result)

values(집계 대상 선택): 집계되는 데이터 값
index(데이터 그룹화): 행방향으로 그룹화
aggfuc(집계 함수 적용): 기본값은 'mean'이고 다른 옵션으로 'sum', 'max', 'min'등등 사용 가능

pandas cheet sheet

https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf

저작자표시 (새창열림)

'Programming👩🏻‍💻 > Python' 카테고리의 다른 글

[Python] - Caching 캐싱 적용하기 (1)	2024.12.10
[Python] - decorator 데코레이터 개념 @staticmethod, @classmethod (1) (1)	2024.12.09
Statements vs Expressions 차이 (0)	2024.11.11
파이썬 모듈, 패키지 (0)	2024.11.10
시퀀스 연산 (0)	2024.11.05

일단 하자 ✧

[pandas 🐼] - 기본 데이터 구조

1.판다스 데이터 구조

1.2 index와 Series

1.3 pivot_table

'Programming👩🏻‍💻 > Python' 카테고리의 다른 글

티스토리툴바

[pandas 🐼] - 기본 데이터 구조

1.판다스 데이터 구조

1.2 index와 Series

1.3 pivot_table

'Programming👩🏻‍💻 > Python' 카테고리의 다른 글

'Programming👩🏻‍💻/Python' Related Articles

티스토리툴바