본문 바로가기

Python/데이터 분석2

[Python] 데이터 집계 데이터 집계분포 및 요약 통계- 데이터명.describe() : 컬럼별 값의 갯수, 평균, 표준편차, 최솟값, 최댓값, 사분위수 출력df.describe() 대푯값- min() : 최솟값- max() : 최댓값- mean() : 평균- median() : 중앙값- std() : 표준편차- var() : 분산- quantile(분위) : 분위수df.min(numeric_only=True) # 숫자형만 df.quantile(0.25, numeric_only=True) # 1분위수 변수의 상관관계 확인- 데이터명.corr()df.corr(numeric_only=True) # 시각화 참고import seaborn as snsimport matplotlib.pyplot as pltsns.heatmap(df.cor.. 2024. 9. 2.

[Python] 데이터 전처리 * 개인적인 스터디를 위한 블로그이기 때문에 생략된 부분이 많은 점 참고 부탁드립니다. Series & DataFrame1. Series구분내용코드 예시정의Pandas에서 사용하는 일종의 리스트 생성Dictionary → Seriesimport pandas as pddic = {'a':1, 'b':2, 'c':3}dic_series = pd.Series(dic)print(type(dic_series))print(dic_series) List → Series- 인덱스 미설정시 자동으로 0부터ls = [1, 2, 3]ls_series1 = pd.Series(ls)ls_series2 = pd.Series(ls, index=['a', 'b', 'c']}print(type(ls_series1))print(ls_s.. 2024. 9. 1.

이전 1 다음

티스토리툴바