예시 데이터프레임
import pandas as pd
df = pd.DataFrame({
'A': [1, 2, 3, 4, 5],
'B': [10, 20, 30, 40, 50],
'C': [100, 200, 300, 400, 500],
})
describe()
데이터프레임의 시리즈(Series)에 대한 기본적인 통계를 반환
print(df.describe())
A B C
count 5.000000 5.000000 5.000000
mean 3.000000 30.000000 300.000000
std 1.581139 15.811388 158.113883
min 1.000000 10.000000 100.000000
25% 2.000000 20.000000 200.000000
50% 3.000000 30.000000 300.000000
75% 4.000000 40.000000 400.000000
max 5.000000 50.000000 500.000000
mean()
각 시리즈(Series)의 평균값을 반환
print(df.mean())
A 3.0
B 30.0
C 300.0
dtype: float64
corr()
각 시리즈의 상관관계를 반환
print(df.corr())
A B C
A 1.0 1.0 1.0
B 1.0 1.0 1.0
C 1.0 1.0 1.0
count()
각 시리즈의 Null이 아닌 값의 총합을 반환
print(df.count())
A 5
B 5
C 5
dtype: int64
'AI > Pandas' 카테고리의 다른 글
numpy.newaxis (0) | 2024.10.05 |
---|---|
Pandas 의 데이터 구조 (0) | 2024.09.24 |