핵심 데이터 구조
판다스의 핵심 데이터 구조는 Series와 DataFrame을 꼽을 수 있다
Series
- 1차원 구조를 가진 열
- 하나의 분류에 해당하는 데이터가 저장된다
import pandas as pd
animal_series = pd.Series(['돼지','코끼리','하마','상어'])
- 인덱스(index)와 값(value)로 구성된다
- 사용장 지정 인덱스로 지정도 가능하다
import pandas as pd
# 딕셔너리로 생성
s2 = pd.Series({'a': 1, 'b': 2, 'c': 3})
# 사용자 정의 인덱스 지정
s3 = pd.Series([4, 7, -5, 3], index=["d", "b", "a", "c"])
DataFrame
- 복수의 열을 가진 2차원 데이터 구조로
- 여러개의 Series로 구성된다
import pandas as pd
# 딕셔너리를 이용하여 생성
animals_df = pd.DataFrame({
'Name': ['Lion', 'Elephant', 'Giraffe', 'Penguin'],
'Species': ['Panthera leo', 'Loxodonta africana', 'Giraffa camelopardalis', 'Spheniscus demersus'],
})
# 각 열에 대한 시리즈 생성
name_series = pd.Series(['Lion', 'Elephant', 'Giraffe', 'Penguin'], name='Name')
species_series = pd.Series(['Panthera leo', 'Loxodonta africana', 'Giraffa camelopardalis', 'Spheniscus demersus'], name='Species')
# 시리즈들을 결합하여 데이터프레임 생성
animal_df = pd.DataFrame({'동물이름':name_series,'종분류':species_series})
'AI > Pandas' 카테고리의 다른 글
numpy.newaxis (0) | 2024.10.05 |
---|---|
Pandas의 데이터 조회 및 검사 (0) | 2024.10.03 |