numpy.newaxis
·
AI/Pandas
newaxis는 numpy array의 차원을 늘려주는 역할을 한다예를 들자면 arr_1d = np.arange(4)print(arr_1d.shape)out:(4,)이러한 numpy array를 생성했다현재 이 배열은 1차원이고 4개의 요소들을 가지고 있다.그림으로 표현하면 이런 구조가 된다arr_2d_horizontal = arr_1d[np.newaxis,:]print(arr_2d_horizontal.shape)out:(1, 4)위 코드를 실행 시키면 새로운 차원(축)에 기존의 모든 데이터를 넣는 의미가 된다.그러므로 위 코드의 배열은 2차원 배열이 되고 1개의 행(차원)에 4개의 요소가 포함된 구조가 된다.그림으로는 이렇게 표현된다.arr_2d_vertical = arr_1d[:,np.newaxis]..
Pandas의 데이터 조회 및 검사
·
AI/Pandas
예시 데이터프레임import pandas as pddf = pd.DataFrame({ 'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50], 'C': [100, 200, 300, 400, 500],})describe()데이터프레임의 시리즈(Series)에 대한 기본적인 통계를 반환print(df.describe()) A B Ccount 5.000000 5.000000 5.000000mean 3.000000 30.000000 300.000000std 1.581139 15.811388 158.113883min 1.000000 10.000000 100.00000025% ..
Pandas 의 데이터 구조
·
AI/Pandas
핵심 데이터 구조판다스의 핵심 데이터 구조는 Series와 DataFrame을 꼽을 수 있다Series- 1차원 구조를 가진 열- 하나의 분류에 해당하는 데이터가 저장된다import pandas as pdanimal_series = pd.Series(['돼지','코끼리','하마','상어'])- 인덱스(index)와 값(value)로 구성된다- 사용장 지정 인덱스로 지정도 가능하다import pandas as pd# 딕셔너리로 생성s2 = pd.Series({'a': 1, 'b': 2, 'c': 3})# 사용자 정의 인덱스 지정s3 = pd.Series([4, 7, -5, 3], index=["d", "b", "a", "c"]) DataFrame- 복수의 열을 가진 2차원 데이터 구조로 - 여러개의 Ser..
코딩밸리
'AI/Pandas' 카테고리의 글 목록