데이터 분석

[ 데이터 분석 ] 판다스 (Pandas)

예진또이(애덤스미스 아님) 2023. 6. 13. 17:21
728x90

판다스란?

   * '웨스 맥키니'가 개발한 라이브러리

    * 데이터 작업을 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 데이터 구조(데이터 프레임)을 제공하는 모듈

# 판다스 설치
!pip install pandas

# 파이썬에서 판다스 가져오기
import pandas as pd

1️⃣ Series와 DataFrame

        * 2차원 표 데이터를 데이터프레임이라고 한다면, 1차원 표 데이터는 시리즈임

         * 표의 데이터 부분을 values라고 부름

         * 표의 행이름을 index라고 부름

         * 표의 열이름을 columns이라고 부름

         * 시리즈는 values와 index로 이루어져 있고, 데이터프레임은 values,index,columns로 이루어져 있음

         * 데이터프레임과 시리즈의 values는 넘파이의 ndarray 기반

 

🐋 DataFrame(데이터, 인덱스 ,컬럼)

data1 = [[67,93,91],[75,69,96],[75,81,82],[62,70,75],[98,45,87]]
idx1 = ['김사과','반하나','오렌지','이메론','배애리']
col1 = ['국어','영어','수학']
# 첫번째 데이터만 넣기
pd.DataFrame(data1)

🌀 결과 1

# 두번째 데이터,인덱스 넣기
pd.DataFrame(data1, idx1)

🌀 결과 2

# 세번째 데이터, 인덱스, 컬럼 넣기
pd.DataFrame(data1,idx1,col1)

🌀 결과 3

# 만든 데이터 프레임을 df1로 정의하기
df1 = pd.DataFrame (data1,idx1,col1)
df1 # 표 보기

🌀마지막 결과

# 저장된 값을 numpy함
df1.values
--------------
# 결과
▶ array([[67, 93, 91],
          [75, 69, 96],
          [75, 81, 82],
          [62, 70, 75],
          [98, 45, 87]])
# 인덱스값,타입 확인
df1.index
-----------------------------------
# 결과
▶ Index(['김사과', '반하나', '오렌지', '이메론', '배애리'], dtype='object')
# 컬럼값, 타입 확인
df1.columns
---------------------
# 결과
▶ Index(['국어', '영어', '수학'], dtype='object')
#딕셔너리를 사용하여 데이터프레임을 생성
dic1 ={
    '국어':[67,75,75,62,98],
    '영어':[93,69,81,70,45],
    '수학':[91,96,82,75,87]
}

df2 = pd.DataFrame(data=dic1, index=idx1)
df2

🌀 결과

🐋 Series( 데이터, 인덱스 )

pd.Series(data2)
------------------
# 결과
▶ 0    67
   1    75
   2    75
   3    62
   4    98
   dtype: int64
se1= pd.Series(data2,idx1)

se1.values
se1.index
-------------------------------
# 결과
▶ array([67, 75, 75, 62, 98]) 
▶ Index(['김사과', '반하나', '오렌지', '이메론', '배애리'], dtype='object')

728x90
반응형