데이터 분석
[ 데이터 분석 ] 판다스 (Pandas)
예진또이(애덤스미스 아님)
2023. 6. 13. 17:21
728x90
판다스란?
* '웨스 맥키니'가 개발한 라이브러리
* 데이터 작업을 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 데이터 구조(데이터 프레임)을 제공하는 모듈
# 판다스 설치
!pip install pandas
# 파이썬에서 판다스 가져오기
import pandas as pd
1️⃣ Series와 DataFrame
* 2차원 표 데이터를 데이터프레임이라고 한다면, 1차원 표 데이터는 시리즈임
* 표의 데이터 부분을 values라고 부름
* 표의 행이름을 index라고 부름
* 표의 열이름을 columns이라고 부름
* 시리즈는 values와 index로 이루어져 있고, 데이터프레임은 values,index,columns로 이루어져 있음
* 데이터프레임과 시리즈의 values는 넘파이의 ndarray 기반
🐋 DataFrame(데이터, 인덱스 ,컬럼)
data1 = [[67,93,91],[75,69,96],[75,81,82],[62,70,75],[98,45,87]]
idx1 = ['김사과','반하나','오렌지','이메론','배애리']
col1 = ['국어','영어','수학']
# 첫번째 데이터만 넣기
pd.DataFrame(data1)
🌀 결과 1
# 두번째 데이터,인덱스 넣기
pd.DataFrame(data1, idx1)
🌀 결과 2
# 세번째 데이터, 인덱스, 컬럼 넣기
pd.DataFrame(data1,idx1,col1)
🌀 결과 3
# 만든 데이터 프레임을 df1로 정의하기
df1 = pd.DataFrame (data1,idx1,col1)
df1 # 표 보기
🌀마지막 결과
# 저장된 값을 numpy함
df1.values
--------------
# 결과
▶ array([[67, 93, 91],
[75, 69, 96],
[75, 81, 82],
[62, 70, 75],
[98, 45, 87]])
# 인덱스값,타입 확인
df1.index
-----------------------------------
# 결과
▶ Index(['김사과', '반하나', '오렌지', '이메론', '배애리'], dtype='object')
# 컬럼값, 타입 확인
df1.columns
---------------------
# 결과
▶ Index(['국어', '영어', '수학'], dtype='object')
#딕셔너리를 사용하여 데이터프레임을 생성
dic1 ={
'국어':[67,75,75,62,98],
'영어':[93,69,81,70,45],
'수학':[91,96,82,75,87]
}
df2 = pd.DataFrame(data=dic1, index=idx1)
df2
🌀 결과
🐋 Series( 데이터, 인덱스 )
pd.Series(data2)
------------------
# 결과
▶ 0 67
1 75
2 75
3 62
4 98
dtype: int64
se1= pd.Series(data2,idx1)
se1.values
se1.index
-------------------------------
# 결과
▶ array([67, 75, 75, 62, 98])
▶ Index(['김사과', '반하나', '오렌지', '이메론', '배애리'], dtype='object')
728x90
반응형