데이터 분석(4)
-
[데이터 분석] CSV 파일 다루기/ 데이터 프레임 기본 정보 알아보기
CSV 파일이란? * CSV(Comma Separated Value)의 약자로 데이터를 쉼표로 구분한 파일 * 엑셀로 로딩할 수 있지만 쉼표로 구분된 CSV가 더 가볍기 때문에 데이터로 많이 사용됨 * 공공데이터 포털에서도 CSV 포맷의 파일을 제공 ☑️ 일반 CSV 파일 읽어오기 pd.read_csv( 'CSV파일 경로' ) ☑️ 엑셀 파일 읽어오기 pd.read_excel( '파일경로' ) 데이터 프레임 기본정보 알아보기 # CSV 파일 가져오기 df = pd.read_csv('http://bit.ly/ds-korean-idol') # 가져온 파일 표 보기 df 🌀 결과 # 타입 알아보기 type(df) -------------------------------- ▶ pandas.core.frame.D..
2023.06.25 -
[ 데이터 분석 ] 판다스 (Pandas)
판다스란? * '웨스 맥키니'가 개발한 라이브러리 * 데이터 작업을 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 데이터 구조(데이터 프레임)을 제공하는 모듈 # 판다스 설치 !pip install pandas # 파이썬에서 판다스 가져오기 import pandas as pd 1️⃣ Series와 DataFrame * 2차원 표 데이터를 데이터프레임이라고 한다면, 1차원 표 데이터는 시리즈임 * 표의 데이터 부분을 values라고 부름 * 표의 행이름을 index라고 부름 * 표의 열이름을 columns이라고 부름 * 시리즈는 values와 index로 이루어져 있고, 데이터프레임은 values,index,columns로 이루어져 있음 * 데이터프레임과 시리즈의 values는 넘파이의 ndarray..
2023.06.13 -
[데이터 분석] 연산자
연산자란? * 덧셈, 뺄셈, 곱셈, 나눗셈은 shape가 같아야함 * 같은 position끼리 연산 * 내적은 맞닿는 shape가 같아야 함 * 내적은 떨어져 있는 shape가 결과 행렬이 됨 # dot product( 행렬곱, 내적 ) # 맞닿은 shape이 같아야함 a = np.array ([[1,2,3],[2,3,4]]) b = np.array([[3,4,5],[1,2,3]]) a.shape , b.shape ------------------------------------ # 결과(행,열) ▶ ((2, 3), (2, 3)) # 덧셈연산 a+b ------------ # 결과 ▶ array([[4, 6, 8], [3, 5, 7]]) # 뺄셈 연산 a-b -------------- # 결과 ▶ arr..
2023.06.13 -
[데이터분석] 넘파이 (Numpy)
넘파이란? * 수학, 과학 계산용 패키지 *자료구조(ndarray)를 제공 ▶파이썬의 list보다 속도가 빠름, 적은 메모리를 사용 #넘파일 다운로드 !pip install numpy # 넘파이 가져오기 import numpy #확인하기 numpy ▶ #파이썬에서 numpy를 가져오기 import numpy as np 1️⃣ ndarray → NumPy에서 제공하는 다차원 배열 객체 → 다차원의 데이터를 효율적으로 저장하고 다양한 수치 연산을 수행하는 데 사용됨 list1 = [1,2,3,4] list2 = [[1,2,3,4],[5,6,7,8]] print(list1) print(list2) print(type(list1)) print(type(list1[1])) print(type(list2)) ---..
2023.06.12