전체 글(55)
-
[ 머신러닝 ] 사이킷런 & Linear SVC
🌀 Scikit-learn 모듈 @ 대표적인 파이썬 머신러닝 모듈 @ 다양한 머신러닝 알고리즘을 제공 @ 다양한 샘플 데이터를 제공 @ 머신러닝 결과를 검증하는 기능을 제공 @ BSD 라이센스이기 때문에 무료로 사용 및 배포가 가능 @ 사이킷런 공식 홈페이지 [https://scikit-learn.org] 🌀 Linear SVC @ 클래스를 구분으로 하는 분류 문제에서 각 클래스를 잘 구분하는 선을 그려주는 방식을 사용하는 알고리즘 @ 지도학습 알고리즘을 사용하는 학습 전용 데이터와 결과 전용 데이터를 함께 가지고 있어야 사용이 가능 from sklearn.svm import LinearSVC # 문제를 주는 것 from sklearn.metrics import accuracy_score # 답을 주는 ..
2023.06.25 -
[ 머신러닝 ] 머신러닝이란?
🌀머신러닝 인공지능 : 인공(Artificial) + 지능(Intelligence) * 개발자에 의한 인공지능, 데이터에 의한 인공지능 머신러닝 : 데이터를 기반으로 한 학습(learning)하는 기계(machine) 딥러닝 : 깊은(deep) 신경망 구조의 머신러닝 1️⃣ 배경 @ 과거 컴퓨터로 데이터를 읽어들이고, 데이터 안에서 특징을 학습하여 패턴을 찾아내는 작업 → 패턴 인식 @ 데이터를 대량으로 수집 처리할 수 있는 환경이 갖춰짐으로 할 수 있는 일들이 많아짐 @ 머신러닝은 데이터로부터 특징이나 패턴을 찾아내는 것이기 대문에 데이터가 가장 중요함 2️⃣ 정의 @ 인공지능의 한 분야로 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야 @ "무엇(X)으로 무엇(Y)을 예측하고 싶다"의..
2023.06.25 -
[데이터 분석] CSV 파일 다루기/ 데이터 프레임 기본 정보 알아보기
CSV 파일이란? * CSV(Comma Separated Value)의 약자로 데이터를 쉼표로 구분한 파일 * 엑셀로 로딩할 수 있지만 쉼표로 구분된 CSV가 더 가볍기 때문에 데이터로 많이 사용됨 * 공공데이터 포털에서도 CSV 포맷의 파일을 제공 ☑️ 일반 CSV 파일 읽어오기 pd.read_csv( 'CSV파일 경로' ) ☑️ 엑셀 파일 읽어오기 pd.read_excel( '파일경로' ) 데이터 프레임 기본정보 알아보기 # CSV 파일 가져오기 df = pd.read_csv('http://bit.ly/ds-korean-idol') # 가져온 파일 표 보기 df 🌀 결과 # 타입 알아보기 type(df) -------------------------------- ▶ pandas.core.frame.D..
2023.06.25 -
[ 데이터 분석 ] 판다스 (Pandas)
판다스란? * '웨스 맥키니'가 개발한 라이브러리 * 데이터 작업을 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 데이터 구조(데이터 프레임)을 제공하는 모듈 # 판다스 설치 !pip install pandas # 파이썬에서 판다스 가져오기 import pandas as pd 1️⃣ Series와 DataFrame * 2차원 표 데이터를 데이터프레임이라고 한다면, 1차원 표 데이터는 시리즈임 * 표의 데이터 부분을 values라고 부름 * 표의 행이름을 index라고 부름 * 표의 열이름을 columns이라고 부름 * 시리즈는 values와 index로 이루어져 있고, 데이터프레임은 values,index,columns로 이루어져 있음 * 데이터프레임과 시리즈의 values는 넘파이의 ndarray..
2023.06.13 -
[데이터 분석] 연산자
연산자란? * 덧셈, 뺄셈, 곱셈, 나눗셈은 shape가 같아야함 * 같은 position끼리 연산 * 내적은 맞닿는 shape가 같아야 함 * 내적은 떨어져 있는 shape가 결과 행렬이 됨 # dot product( 행렬곱, 내적 ) # 맞닿은 shape이 같아야함 a = np.array ([[1,2,3],[2,3,4]]) b = np.array([[3,4,5],[1,2,3]]) a.shape , b.shape ------------------------------------ # 결과(행,열) ▶ ((2, 3), (2, 3)) # 덧셈연산 a+b ------------ # 결과 ▶ array([[4, 6, 8], [3, 5, 7]]) # 뺄셈 연산 a-b -------------- # 결과 ▶ arr..
2023.06.13 -
[데이터분석] 넘파이 (Numpy)
넘파이란? * 수학, 과학 계산용 패키지 *자료구조(ndarray)를 제공 ▶파이썬의 list보다 속도가 빠름, 적은 메모리를 사용 #넘파일 다운로드 !pip install numpy # 넘파이 가져오기 import numpy #확인하기 numpy ▶ #파이썬에서 numpy를 가져오기 import numpy as np 1️⃣ ndarray → NumPy에서 제공하는 다차원 배열 객체 → 다차원의 데이터를 효율적으로 저장하고 다양한 수치 연산을 수행하는 데 사용됨 list1 = [1,2,3,4] list2 = [[1,2,3,4],[5,6,7,8]] print(list1) print(list2) print(type(list1)) print(type(list1[1])) print(type(list2)) ---..
2023.06.12