분류 전체보기 48

Chapter 04

코랩 링크 (코드와 강의 정리 내용이 기록되어 있음) https://drive.google.com/file/d/16NIFE7IfCUYinrnuK2JcB_GYiTKA-_8n/view?usp=share_link Chapter 04-1 로지스틱 회귀 MEMO 메소드 classes_: 레이블의 종류를 반환함(사이킷런에서 개체 속성에 _(언더바)가 있으면 학습한 모델의 속성)ㄴ 레이블링: 사이킷런에서 레이블링을 알파벳 순서로 정렬하여 레이블링을 해주지만, 순서를 사용자 정의에 의해 지정되어야 하는 경우,0:도미, 1:빙어... etc ... 로 지정해줄 수 있음 predict(): [𝒁값 사용] 0, 1, 1로 반환하지 않고, 문자열로 반환해서 출력함(예측하는 메소드) predict_proba(): [시그모이드 ..

Chapter 03-3. 특성 공학과 규제

특성 공학: 새로운 특성을 추가하거나 특성을 변경하거나, 조합하는 것을 뜻함. pandas 라이브러리 과학라이브러리- numpy, scipy, pandas pandas는 DataFrame이라는 객체를 사용함. 엑셀과 같이 행렬을 사용하며, 각 셀을 수정 및 변경 가능함 DataFrame 객체를 numpy배열로 형변환할 때: DataFrame객체명.to_numpy() 다중 회귀 (Multiple regression = Multinomial regression) import pandas as pd df = pd.read_csv('http://bit.ly/perch_csv_data') perch_full = df.to_numpy() print(perch_full) ''' (아래 접는 글 참고) ''' 더보기 ..

Chapter 03-2. 선형 회귀

k-최근점 이웃의 한계점 훈련세트 범위 밖의 값은 예측하기 어렵다. import numpy as np from sklearn.model_selection import train_test_split from sklearn.neighbors import KNeighborsRegressor # 데이터 준비 perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 27.5, 27.5, 2..

Chapter 03-1. K-최근접 이웃 회귀

지도학습 알고리즘은 분류와 회귀로 나뉜다. 회귀는 클래스 중 하나로 분류하는 것이 아니라 임의의 숫자를 예측하는 것이다. K-최근접 이웃 알고리즘은 사례 기반 학습 import numpy as np # 데이터 준비 perch_length = np.array([8.4, 13.7, 15.0, 16.2, 17.4, 18.0, 18.7, 19.0, 19.6, 20.0, 21.0, 21.0, 21.0, 21.3, 22.0, 22.0, 22.0, 22.0, 22.0, 22.5, 22.5, 22.7, 23.0, 23.5, 24.0, 24.0, 24.6, 25.0, 25.6, 26.5, 27.3, 27.5, 27.5, 27.5, 28.0, 28.7, 30.0, 32.8, 34.5, 35.0, 36.5, 36.0, 37..

Chapter 02-2. 데이터 다루기

지난시간 정리 [이진분류] 보통 찾고자하는 것을 양성클래스로 설정 [샘플링편향] 데이터가 훈련데이터와 검증데이터에 없는 종류가 있을 경우 발생 [배열] 샘플을 x축에, 특성을 y축에 넘파이는 리스트를 배열로 만들수 있지만, 배열의 인덱스로도 슬라이싱이 가능하다. fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0, 9.8, 10.5, 10.6, 11.0, 11...

Chapter 02-1 훈련 세트와 테스트 세트

Numpy Numpy는 파이썬 대표적 배열 라이브러리 사이킷러닝, 매플러릿도 넘파이에 의존하고 있으며, 입력도 넘파이 배열로 전달될것을 가정함. predict 메소드에 array([1]) 리스트에 리스트를 넣었었는데, 이를 넘파이를 거쳐 넘파이 배열로 변환해야함 - 1차원 = 벡터 - 2차원 = 행렬 - 3차원 = ... 다른종류의 타입을 넣을 수 없다 import numpy as np 배열 = tensor > 텐서플로우, 파이토치에서는 배열을 텐서라고 부름 > 사이킷런에서는 대부분 배열이라고 부름 # 데이터 수집 fish_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32..

Chapter 1 나의 첫 머신러닝

01-1 인공지능과 머신러닝, 딥러닝        1. 인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술                1) 강인공지능(=인공일반지능): 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템                        ex) 터미네이터                2) 약인공지능: 특정 분야에서 사람의 일을 도와주는 보조 역할을 하는 시스템                        ex) 음성비서, 자율 주행 자동차, 음악 추천, 기계 번역, 알파고 등         2. 머신러닝: 규칙을 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야임.                 - 대표적인 라이브러리: sk..

pymysql.err.OperationalError

pymysql.err.ProgrammingError: (1064, "You have an error in your SQL syntax; check the manual that corresponds to your MariaDB server version for the right syntax to use near '-xx' at line 1") 위 에러로 6시간을 헤맸다 인터넷에 찾아보니 -xx 이 자리에 숫자가 들어가면 그렇다는데 본인의 경우는 데이터베이스 파일 이름에 '-(하이폰)'이 들어가있어서 그 부분부터 이와 같은 오류가 발생했다. →이러한 경우 테이블명을 esc 아래 있는 `로 감싸주면된다.