Python 39

기본 package 설정 in jupyter notebook

기본 package 설정 in jupyter notebook 1.기본 import numpy as np numpy #패키지 가져오기 import matplotlib.pyplot as plt #시각화 패키지 가져오기 2.데이터 가져오기 import pandas as pd #csv -> dataframe으로 전환 from sklearn import datasets #python 저장 데이터 가져오기 3.데이터 전처리 from sklearn.preprocessing import StandardScaler #연속변수의 표준화 from sklearn.preprocessing import LabelEncoder #범주형 변수 수치화 4. 훈련/검증용 데이터 분리 from sklearn.model_selection ..

python_33 : Neural Networks(keras)

python_32 : Neural Networks(Keras) * 케라스는 파이썬 3.6에서 동작하므로 콘다 가상환경을 만들어준다 conda create --name ai python=3.6 tensorflow keras 가상환경을 실행한다. conda activate ai 머신러닝 관련 라이브러리 설치해 준다. conda install numpy scipy matplotlib ipython scikit-learn pandas pillow jupyter seaborn * Dummy variable trap 가변수 중 하나를 drop하지 않으면 독립 변수간 종속성이 발생한다. 독립 변수간 상관관계가 나타나는 문제를 다중공선성(Multicollinearity)이라고 한다. 범주형 데이터를 가변수화 했을 때 ..

Python 2021.02.13

python_28 : Logistic Regression(Confusion Matrix)

python_28 : Logistic Regression(Confusion Matrix) * Confusion Matrix (분류결과표) 분류결과표(confusion Matrix)는 타켓의 원래 클래스와 모형이 예측한 클래스가 일치하는지를 갯수로 센 결과를 표로 나타낸것이다. 정답클래스는 행(row)으로 예측한 클래스는 열(column)로 나타낸다. * 이진 분류결과표 클래스가 0과 1두 종류밖에 없는 이진 분류의 경우에는 일반적으로 클래스 이름을 양성(position)와 음성(Negative)로 표시한다. 이때의 결과를 나타내는 이진 분류결과표(Bineary Confusion Matrix)결과표는 다음과 같다. 양성이라고 예측 음성이라고 예측 실제양성 양성 예측이 맞음 (True Positive) 음성..

Python 2021.02.12

python_25 : Data Preprocessing(LabelEncoder,OneHotEncoder, Feature scaling)

python_25 : Data Preprocessing(LabelEncoder,OneHotEncoder,Feature scaling) 문자 인코딩(영어: character encoding), 줄여서 인코딩은 사용자가 입력한 문자나 기호들을 컴퓨터가 이용할 수 있는 신호로 만드는 것을 말한다. 인코딩과 디코딩 (Encoding & Decoding) 컴퓨터는 문자를 인식할 수 없기 때문에 숫자로 변환되어 저장된다. 변환해주기 위해서는 기준이 있어야하는데 이것을 문자 코드라고 하며 대표적으로 ASCII코드 또는 유니코드가 있다. 이렇게 문자 코드를 기준으로 문자를 코드로 변환하는 것을 문자 인코딩(encoding) 이라하고 코드를 문자로 변환하는 것을 문자 디코딩(decoding) 이라고 한다. 기본적으로 사..

Python 2021.02.12