목록DataScientist_Skill/MachineLearning (3)
nada
reference : 파이썬 머신러닝 완벽 가이드 1. Scikit-learn 정의 -> 파이썬 머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리 특징 개발을 위한 편리한 프레임워크와 API를 제공 머신러닝을 위한 다양한 알고리즘 존재 Easy conda install scikit-learn import sklearn 2. Scikit-learn의 주요 기능 1. Example Data sklean.datasets : 사이킷런에 내장되어 예제로 제공하는 데이터 세트 datasets.load_boston( ) : 미국 보스턴의 집 피처들과 가격에 대한 데이터 셋 [ 회귀 ] datasets.load_breast_cancer( ) : 위스콘신 유방암 피처들과 악성/음성 레이블 데이터 셋 [ 분류 ] da..

1. 정규화 & 표준화 선형함수 정규화(Min-Max Scaling) $X_{nrom} = {X-X_{min} \over X_{max}-X_{min}}$ 데이터에 대해 선형 변환 후 [0,1]범위로 변환 표준 정규화(Z-score Normalization) $Z = {{X - \mu} \over \sigma}$ 평균 = 0, 표준편차 = 1 경사하강법을 사용하여 해를 구하는 모형들은 일반적으로 정규화가 필요 선형 회귀, 로지스틱 회귀, 서포트 벡터 머신, 신경망 등 의사 결정 트리 계열은 정규화가 필요 없음 트리를 분할할 때 기준이 되는 것은 정보 이득비 정규화는 피처에 대한 정보 이득을 바꿀 수 없다. 2. 범주형 피처 범주형 피처 많은 머신 러닝 알고리즘들은 모든 예측 변수들이 수치형이어야함 범주형 ..
머신러닝의 개념. 머신러닝 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야 대표적인 머신러닝 라이브러리 : 사이킷런(Scikit-learn) 지도학습(Supervised Learning) 분류(Classification) 회귀(Regression) 추천 시스템 시각 / 음성 감지/ 인지 텍스트 분석, NLP 비지도 학습(Un-supervised Learning) 클러스터링 차원 축소 강화학습 강화 학습(Reinforcement Learning) MachineLearning Skill 머신러닝 개념 데이터 전처리 Numpy Pandas 사이킷 런(Scikit Learn) 평가 정확도 오차행렬 정밀도와 재현율 F1 Score Roc 곡선과 AUC 분류 결정트리..