[코드프레소 체험단] AI인공지능 트랙 후기 (2)
올해 1월부터 코드프레소 체험단에 선정되어
인공지능 트랙 강의를 수강하기 시작했다.
후기 1탄은 아래 참고
↓↓↓↓
https://ari950505.tistory.com/32
[코드프레소 체험단] AI인공지능 트랙 후기 (1)
올해 1월부터 코드프레소 체험단에 선정되어 인공지능 트랙 강의를 수강하기 시작했다. 한 달동안 강의를 들어본 결과 개인적으로 매우 만족하며 듣고 있다. 현재 Machine Learning 공부를 따로 하고
ari950505.tistory.com
지도 학습 중 중요하다고 생각하는 회귀와 분류분석 강의를 수강했다.
개인적으로 굉장히 도움이 많이 되었다.
통계적인 지식도 많이 다질 수 있었고
덕분에 Confusion matrix TP,FN 등의 정의는 확실하게 알게되었다.
그 전에는 이것때문에 얼마나 헷갈리던지...
그리고 recall이 중요한 문제, precision이 중요한 문제들이 각각 존재했고
(그 전에는 recall 지표만 보면 되는 것 아니야?라고 단순하게 생각하고 있었다.)
모델 성능 측정 시 accuracy만 보면 안되는 이유에 대해서도
더 확실히 알 수 있었다.
3. 파이썬으로 구현하는 머신러닝: 분류분석
https://www.codepresso.kr/course/65
코드프레소 "파이썬으로 구현하는 머신러닝: 분류분석" 강의에서는
Logistic Regression을 실습예제로 하여 강의가 진행되었다.
분류분석은 0과 1을 분류하는 분석이라고 보면 되는데,
이는 threshold 임계값(확률값)을 기준으로 0과 1을 분류하는 것이다.
그리고 confusion matrix
(accuracy, recall, precision, specificity; 1,2종 오류)와 같은 성능 지표를 보고,
또 TPR/FPR ROC 커브와 AUC 지표로도 성능 평가를 할 수 있다.
4. 파이썬으로 구현하는 머신러닝: 회귀분석
https://www.codepresso.kr/course/64
코드프레소 "파이썬으로 구현하는 머신러닝: 회귀분석" 강의에서는
Linear Regression
&
대표적으로 오버피팅을 방지할 때 사용할 수 있는 Ridge 나 Lasso로 실습하면서
Regularization 규제 내용이 포함되어 있다.
Ridge는 잔차제곱에 패널티를 주어 추정계수 영향력을 줄이면서 규제를 주는 것.
L2(제곱)를 쓴다. (정규분포)
Lasso는 잔차제곱에 패널티를 주어 추정계수를 0으로 수렴해서
feature select할 때 사용할 수 있다.
L1(절대값)을 쓴다. (라플라스 분포)
(패널티를 강하게 줄수록 - 큰 람다값 -> 분산이 줄고 규제를 강하게 준다라고 말할 수 있다.)
기초적인 머신러닝 회귀, 분석문제를 배울 수 있는
좋은 강의들이었다.
실제로 머신러닝이 분류문제와 회귀문제에 어떻게 사용되는지
직관적으로 알 수 있었고
코드 따라하며 실습해보는 방법으로
실제 모델을 돌리는데 큰 도움이 되었다!! :)
* 이 글은 코드프레소의 지원을 받아 작성되었습니다.