| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- Codepresso
- windowd
- notiondivider
- 유데미코리아
- 코드프레소체험단
- 노션활용법
- 인터넷강의
- vsdcode
- 머신러닝인강
- 노션구분선
- python설치하기
- 더미변수화
- beauify
- inlineequation
- statsmodels
- 파이썬
- ai인강
- 그리드서치
- 머신러닝
- 평생수강
- 인공지능공부
- 코드프레소
- vscode설치
- OneHotEncoding
- Python
- 딥러닝강의
- 코딩인강추천
- 머신러닝최적화
- 인공지능
- get_dummies
- Today
- Total
목록Python (39)
나를 찾아가는 길
https://m.blog.naver.com/sharp_kiss/221599009671 Preprocessing # 데이터프레임 생성 raw_data = pd.DataFrame(raw_data , columns=names) # 결측치 확인 sum(df.isnull().sum()) / len(df) # split names = '''해지여부 선호채널''' names = kor_col.split() #reset_index df= data.reset_index(drop=True).copy()/ set_index() # 2. survived 별 연속형 변수들의 기초 통계량 df.groupby('survived').describe() df.groupby('survived')['sex'].value_counts()..
올해 1월부터 코드프레소 체험단에 선정되어 인공지능 트랙 강의를 수강하기 시작했다. 이번 코드프레소 강의에서는 자연어처리나 시계열 데이터를 처리할 때 많이 쓰는 RNN 모델에 대해 배워보았다. 8. 시계열 데이터 처리를 위한 RNN 완벽 가이드 https://www.codepresso.kr/course/62 시계열 데이터 처리를 위한 RNN 완벽 가이드 김지훈 강사 코드프레소 인공지능 대표 강사 전 LG CNS 데이터 엔지니어 전 Smilegate Stove 딥러닝 엔지니어 www.codepresso.kr 시계열 데이터 처리를 위한 RNN 완벽 가이드 강의에서는 RNN, LSTM, GRU 모델의 아키텍쳐 및 특성에 대해 이해하는 시간을 가졌다. tensorflow, keras로 실습을 하는 내용도 포함되..
# for+if+else comprehension # y, y_pred 가 같으면 'True' 값 입력 df_concat['match'] = [ 'True' if df_concat.labels[i] == df_concat.label_answer[i] else 'False' for i in range(len(df_concat))]
특징: - 비대면 (비용절감, 효율성, 고객 눈높이에 맞춤. 심플, 간편, 저렴하게 고객에게 접근 가능해지는) - 기술, 개인화(위험을 좀 더 알 수 있음. 개인의 데이터에 맞춤형, 고객의 footprint 디지털 정보로 수집되고 프로세스화 되어가는 과정. ) - 다양성, 소액 보험 상품.
코호트 첫째, 코호트는 비슷한 시기에 태어나서 기존의 사회적 체계 안으로 들어와서 비슷한 생애주기 단계에 비슷한 역사적·사회적·문화적 경험을 하게 된다. 따라서 코호트효과는 개인의 생애사와 거시적 사회경제적 영향력과의 교차로 인해 형성된 경험을 반영한다. 종적 분석은 여러 개체를 여러 시점에 걸쳐 다양하게 비교함으로써 보다 풍부한 분석 가능 횡단면, 종단면, 종적 자료 패널 자료,시계열 자료 각각의 정의 정리하기 longitudial data 가 왜 더 현실적인지 보다 풍부한 분석이 왜 가능한지
DataFrame 랜덤 추출 방법 df.sample(frac=0.1, replace=False, random_state=2022) df.sample(n=5, replace=False, random_state=2022) frac 전체 행에서 몇 % 추출? [0,1] 값 입력가능 n 몇 개의 행 추출? ** frac 과 n 동시 사용 불가 replace =False default 는 중복 비허용 random_state 설정 시 결과 고정
import torch if torch.cuda.is_available(): device = torch.device("cuda") print(f'There are {torch.cuda.device_count()} GPU(s) available.') print('Device name:', torch.cuda.get_device_name(0)) else: print('No GPU available, using the CPU instead.') device = torch.device("cpu")
올해 1월부터 코드프레소 체험단에 선정되어 인공지능 트랙 강의를 수강하기 시작했다. 이번 코드프레소 강의에서는 머신러닝의 하이퍼파라미터 최적화 방법인 GridSearchCV & 더 나은 검증을 위해 활용할 수 있는 KFold 교차검증에 대해 배우고 실습을 해보았다. 7. 머신러닝을 위한 사이킷런 활용 팁 https://www.codepresso.kr/course/68 머신러닝을 위한 사이킷런 활용 팁 강의에서는 K-Fold 교차 검증 내용과 GridSearchCV에 대한 내용을 배웠다. 이해하기 쉽고 실습 부분도 하나 하나 잘 따라갈 수 있었다. 굿굿! K-Fold 교차 검증은 기존의 cross validation에서 말 그대로 K겹을 추가한 것이라고 볼 수 있다. 가장 보편적으로 사용되는 교차검증 방법..
올해 1월부터 코드프레소 체험단에 선정되어 인공지능 트랙 강의를 수강하기 시작했다. 이번 코드프레소 강의에서는 지도학습인 트리모델과 비지도학습인 PCA, LDA에 대해 배우고 실습을 해보았다. 5. 파이썬으로 구현하는 머신러닝: 트리모델 https://www.codepresso.kr/course/66 Decision Tree Ensemble(voting, bagging, boosting) Random Forest(bagging + random subspace) Decision Tree (Classifier & Regressor 둘 다 가능)은 분류문제 학습 시 성능이 좋게 나오고 해석이 가능한 모델이다. 이의 불순도 측정 지표는 gini 계수, entropy, misclassified error 가 있다..
Nomalizaion 정규화 sklearn -> nomalizer 정규화의 목적은 데이터셋의 numerical value의 범위 차이를 왜곡하지 않고 공통 척도로 변경해주는 것. mean값을 제거하지 않으면서 편차에 따라 척도 조정 (독립적 스케일링 진행.) feature 각각의 수치적 범위 차이가 클 때, 더 큰 값에 더 높은 가중치가 부여될 가능성이 있다. Since both the features have different scales, there is a chance that higher weightage is given to features with higher magnitude. This will impact the performance of the machine learning algorit..