나를 찾아가는 길

[코드프레소 체험단] AI인공지능 트랙 후기 (5) 본문

Python

[코드프레소 체험단] AI인공지능 트랙 후기 (5)

ari950505 2022. 4. 5. 04:19

올해 1월부터 코드프레소 체험단에 선정되어

인공지능 트랙 강의를 수강하기 시작했다.

이번 코드프레소 강의에서는

자연어처리나 시계열 데이터를 처리할 때

많이 쓰는 RNN 모델에 대해 배워보았다.



8. 시계열 데이터 처리를 위한 RNN 완벽 가이드

https://www.codepresso.kr/course/62

 

시계열 데이터 처리를 위한 RNN 완벽 가이드

김지훈 강사 코드프레소 인공지능 대표 강사 전 LG CNS 데이터 엔지니어 전 Smilegate Stove 딥러닝 엔지니어

www.codepresso.kr

시계열 데이터 처리를 위한 RNN 완벽 가이드 강의에서는

RNN, LSTM, GRU 모델의 아키텍쳐 및 특성에 대해

이해하는 시간을 가졌다.

 

tensorflow, keras로 실습을 하는 내용도 포함되어 있다.

하지만...

사실 난 pytorch를 사용하고 있어서

실습 부분은 로직을 따라가는 정도로 진행해보았다.

 

RNN은 sequential 데이터를 분석할 때 사용하는데

주로 자연어 처리, 문장 처리, 음성처리,

시간에 따른 센서 데이터 처리,

주가, 부동산 데이터 처리

등 다양한 분야에서 RNN을 적용해볼 수 있다.

RNN의 데이터는

3차원(sample, step, features)으로 입력되게 되는게 

이 중 step은 시간을 나타내는 timestep을 입력하면 된다. 

 

그리고 RNN을 사용할 때, 

one to many

many to one

many to many 

각각의 다른 문제들을 만나게 되는데

one to many 의 경우 1개의 input data를 입력하면

여러 개의 output 이 나온다.

many to one은 2개 이상의 input data 입력 시

마지막 하나의 값이 output으로 나옴.

many to many는 2개 이상의 input data 입력 시, 

여러 개의 output이 나오는 문제. 

 

참고로 강사님께서 RNN을 사용할 때 항상 

input 이 몇개이고, output이 몇개인지

생각하면서 모델을 짜야한다고 하셨다.

 

강의를 열심히 따라가다 든 생각은...

 

딥러닝 좀 많이 어렵다...

수업을 듣고 들어도 이건 조금 어렵네...

후...

 

개인적으로 생각했을 때, 정확히 hidden layer 를 거치면서

데이터에 무슨 일들이 일어나는지 정확히 하나하나 알기 어렵다.

 

성능이 좋게 잘 나오니까, 또 비교적 큰 데이터의 labeling 작업을 대신 해주니까

사용하긴 하지만 설명력 부분은 아직 좀 아쉬운 것 같다. 

 

 

쨌든,

딥러닝이라는 것 자체를 이해하는데 좀 어려웠지만

자세하게 하나하나 설명해주는 코드프레소 강의 덕분에

LSTM으로 yahoo finance에서 불러온 시계열 데이터를 활용한

주가 예측 모델(many to many)을 만드는데 성공했다.ㅋㅋ

 

*해당 글은 코드프레소의 지원을 받아 작성되었습니다.

 

 

 

 

 

 

Comments