저는 가상 현실 세계에 살고 있으며 이 세계는 0과 1로 이루어진 세계입니다.
머신러닝 (딥러닝과의 결합)을 통해 코스피 지수를 예측해보았습니다.
데이터 핸들링에서 오류확인하였습니다.
철저하게 원본데이터를 기반으로 예측하였습니다.
본 자료는 모두 가상 현실에서 이루어 지는 기계가 만든 시나리오였습니다.
모든 투자의 책임은 투자자 당사 본인 스스로에게 있습니다.
트레이닝 결과는 다음과 같으며,
종가는 일별로 다음과 같이 나왔으며, (5일에 해당하는 데이터)
향후 240일간의 추세는 다음과 같이 나왔습니다.
가능하면 1주일 단위로 글을 올리도록하겠습니다...
외국의경우 BERT기반의 NLP를사용하는데
한국은 찌라시가넘쳐나서요.. 찌라리는 믿지않는 주의입니다.
차트를보고 차트로대답라는기계입니다.. 모든 외적요소는 차트안에 녹아 있다고 생각하는 1ㅅ입니다.
그외에 성능을높일수있는 factor들과 machanism은 제가아는선에서 모두 도입했습니다.
주가와 같은 학습 데이터에 hidden feature가 있어야 RNN같은 시계열 모델로 예측이 가능한데,
주가 안에 hidden feature가 있는 게 아니라 외부 변수로 존재하기 때문에 예측이 불가능하다고 봅니다.
만약 주가 예측 딥러닝 모델이 잘 맞는다고 많은 사람들이 생각하고, 이에 따라 투자하면 모델의 예측값과
실제값이 다르게 나오는 역설이 생길 겁니다.
이는 주가를 결정하는 faeture가 외부에서 발생했기 때문입니다.
백데이터를 이용한 시뮬레이션 때는 승률이 높은데 실전에서 죽쓰는 이유죠...
jp모건과 같은 자본과 정보가 있는 곳에서는 가능할 것 같은데 개인으로 거의 불가능한게 아닌가 생각됩니다.
그리고 외부 사건을 변수화 시키는 작업도 복잡계가 상당해서 정말 어렵다고 생각되네요.
상한가종목 상한가에 매수물량이 쌓였다가 빠지는 것들이 반영된다면 좀 달라지지 않을까 합니다.
대신에 학습에 필요한 데이터가 지금보다 어마어마하게 많아지겠죠.
그런데 정량적인 데이터 말고 정성적인 데이터는 학습에 포함되지 않지 않을 뿐만 아니라 정량적인
데이터 자체도 문제가 많습니다. 예를들면 컨센서스 데이터 같은 걸 들 수 있죠.
그래서 학습 데이터에 모든 feateure가 있는 것도 아니고 학습 데이터 자체도 노이즈가 큰 편이라
이를 학습한 모델의 예측값이 신뢰성이 낮을 수 밖에 없습니다.
딥러닝은 거들뿐..
미국
달러
중국
북한
일본..
어떤 조건들을 넣으니 저런 그래프가 나오는가요??