지금 칩도 새로워지고, 알고리즘이네 뭐네 어렵고 복잡해보이는 개념이 다수 등장하여 혼란스러울것입니다..
근 몇개월 뒤늦게 딥러닝, AI분야 기초 원리부터 독학으로 잡지식 잘 수집하면서
이제는
https://www.youtube.com/live/guP1HM2iTW0?si=dK3vLr-Y_zu8qg6W
이런 전문가들이 공부하는 채널에서도 용어 어느정도 이해해가면서 들을 수준이 되니깐, 완전 허구는 아니라는걸 실감하고 있답니다👶🏻
그래도 아직 저는 응애 수준이지만, 수학을 좋아하는 개발자라는 저만의 베이스가 있어서인지 깊게 팔수록 신빙성이 더해져만 갑니다..
맥락 파악이란건 도대체 원리가 뭐냐? 부터 파고들기 시작했었거든요.
앱을 만들면 만들었지, 코드 짜는거 말고도 더 알아야할게 있나? 싶어서 파고들었던 부분들이 알고보니
어릴적 포토샵의 매직봉 기능을 기원으로하여 배워뒀던 <그래픽스>라는 과목의 확장 개념으로 보이는 vision영역인 VLM을 처리하면서.. 누끼 따거나 경계 알아보는 기술의 수준에서 이젠 이 이미지의 벡터를 파악해 미리 움직일 모습을 그려보는 시뮬레이션까지 가능하기에..
veo 등의 영상제작에서도 뻥으로 영상을 만들 수 있다는걸 스스로가 증명되어 납득할 수 있었고.. 이 뻥을 만드는것을 보면서도 더이상 뻥이 아니란걸 실감중입니다.(?)
그리고 위 영상에서는 이제 대규모 모델을 다루는 기업들이 비디오 형태의 모델까지 관여하게 되는데,,
이 비디오는 우리가 찍는 비디오를 토대로 액션. 즉, 움직임만 뽑아 학습시키는 회사도 있고,
아예 비디오는 인간의 상상하는 개념으로 닥타 스트레인지 마냥 여러 경우를 미리 가짜영상으로 만들어보고나서 실행에 옮겨 스스로 학습하는.
이런 인위적 사고가 가능합니다.
다만 칩과 여러 한계 때문에 지금은 느릴 뿐.. 지금의 속도도 몇십초 정도여서 꽤 좋은 자료들이 믾이 보이고 있네요.