안녕하세요 오늘은 오래간만에 저의 본분인 "게임개발" 에 관련된 사용기를 적어보려합니다.
다들 알다시피 요즘 워낙 많은 인기를 몰고 있는 ChatGPT..
저도 물론 사용해봤고, 그림그리는 쪽이나 기타 다른 툴들은 스터디도 해보고 온라인 세미나도 해보고..
열심히 사용 방법을 강구해보기도 했지만..
막상 가장 핫한 ChatGPT 는.. 써보니 신기하고 재밌긴 하지만.. 막상 어디에 써야 할지 몰랐습니다.
제가 요즘 핫한 인공지능 쪽은 흥미롭게는 보지만 사실 잘 알지도 못하고.. 관련 지식이나 경험이 부족한 상황입니다.
그러다 지난 3월.. 오래간만에 게임 개발을 해보기위해서 기획 파트를 맡아서 하는 팀원과 열심히 온라인으로 교류하면서
초기 기획 부분을 논의하다가..안타깝게도 기획담당자분의 개인 사정으로 팀에서 이탈을 하게 되면서 붕뜬 상황이 연출 되었습니다.
물론, 원래 하던대로 혼자서 기획과 초기 개발을 병행해도 될 정도의 간단한 미니 프로젝트였지만..
이게 오래간만에 협업하면서 기획을 하다보니, 이게 또 재밌고 그립더라고요?
그래서 한번 이 과정에 ChatGPT 와 함께 작업을 해보기로 마음먹었습니다.
방식은 다음과 같습니다. 일단 제가 설정한 간단한 게임 룰을 전달하고, 프로토타입을 제작하기 전에 ChatGPT 와 대화하듯이 게임 플레이를 해보면서, 수치나 밸런스를 검증해보고자 했습니다.
이번에 만들어볼 게임은 가위바위보와 비슷한 수준의 대결 1:1 pvp 라서 충분히 가능해 보였습니다.
먼저, 몇번의 삽질을 해보고 다음과 같이 룰을 정리해서 전달을 하자, 잘 정리를 해가며 잘 이해한 것으로 보였습니다.

그래서 제가 플레이어 A 를 하고 ChatGPT 에게 플레이어 B 를 부탁하고 턴제 게임을 진행해보자고 했습니다. 그리고.. 해보니.. 처음에는 곧잘 하는 것 같더니.. 어리버리 하기 시작하더군요.

자신의 턴이라는 것을 잘 이해하지 못한다던지, 갑자기 존재하지 않는 파라미터가 등장한다던지.. 정말 조금씩 어리버리하면서 진행이 되더군요..

딱, 전형적인 엄청 빠릿 빠릿하게 일은 해오는데... 영 어뚱한 대답을 가져오는 동료랑 일하는 느낌이었습니다.
먼저 제가 ChatGPT-3.5와 함께 삽질했던 내용은 아래와 같이 영상으로 제작해놨으니 재미있게 봐주세요. ( 재밌지만 속터짐 )
물론 제가 ChatGPT 를 잘 사용하지 못하는 부분도 있고, 명령을 내리는 부분을 개선하면 다른 결과가 나올 수도 있을 것 같아서 이후에 몇번의 시도를 더해보지만... 결과는 계속 비슷하게 나오더군요.
다른 능력자분들 보면 잘도 ChatGPT 와 같이 롤플레잉 게임같은걸 하시던데..
ChatGPT 가 결국 파일럿의 능력치나 사용 방법에 영향을 꽤 받는 것으로 보입니다.
분명 비슷한 수전의 테스크를 잘 하시는 분들이 계시니.. 저의 문제도 큰 것 같지만..
ChatGPT-3.5 가 부족해서 그런거라고 믿어보기 시작했습니다.
그래서 말로만 듣던 전설의 투명드래곤 같이 느껴지던 엄청나다던.. ChatGPT-4 를 사용해보기 위해서 ChatGPT-Plus 를 20달러를 결제해서 사용해봅니다.

일단 중간 결과부터 말해보면, 대 성공이었습니다.
ChatGPT-3.5 에서 진행이 안되던 어리버리함이 없어지고 엄청 똘똘하게 제 개떡같은 말을 찰떡같이 알아듣고 저와 티키타카를 하기 시작합니다.
물론 ChatGPT-4 의 제약때문에 답변은 더럽게 느리지만.. . 3.5때 원하는 게 안되서 엄청 답답하던 내용들이 해결이 되면서 신이 나더군요.

심지어는 이렇게 중간 과정 생략하고 결과만 보여달라는 명령에도 훌륭한 답변을 보여줍니다.
딱히, 최종 HP 를 출력하라는 주문을 하지 않았는데, 어찌 알아듣고 팍 보여주네요.

그 밖에도 위의 결과가 중간까지 제가 체크하던 수치랑은 다른 역전값이 나온거라 놀라서 이러한 결과가 어떻게 나왔는지 다시 물어보니 이를 잘 저장하고 있었는지.. 리플레이 처럼 보여주기도 하였습니다.. ( 그저 놀라움.. )
그러다보니 원래 처음부터 ' 가능했으면 좋겠다...' 했던 미션들을 주문하기 시작합니다.
바로 시뮬레이션 여부였죠.
저처럼 혼자 개발을 하다보면 지표등을 만들때, 이 수치가 올바른지 아니면 적절한지를 확인하기 위해서 모델을 만들고 프로토타입등을 제작해서 수치를 검증하는 과정이 필요한데.
아쉽게도 제가 머리가 좀 나빠서 수학적 모델을 잘 만들지도 못하고 ML 과 같은 좋은 기술들을 잘 활용할줄을 몰라서 매번 모델을 만들고 검증을 하느라 엄청 애를 먹는 편입니다.
그런데 나보다 수학도 잘하고 각종 모델들도 잘 활용하는 ChatGPT 에게 이 노가다 및 검증을 맡긴다면?
저와 같이 혼자 개발하는 1인 개발자에게는 정말 큰 도움이 될 것 같았습니다.
그래서 처음에는 100회 시뮬레이션 결과를 보여달라고 하니 떡하니 잘 보여주길래, 어느정도 유효성이 있는 수치로 보일 수 있는 10,000 회 시뮬레이션 결과를 보여달라고 하니 1초도 안되서 결과를 보여주더군요.

오오오.. 놀라웠습니다.
그래서 한술 더떠서 100만회 시뮬레이션 결과를 부탁하니 이번에도 1초도 안되서 답변을 해줍니다.
오오오오 보다는 여기서부터는 합리적인 의심이 들기 시작하더군요.. 엥? 100만회 연산이 바로 이렇게 된다고?

지금까지 너무 제가 원하는 결과치를 잘 보여주는 똘똘한 ChatGPT-4 였기 때문에.. 아직까진 신뢰가 컸지만..
그래도 저도 20년 가까이 개발업무등을 하면서 쌓아온 경험이 있기 때문에.. 뭔가 이상함을 감지합니다.
특히나 1만회 연산이나 100만회 연산에서 나온 수치의 결과 값이 소수점 둘째자리까지 모든 숫자가 동일한것은 보통 거의 안나오는 결과 값이기때문에.. 뭔가 잘못됐음을 감지합니다.
그래서 ChatGPT 의 장점. 그냥 바로 물어봤습니다.

두둥..
큰 배신감을 느꼈습니다.
이친구.. 엄청 뻔뻔하게 구라를 치네요. 그리고 해보라니 갑자기 혓바닥이 길어집니다.

와.. 각종 핑계를 대더니 1만회 연산도 한게 아니라네요.
와 진짜로 실시간으로 무섭기 시작했습니다.
내게.. 진실을 알려줘 ChatGPT..

갑자기 어느순간부터 이 친구가 이론적인 고려와 경험적인 분석을 이야기하기 시작하네요..
뭔가 말도 많아지고 그럴싸한 이야기를 많이하지만 알맹이가 없는 그런 이야기를 합니다..
그래서 구체적으로 이 친구의 주장의 근거에 대한 질문을 합니다.
" 이론적인 고려와 경험적인 분석이 도대체 뭐야? "

두둥..
정말 거짓말처럼 3시간 25회 제한이 발동되며, 저의 두번째 시도는 여기서 막을 내리게 됩니다.
농담이 아니라 실시간으로 테스트하면서 뭔가 롤러 코스터를 타는 것 같더군요.. 허허허허.
위 과정도 역시 영상으로 최대한 재밌게 정리해봤습니다. 관심있으시면 재밌게 봐주세요.
개인적으로는 저와 같이 ChatGPT 를 활용해서 게임 기획등에 활용해보고 싶으시면 봐보시면 좋을 것 같습니다.
그리고 전체적인 과정을 개인 블로그에도 정리해놨습니다.
https://www.soonsoon.co/post/dev/10595/
좀 이상한 결론이 나왔지만, 짧게 결론을 내보면 다음과 같은 것 같습니다.
ChatGPT -3.5 는 답변도 빠르고 무료로 사용이 가능하지만, 어느정도 간단한 질문이상의 깊이가 있는 미션은 제대로 이해를 하고 수행하지는 못하는 것 같습니다. 물론 하나하나 잘 가르키면 좀 나아지긴 하지만.. 그거 하다가 속터지는 일이 자주 생깁니다.
이와 다르게 ChatGPT-4 는 확실히 개선이 되어서 된 제품인듯 대화형 문장속에서 질문자의 의도를 잘 파악하고 상대적으로 놀라울정도로 일처리가 빠릿 빠릿하고 만족도가 높았습니다. 대신, 뭐랄까.. 너무 인간적인 평가이긴한데.. 너무 잘할려다보니 못하는 것도 할 수 있게 하는 현상이 여전히 두드러지게 나오는 것 같습니다.
따라서 차라리 어리버리한 ChatGPT-3.5 기반으로 일을 하면 초반부터 문제를 인지하고 다른 방법을 찾겠지만.. ChatGPT-4 와 함께 작업을 한다면 간단한 테스크에 대해서 일 처리도 놀랍고, 말도 잘하고 너무 뻔뻔할정도로 엘리트의 모습을 보여줘서 틀린 답을 이야기해줘도 관련된 경험이나 유사 경험이 없는 경우 ChatGPT-4 가 해주는 답변을 그대로 믿고 일을 진행하다가 큰 문제를 겪을 수도 있겠다는 생각이 들었습니다.
전체적으로 둘다 너무 현실에서 실제로 협업이나 회사생활, 조직생활을 하닥 한번쯤 만나봤던 인물을 보는 것 같아서.. 신기하더라고요..
ChatGPT-3.5 - 의욕도 넘치고 바로바로 부르면 오고, 충성 충성 모드로 일을 해오지만..결과물이 엉뚱하고 수준이 낮아서.. 계속 혼내게 되고 본인도 열심히 하고싶은데 맘대로 안되서 속상해 하는 스타일.
ChatGPT-4 - 실제로 실력도 좋고 어느정도 이해가 되는 업무에 대한 수행능력이 너무 뛰어나지만, 자존심이 쎄고 자신이 틀렸다고 잘 인정하기 어렵다보니 잘 모르는 분야가 나와도 일단 자신의 가정으로 해답을 내며, 결과가 틀려서 지적을 당해도 자존심이 쎄서 그런지 추가적인 부연설명을 하면서 자신의 행동을 합리화 하기 위해 주절 주절 말이 많은 스타일.
물론, 저는 반 재미로 했지만, 뭔가.. 많은 것을 깨달은 것 같아서
앞으로도 기회가 되면 ChatGPT 와 같은 인공지능 기술을 활용해서 저와같은 1인 혹은 소규모 개발자들이 활용할 수 있는 방법을 계속 연구해보려 합니다.
또 재미난 사용경험이 생긴다면 한번 공유해보도록 할게요.
긴 글 읽어주셔서 감사합니다.
인공지능 쪽은 잘 모르지만… 워낙 금방 금방 바뀌니
또 금방 개선 될지도 모르겠네요
/Vollago
저보다 똑똑할테니.. 수학도 잘할 줄 알았습니다 ㅋㅋㅋㅋ
문과형 인재군요.
오호 그런게 또 있군요 ㅎㅎㅎ
문과형인재인데.. 코딩은 잘하는.. 미래형 인재군요.
저는 뻔뻔하게 거짓말을 하는 Chat GPT 4가 더 미워 보이네요.
ㅋㅋㅋㅋㅋㅋㅋㅋㅋ 전 밉게보다는 너무 중간까지는 제 기대이상으로 잘해줘서.. 기대치가 높아졌다가..
갑자기 폭락한 기분입니다.
뭔가 제가 잘 몰라서 그런 것 같기도한데.. 신기하면서 두렵네요 ㅎㅎㅎ
아트직군이면 기획, 프로그래밍 몰라도 혼자서 퀄리티 좋은 게임 뽑겠다..싶더라구요.
빨리 알파고님을 모실 sdd를 사야겠습니다.
오호.. 개발에 사용하시군요?
전.. 아직 공부가 필요한 것 같습니다.
이친구는 프로그래밍 언어인 파이썬을 굉장히 잘하는 친구이니 그냥 파이썬으로 시뮬레이션 코드를 짜달라고 하셔서, 그 코드를 직접 실행하시는게 효율적이지 않을까 싶습니다. ( 물론 기본적인 수정은 필요합니다. )
막 자신감 넘치게 코드 주길래 오오오 하면서 해봤는데,
대부분 에러가 뿜뿜 하더군요.
역시나 어느정도 기반 지식이 있어야 잘 쓸 것 같아요.
그리고 환각 하기 시작 하면 let's think step by step이라고 이야기
해주면 귀신같이 멀쩡해집니다.
사용기 게시판에 쓸 정도는 아니라 모공에 쓰고 말았는데요.
https://www.clien.net/service/board/park/18006529CLIEN
조금만 복잡해지면 논리오류 뿜뿜하고 거짓말도 뻔뻔하게 잘 하지만, 구글링하기 애매하거나 찾기 귀찮은 것들을 단편적으로 물어보기에는 참 좋은 것 같아요.
빵터졌네요.
뇌가 아니라 혀.. ㅋㅋㅋㅋㅋ
저는 생각했습니다. 이제 논문은 한달에 한편은 쓰것다!
하지만 그 디테일하게 알려준 논문은 다 뻥이었습니다. 모두 존재하지 않는 논문이었습니다.
그 가짜 논문 중 한 논문의 저자는 제 석사때 지도교수님 이름과 같았기에 정말.. 기대를 했지만서도. 한편도 진짜 논문은 없었습니다.
우와.. 4 에서는 좀 개선이 되었다고 하는데.. 과연 어떨까 궁금합니다.
오 고견 감사합니다.
부족한 식견이 늘어나는 것 같습니다. 감사합니다.
확실히 접근법 자체가 잘못된 시도였던것 같네요.
다만, 언어모델이건 기계모델이건, 사용자 입장에선 뻔뻔하게 거짓말하는 장면이 나오면, 이런 모델에 대한 이해도를 바탕으로 업무를 하는 전문지식을 지닌 분들이 아닌이상 당연히 실망하게 되지 않을까요?
물론, 처음부터 아예 관련 전문가들을 대상으로 서비스가 나오던지, 아니면 처음부터 거짓말이 나온다는 전제로 알려져있거나 했으면.. 좀 다른 이야기 일 것 같습니다만..
일단은 현재는 사용자들이 알아서 판단하고 사용해야 하는 게 맞긴 한 것 같습니다.
감사합니다~!!!
그것도 해봤는데, 엄청 심플하게 만들어주네요..
확실히 제가 시도한 분야에는 적합한 모델은 아닌 것 같습니다.
Chatgpt가 모르는것이나 틀린것을 인정하지 않고 그럴싸하게 논리적으로 풀어 내는것은
고학력자(많이 배운)들의 인간에게 아주 흔히 있는 특징중 하나라는것이죠.
ㅎㅎㅎ
아무래도 자기 분야에서 특별히 성공하신분들, 특히나 학문적으로 성공하신 분들은 자신이 전공하지 못한 분야도 ' 나니까 ' 할 수 있다고 손쉽게 생각할 때가 있던데..
약간 그런 느낌이 아닐까 생각해봅니다.
가끔 덧셈 뺄셈도 틀리는 애에요.
으악 그렇군요 ㅋㅋㅋ
댓글들을 보면서 언어모델의 특화된 분야의 특징을 좀 이해하고 있는 것 같습니다.
이유는 없을 것 같아요…
ai의 사고 알고리즘이 너무 엉망진창인 느낌입니다.