올해 안에 클로드코드, 코덱스 비용이 크게 증가할 것 같습니다. : 클리앙

고객지원

모두의공원

올해 안에 클로드코드, 코덱스 비용이 크게 증가할 것 같습니다. 18

2026-04-30 07:23:08 122.♡.126.253

MakingAlpha

오픈AI, 클로드코드가 서로 경쟁하면서 가격정책도 비슷하게 유지하고 있지만 두곳 모두 지속가능한 상황은 아닐 것 같습니다.

올해 안에 상위 요금제 기준으로 가격 상승이 크게 있지 않을까 생각됩니다. 100, 200불 기존 요금제는 유지하지만 토큰양을 줄이지 않을까 생각되구요.

저 개인적으로도 한달에 사용하는 AI 구독 요금이 60만원을 넘어가는데 사실 이것도 Codex Pro 요금제는 대란 때 사놔서 이정도지 그게 없었더라면 100만원을 넘어가지 않을까 생각되네요.

그래서 5090을 하나 사서 로컬 LLM을 굴리는 걸 진지하게 고민하고 있습니다. Qwen 모델이 꽤 괜찮은 것 같아서 우선 기획, 설계는 클로드코드가 하고 코딩은 Qwen이 하는 정도로 하면 1년 정도면 투자비 회수할 수 있을 것 같다는 생각이 드네요.

이래저래 AI 비용 고민이 커집니다.

MakingAlpha 님의

댓글 • [18]

김오간

구독료 인상전에 광고가 먼저 들어갈거에요.

MakingAlpha

@김오간님 개발도구에 광고가 들어가긴 힘들겠죠. 들어가도 크게 의미가 없을테구요

절자제

가격 상승 시키면 반대쪽에 유저가 몰리겠죠. 그리고 로컬 llm은 다들 시도해보고 포기한 사람이 꽤 있습니다. 성능차이 극복이 안 되서요.

MakingAlpha

@절자제님 아마 누구 하나가 먼저 요금제를 올리기를 기다리고 있을 것 같습니다. 따라서 올리려구요 ㅠ 저도 이전에 로컬 llm 몇번 테스트해봤는데 qwen 3.6 이후로 점점 특이점이 다가오는 것 같습니다.

천문공

5090은 ... 재고해 보세요.
32GB로는 쓰다 보면 부족하다 느끼실 것 같습니다.
업으로 쓰실 거라면 100B 정도 굴릴 수 있는 정도로...양자화 하면 용량이 55GB정도 될 것이고...통합메모리 96GB 또는 128GB정도 되는 제품으로 말입니다.

MakingAlpha

@천문공님 안그래도 엔비디아 스파크도 고민하고 있는데 대역폭 이슈로 속도가 느려서 고민입니다. 그 이상의 예산은 당장 쉽지 않아보이네요

쭈태공

비용은 개인적으로 내는 비용이신가요?

MakingAlpha

@쭈태공님 회사 계정과 개인 계정 동시에 사용합니다. 반반 정도네요

memories_

GPU 임대 서비스로 먼저 구축해 보고 로컬을 생각해 보시죠.
H100 같은 것도 맛보기로 시간당 몇 달러 선에서 써 볼 수 있으니까요.

유러스

가격떄문에 내가 구축해서 직접 쓴다 -> 노는 시간이 많습니다. 이건 AI 업체에서 서비스 안할 이유가 없습니다. 무조건 남으니까요.
현실적으로 내가 돌릴 수 있을만한 모델은 이미 서비스 중인 모델의 한단계 이상 낮은단계모델이 될 가능성이 큽니다. 사실 이런건 아무리 써도 리밋이 안됩니다. 그리고.. 품질때문에 못쓰는정도이기도 하구요.

MakingAlpha

@유러스님 당연히 프론티어 모델만큼은 성능이 안나오죠~ 제 요지는 고성능이 필요하지 않은 단순 코딩 작업은 로컬 llm에 맡기는게 비용 효율것 같다는 거에요~

SunB

혹시 하나 여쭤봐도 될까요?

저도 대란 때 200 불짜리 요금제 구매해서 사용했는데. 이제 그것도 다 사용해서 다음에는 + 요금제 구독 하려고 하는데 코덱스 사용량이 많이 줄어 드나요?

저는 개발자는 아니고 사무직인데 틈틈이 필요한 프로그램은 만들어서 사용하고 있어서요. ^^

MakingAlpha

@SunB님 저는 플러스 요금제를 사용해보지 않아서 잘 모르겠습니다;

가리가리곰

반대일듯합니다
토큰 비용은 계속 줄거라고 봅니다. 지금까지도 그래왔고. 당분간은 치킨게임 중이라 가격은 3-5년간은 가고. 고성능 컴퓨터와 최적화된 최신 알고리듬이 계속 나오죠.
비용이 느는건 사용량이 늘어서 비싸질뿐 그 자체는 계속 싸질듯합니다.
저도 ai비용을 고민중인데.
제미나이 울트라 쓰니. 저세상급 편안함. ㅎㅎㅎ.
로컬은 저도 고민해봤는데 돈이 문제가 아니라 생각보다 관리랑 고민할게 계속 생겨날듯 하더군요. 스파크도. 사실 단일 모델은 의미없고. 2-4개는 븉여야 유의미한 성능을 가지는거 같습니드. 그럼 4천정도인데. 문제는 서비스 없는 목적으로 사용하기에는 단가가 떨어지고. 팀이 사용하기에는 무리가 있죠. 결국에는 팀 요금제 클로드로 팀원들한테 뿌렸죠.

MakingAlpha

@가리가리곰님 제 개인적인 생각입니다만 현재 capex가 선행지표라고 본다면.. 지금 반도체 가격이 너무 올라버려서 쉽지 않아 보입니다. 전력인프라도 공급 부족이구요.
다만, 어느 정도 선에서 대중의 기대 수준을 충족시킨다고 하면 그때부터는 규모의 경제로 인해 가격이 내려갈것 같긴 합니다. 그치만 그게 언제가 될지는 모르겠습니다

하우디5

저도 궁극적으로는 비투비시장을 주요타켓으로 할것 같아요
즉 사람쓸래 ai쓸래
이 수준으로 가격이 맞춰질것 같아여

Mr.UN

Qwen 3 coder 를 3090에 올려서 2주 정도 여러가지 테스트를 해봤습니다만, 도저히 못 쓴다고 결론내고 GPT와 Opus만 사용합니다.
Opus조차도 환각으로 코드 품질이 안정되지 않아서 코드는 99% GPT에만 맡기고 있습니다. 비슷하게 보이면서 일단 동작하는 코드를 Opus도 Qwen도 뱉어내지만 이걸 상업 퀄리티까지 다듬는 시간이 새로 작성하는 것 보다 더 걸리기 일쑤이기 때문입니다.

겜광사랑

GX-10(DGX Spark) 구입하여 QWEN3 CODER NEXT (80B A3B FP8) 올려서 쓰고 있는데 상황에 따라서 프론티어 모델 대비 차이가 많이 납니다. 개인적으로는 CHAT GPT 2만 얼마짜리 요금제 구독해서 오케스트레이터, 아키텍처, 디버거는 GPT 5.4가 (5.5는 컨텍스트 버그가 있어서... --;) 실제 코드 짜는건 로컬 QWEN이 하고 있는데 CODEX 사용량 별로 안잡아먹고 꽤 그럭저럭 잘 돌아가고 있습니다.

4월 중순에 나온 QWEN3.6 35B A3B는 풀모델이 풀컨텍스크로 돌아갈 수 있어서 신나서 올려봤는데 추론모드 켜니까 추론하다가 코드를 못뱉고, 추론모드 끄니까 바보가 되서...... 여러번 갈아타려고 노력했는데 아직까지는 코더 넥스트만한 놈을 못찾긴 했습니다. 제가 가진 하드웨어에서 답답함 없는 속도가 나오면서(MoE여야함... 그것도 A3B 정도) 추론모드를 전제로 하지 않고 학습된 모델....이 없네요..

목록으로

글쓰기

이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고

개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책

보안 강화를 위한 이메일 인증

안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
개인정보에서도 이메일 인증을 할 수 있습니다.

지금 이메일 인증하기

등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.