100억토큰(캐시 전) 쓰고 한도가 얼마 안 남았었는데 목 요일 아침에 소들어왔네요...
어제 서비스 장애가 좀 보이더니 그 보상성 리셋인 듯 합니다.
---------------------------------------------------------
지금까지는 정확한 연속 측정을 안 하다가 /goal 명령을 이용해서 Codex 세션 하나로 일 주일 (6.5일)간 연속 작업을 시켜 보았습니다. 결과는 input 100억 token 오버....


GPT-5.5 Standard “long context” 요금으로, 캐시 없이 전부 일반 input 처리했을 때 를 기준으로 계산해보면,
(166 396 782 + 9 890 684 928) × 10 ÷ 1 000 000 + 23 350 531 × 45 ÷ 1 000 000
식은 이겁니다.
input 전체 = 166,396,782 + 9,890,684,928
= 10,057,081,710 tokens
long-context input 비용 = 10,057.08171M × $10
= $100,570.82
long-context output 비용 = 23.350531M × $45
= $1,050.77
합계 = $101,621.59 ($406,486 / 1개월)
----------------------------------------------------------
이것을 캐시를 적용하고 API 로 호출했을 경우의 비용은 다음과 같습니다.
공식 GPT-5.5 API 가격은 input $5.00 / 1M, cached input $0.50 / 1M, output $30.00 / 1M입니다. 즉 cached input은 일반 input보다 90% 할인된 별도 SKU입니다. 로그를 API 청구식 그대로 계산하면:
일반 input 166.4M × $5.00 = $ 831.98
cached input 9,890.7M × $0.50 = $ 4,945.34
output 23.4M × $30.00 = $ 700.52
---------------------------------------------
합계 = $ 6,477.84 ($26,000 / 1개월)
중요한 건 어디까지나 1세션의 토큰 소모량이라는 점입니다.
작정하고 3~4세션 정도 풀로 돌리면 GPT에서 캐시 적용하더라도 인당 1억/1개월은 거뜬히 나온다는 말이니까요.
캐시 비적용이 기본인 Opus를 무개념 또는 악의적으로 쓰면 인당 10억/1개월도 얼마든지 가능하다는 것이죠.
경영진은 회사 AI 담당자에게 잘 보이셔야 합니다.
이럴줄 알았으면 더 쓸걸…