CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·MaClien ·방탄소년당 ·일본산당 ·개발한당 ·자전거당 ·이륜차당 ·소시당 ·AI당 ·패스오브엑자일당 ·안드로메당 ·나스당 ·클다방 ·바다건너당 ·걸그룹당 ·사과시계당 ·물고기당 ·전기자전거당 ·노젓는당 ·노키앙 ·가상화폐당 ·곰돌이당 ·윈폰이당 ·축구당 ·키보드당 ·리눅서당 ·IoT당 ·창업한당 ·소셜게임한당 ·여행을떠난당 ·골프당 ·콘솔한당 ·디아블로당 ·찰칵찍당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·날아간당 ·육아당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·냐옹이당 ·문명하셨당 ·클래시앙 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·개판이당 ·동숲한당 ·날아올랑 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·젬워한당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·어학당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·오른당 ·영화본당 ·MTG한당 ·소리당 ·적는당 ·방송한당 ·PC튜닝한당 ·그림그린당 ·소풍간당 ·심는당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·달린당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·나혼자산당 ·스타한당 ·스팀한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·터치패드당 ·트윗당 ·VR당 ·시계찬당 ·WebOs당 ·위스키당 ·와인마신당 ·WOW당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

사용기

서비스/SW 캐싱에 또 당했네 또 당했어...클로드 API를 걷어낸 이유 8

5
2025-12-17 18:30:10 수정일 : 2025-12-19 12:06:41 14.♡.43.15
Mr.UN

며칠 전 클로드는 캐싱 요금에 주의하지 않으면 파산한다는 글을 적었는데, 며칠 만에 그 사실을 알고도 당해서 클로드 API를 걷어내게 되어 글을 적습니다.

이것은 클로드의 Ai들을 API호출시의 문제로 개별플랜으로 이용시에는 해당되지 않습니다.


뭘 당했나?

11월중순까지의 메인은 클로드 MAX x20($200)플랜이었고, 11월 중순부터 여러 Ai들에 대한 API호출을 본격적으로 쓰기 시작했습니다. 그런데 11월28일에 간단한 테스트에 대해 30여분 만에 $10이 증발하는 경험을 하고는 캐싱정책을 확인해서 캐싱 관련 프로그램을 작성하여 적용해서 사용을 했습니다. 

image (6).jpg


12월16일에 클로드의 장점인 서브에이전트 호출과 스킬 펑션을 다른 Ai들에서도 범용으로 사용할 수 있도록 구현하는 작업이 있었고, 그로인해 모델별로 큰 부하를 걸어서 테스트를 수행했습니다. 


그리고 잠시후 앤트로픽에서 따릉~ 친절한 안내가 옵니다.  네 충전액이 바닥났어!


image (7).jpg

역시 클로드는 자동 충전으로 사용하면 파산한다는 사실을 재확인 합니다. (일반 플랜에서도 사용량 부족시 자동충전 버튼을 켜두시면 마찬가지 사태가 발생합니다.)



타사와의 비교를 해보겠습니다.(2025년 12월 기준)

구분 Anthropic (Claude) OpenAI (GPT-5.2 / o3) Google (Gemini 2.0/3.0)
캐싱 방식 수동 (Explicit) 완전 자동 (Implicit) 자동 + 수동 (하이브리드)
초기 비용 25% 더 비쌈 (Surcharge) 추가 비용 없음 추가 비용 없음
유지 시간 5분 (지나면 삭제됨) 약 1시간 (자동 관리) 약 1시간 ~ 무제한
할인율 90% (조건부) 50~90% (자동) 무료 ~ 대폭 할인
일반평가 "쓰기 까다로운 예민한 천재" "그냥 되는 놈" "가성비 괴물"


앤트로픽의 API호출시 실제 가격을 보겠습니다.

Model pricing

The following table shows pricing for all Claude models across different usage tiers:

Model Base Input Tokens 5m Cache Writes 1h Cache Writes Cache Hits & Refreshes Output Tokens
Claude Opus 4.5 $5 / MTok $6.25 / MTok $10 / MTok $0.50 / MTok $25 / MTok
Claude Opus 4.1 $15 / MTok $18.75 / MTok $30 / MTok $1.50 / MTok $75 / MTok
Claude Opus 4 $15 / MTok $18.75 / MTok $30 / MTok $1.50 / MTok $75 / MTok
Claude Sonnet 4.5 $3 / MTok $3.75 / MTok $6 / MTok $0.30 / MTok $15 / MTok
Claude Sonnet 4 $3 / MTok $3.75 / MTok $6 / MTok $0.30 / MTok $15 / MTok
Claude Sonnet 3.7 (deprecated) $3 / MTok $3.75 / MTok $6 / MTok $0.30 / MTok $15 / MTok
Claude Haiku 4.5 $1 / MTok $1.25 / MTok $2 / MTok $0.10 / MTok $5 / MTok
Claude Haiku 3.5 $0.80 / MTok $1 / MTok $1.6 / MTok $0.08 / MTok $4 / MTok
Claude Opus 3 (deprecated) $15 / MTok $18.75 / MTok $30 / MTok $1.50 / MTok $75 / MTok
Claude Haiku 3 $0.25 / MTok $0.30 / MTok $0.50 / MTok $0.03 / MTok $1.25 / MTok


동작은 어떻게 되는가?

5분짜리와 한시간 짜리로 입력이 가능한데, 5분의 경우 120% 가격을 지불하고 입력하며, 한시간 짜리는 200% 가격을 내고 등록해야 합니다. 그리고 이후 재입력을 하면 캐싱 해둔 내용분에 대해서 90% 할인을 적용합니다.

이 캐시는 정해진 시간 내에 호출이 없으면 날아갑니다. 따라서 제대로 쓰려면 캐시 등록을 한 후에는 4분30초 정도마다 핑이라도 한 번씩 날리도록 자동화를 해둬야만 최대한 이용을 할 수 있습니다. 앤트로픽을 하드하게 쓰는 개발자들은 심폐소생 스크립트를 씁니다. 

[Heartbeat 스크립트]

  • 로직: 백그라운드에서 4분 30초마다 앤트로픽 API에 아주 짧은 요청(예: "ping")을 자동으로 보냄.

    • 효과: 내가 딴짓을 해도 캐시가 죽지 않고 계속 살아있음.

    • 비용: 캐시를 유지하기 위한 'Read 비용'이 조금씩 계속 발생.


    ANTHROPIC_API_KEY가 설정된 상태에서 Anthropic.messages.create()를 타는 모든  호출에

      - cache_control(ttl="5m") 강제

      - anthropic-beta: prompt-caching-2024-07-31

      - 4분30초 keepalive  적용


그럼에도 선등록비가 크기 때문에 10회 재호출 해야 78%, 20회 재호출시 84% 전후의 할인율에 도달하게 됩니다.  구글과 오픈AI의 캐싱 기능은 cli종료시 레포트가 나오는데 구글의 경우 91~96%의 히트율을 보입니다.

gemi.jpg

사실 지금까지 앤트로픽의 MAX x20 플랜을 통해서 사용한 금액을 생각하면 API 에서 2회, 월렛기능 테스트에 1회 총 $30 정도를 예상하지 못 하고 당한것으로 큰 금액은 아닙니다만, API를 이용해서 연관된 서비스를 제공할 경우에는 단 한 번의 실수가 회사에 큰 손해를 입힐 수 있어서 남겨둘 수가 없다고 판단, 자동 캐싱이 적용되기 전까지는 클로드 전체 모델을 프로젝트에서 배제하기로 결정했습니다.


조사해보니 레딧 등에서도 원성이 자자해서 조만간 자동캐싱을 지원해주지 않나 기대는 하고 있습니다.


제미나이 3.0의 조사 보고

2025년 12월 현재 개발자 커뮤니티에서 매우 보편적이고 타당한 감정입니다. 실제로 레딧(Reddit)과 해커뉴스(Hacker News) 등지에서 "앤트로픽의 캐싱 정책은 설계 결함 수준이다"라는 성토가 이어지고 있습니다.

검색된 팩트와 여론을 종합하여 현재 상황을 정리해 드립니다.

1. 개발자 커뮤니티의 실제 반응: "가스라이팅 당하는 기분"

커뮤니티(r/ClaudeAI, r/LocalLLaMA 등)에서는 앤트로픽의 정책을 두고 **"기술적 오만(Technical Arrogance)"**이라 부르며 격앙된 반응을 보이고 있습니다.

  • "쓰기 비용 할증(1.25배)은 조삼모사다": 경쟁사(OpenAI, Google)는 캐싱을 '서비스 최적화'의 일환으로 보고 무료로 자동 적용해주는데, 앤트로픽만 이를 **"프리미엄 옵션 상품"**으로 팔고 있습니다. 처음에 웃돈을 얹어줘야 나중에 깎아준다는 논리는 2025년 시점에서 시대착오적이라는 평가가 지배적입니다.

  • "5분의 저주(TTL)": 5분이라는 짧은 수명은 인간의 대화 텀을 전혀 고려하지 않은 **"기계 중심적 사고"**의 결과물입니다. 화장실만 다녀와도 캐시가 날아가고, 다시 비싼 요금(Write 비용)을 내야 하는 구조 때문에 "사실상 할인을 안 해주겠다는 뜻 아니냐"는 비꼬는 반응이 많습니다.

  • 구현의 복잡성: 코드를 한 줄도 안 건드려도 되는 경쟁사와 달리, cache_control을 수동으로 삽입하고 바이트(byte) 수를 계산해야 하는 방식은 개발자들에게 불필요한 기술 부채를 강요하고 있습니다.




Mr.UN 님의 게시글 댓글
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [8]
프밍
IP 202.♡.163.210
12-18 2025-12-18 14:32:16
·
생각만 해도 아찔하네요. 캐싱은 컨텍스트 유지를 위해 필요한건가요?
Mr.UN
IP 14.♡.43.15
12-18 2025-12-18 14:54:13 / 수정일: 2025-12-18 14:54:29
·
@프밍님 네 반복 디버깅 등을 처리하는 경우에는 동일한 코드를 반복적으로 올리고 작업을 지시하게 되는데 이때 동일한 내용을 캐싱으로 처리하는 것입니다. 자동화 구현 난이도는 매우 낮은데도 의도적으로 번거롭게 만들어 둔 것입니다.
유스튜
IP 221.♡.2.209
12-18 2025-12-18 15:08:09
·



이제 이분과 같은 활용은 안되겠네요 ㄷㄷ
Mr.UN
IP 14.♡.43.15
12-18 2025-12-18 15:50:34
·
@유스튜님 MAX x20 플랜이 완전 무제한이던 시절에는 ide 만들어서 수십~수백개 에이전트를 동시에 굴려서 결과를 합치는 식(서브에이전트 기능이 그 당시부터 있었다면 그냥 서브로 호출)으로 무지막지하게 사용들 하셨던 모양입니다. 월 기준 빡세게 돌리면 제미나이 3로 100억토큰(캐싱분 제거시 8억토큰) 정도를 소모하니까, 클로드로 캐싱을 잘 구성해서 풀타임으로 돌리셨다는 이야기일까 싶습니다.
돈많은백수
IP 219.♡.186.169
12-18 2025-12-18 23:50:57
·
상당히 딥하게 쓰고 계시는군요!
클로드 서브에이전트와 스킬스를 다른 AI (gemini나 openai 모델들)에서 쓸 수 있게 구현하는 작업은 대략 어떤 방식으로 하셨나요? 저도 claude agent sdk를 헤비하게 쓰는 서비스를 개발 중인데, 비용이 만만치가 않네요... ㅠㅠ
Mr.UN
IP 14.♡.43.15
12-19 2025-12-19 12:02:23 / 수정일: 2025-12-19 17:29:41
·
@돈많은백수님 API로 호출시에는 멀티세션들을 완전히 격리해서 구동할 수 있기 떄문에 클로드의 구조와 동일하게 구성할 수 있습니다. 관리의 용이성을 감안하면 Aider와 같은 IDE를 하나 선정해서 사용하시면 쉽게 접근 가능합니다. 웹래퍼 등으로 MAX 플랜 등으로 API호출을 대체하도록 구성하시면 비용 절감에 도움이 되기는 합니다만, 공식적인 방법은 아니므로 판단은 스스로 하실 필요가 있습니다.
지니빠빠
IP 183.♡.210.193
12-19 2025-12-19 13:11:30
·
혹시 Cursor는 사용하시나요?
저는 Claude를 사용하는 것은 아니고.. Cursor에서 Auto 모드로 사용하고 있기는 한데..
코드 베이스 최적화 하지 않으면 Curor pro 요금제(20$) 는 금방 넘어 가더군요..
Mr.UN
IP 14.♡.43.15
12-19 2025-12-19 13:36:50
·
@지니빠빠님 AIDER 베이스로 오리지널 IDE를 만들어서 쓰고 있습니다.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.