고객지원

© CLIEN.NET

모두의공원

GPT-4o-mini API 호출 겁나 싸네요.. 16

2024-07-19 13:57:10 수정일 : 2024-07-19 14:00:31 221.♡.2.209

유스튜

https://www.aipostkorea.com/news/articleView.html?idxno=2844

"경량 모델 중 가장 빠르고 저렴"…오픈AI, 경량 버전 'GPT-4o 미니' 출시

어제 GPT-4o-mini 가 출시됐습니다.

API용으로 출시가 됐는데요.

저도 데이터 전처리 하는게 있어서 비용이슈로 GPT-3.5-turbo를 사용해왔습니다.

대충 300번 API 호출에 2000원정도 쓰고 있는데요.

이걸 GPT-4o로 하면 10,000원정도 들었습니다.

4o-mini가 3.5 대비 60% 저렴해졌다길래 써봤는데

성능은 당연히 3.5보다 만족스럽고 속도도 빠른데 비용이 대박이네요..

290번 호출했는데요.. 80원정도 들었습니다... ㄷㄷㄷ

좀더 써봐야 정확한 비용이 측정이 될텐데 말도안되게 싸서 뭐지? 했는데

좀더 찾아보니..

GPT-4o-mini부터 SLM에 사용되는 양자화가 적용됐지 않을까? 추측중입니다

양자화는..

gpt-4o-mini의 토큰 비용이 저렴한 이유 중 하나는 양자화 때문일 수 있습니다.
양자화(Quantization)는 모델의 파라미터(가중치)를 더 작은 정밀도로 변환하는 기술입니다.
이는 모델의 크기를 줄이고, 메모리 사용을 감소시키며, 계산 속도를 높이는 장점이 있습니다.
양자화는 모델이 사용하는 숫자의 비트를 줄임으로써 이루어집니다.
예를 들어, 일반적으로 32비트 부동 소수점 숫자를 사용하던 것을 8비트 정수로 변환하는 것입니다.
이렇게 하면 모델이 더 적은 자원을 사용하고, 비용을 절감할 수 있습니다.
이 기술을 사용하면 성능 저하가 있을 수 있지만,
적절하게 적용하면 대부분의 경우 그 차이를 감지하기 어렵습니다.
따라서 양자화된 모델은 비용 효율적인 동시에 충분히 높은 성능을 유지할 수 있습니다.

라고 하네요 ㅎ

좀더 찾아보니 mini에 양자화가 적용됐다는 공식 문서는 없습니다. 아마 양자화 때문이지 않을까? 라는 추측입니다

유스튜 님의

SIGNATURE

15년의 영상 제작 경험을 바탕으로, 이제는 AI 컨설팅을 통해 콘텐츠의 확장을 고민하고 있습니다. 
바이브코딩과 AI 에이전트에 진심인 AI 컨설턴트입니다. https://uslab.ai

서명 더 보기 서명 가리기

댓글 • [16]

_explorer

·

미니만 따로 구독을 빼놓은건 아니죠?
저도 괜찮다는 평을 들어서 봤는데, 4o에 추가 비용만 저렴해 지는 건가요?

유스튜

·

@님 구독에 사용되는게 아니라 추가 API 호출에서 사용할 수 있습니다

꾸미루미

·

API 가격은 관심이 없었는데.. 바꿔 말하면 검색한 양 만큼 비용을 지불하는거네요.. 컴알못이라.. 그간 관심을 안가졌었는데.. 한 번 알아봐야겠습니다.

유스튜

·

@님 매번 반복되는 업무들 있자나요
예를 들어 고객 설문 자료를 분석 하려면 그걸 GPT 브라우저에 일일이 물어보기 힘드니 파이썬에서 API 호출로 반복작업을 해서 엑셀로 저장하는거죠.

그러면 1000명의 설문조사 데이터가 있으면 그걸 분석해서 엑셀로 저장할 수가 있는데
1명 분석할때마다 1번 질문을 해서 API 호출 1회가 적용되는거죠
1번 호출할때마다 대략 8원정도 들었는데.. 이게 이제 30번에 8원꼴이 됐다는 글입니다 ㅎ

꾸미루미

·

아 이해 했습니다. API 결제 하러 가야겠습니다.

그냥그런이

·

@유스튜님 와 이렇게도 쓰시는군요.
당연히 만족하시니 그렇게 하실것 같긴한데
실제 수동으로 할때 대비 만족 하시나요??

그시절그때

·

@유스튜님 아하...폼에다 붙여서 쓰시는 군요.

폼이 입력되면, api 불러서 요약하고, 그 다음에 구글시트에 저장하고 이런거죠?

근데, 요약이나 분석을 시키려면 파인튜닝을 따로 해야할 것 같은데요??? api가 파인튜닝도 지원하나요? 아님 그런거 없이, 매번 이렇게 이렇게 대답해줘...이런 식으로 파라메타를 길게 만들어서 넘기나요??

유스튜

·

@그냥그런이님 사실 파이썬 api 호출 이전부터 작년부터 설문조사 분류작업은 GPT로 계속 해왔습니다 ㅎ

설문조사 항목중 마지막 건의사항 혹은 기타 주관식 항목있나자요
이걸 카테고리로 분류하고, 부정적 피드백만 따로 분류하고
요긴하게 쓰고 있습니다

유스튜

·

@그시절그때님 파이썬에서 api 호출해서 씁니다.
구글시트에 GPT 익스텐션이 있어서 이걸로 해도 되는데.. 겁나 비싸더라구요;

회원님임

·

구글 젬미니에 비해 성능은 어떤가요?

유스튜

·

@회원님임님 제미나이는 아직은 많이 멀었죠. 제미나이 pro가 괜찮다곤 하지만.. 아직은 멀었습니다.

다만, 클로드3에서 프리뷰 기능으로 웹앱을 실행할 수 있는 기능이 생겼는데
구글클라우드 + 제미나이가 붙어서 바로 앱을 만들수 있게되면 개쩔지 않을까.. 기대중입니다

그시절그때

·

헐~~~ 장난 아니네요. 3.5 터보 성능도 그닥에 복잡한 거 시키자니 비싸서 안썼는데, 이건 어디 써먹을데 없나 생각 좀 해봐야겠네요.

근데, API를 주로 뭐에 쓰세요?

저는 조건에 부합하는 메일의 첨부파일을 읽어서 요약한 다음, 업무용 메신저에 noti할 때 쓰는데, 막상 한달에 열댓번이나 호출하더라고요.

유스튜

·

@그시절그때님 제가 요즘 관심가지는 분야가 데이터 전처리입니다.
회사에서 각종 자료들 엑셀에 취합하거나 모아야 하는 경우가 있자나요. 근데 포맷이 다 각기 달라서 써먹기가 힘든걸 하나의 형식으로 모으거나, 나중에 뽑아서 필요한 양식으로 조정한다거나 하는 식이요.

양식에 상관없이 알아서 분류 하는 작업이 딱일거 같아서 이쪽으로 작업중이에요

그시절그때

·

@유스튜님 아하~~ 비정형 데이터 처리에는 딱이군요. 아이디어 얻어갑니다. 감사합니다!!!!

업무진행상황을 gpt로 모니터링 한 다음에, 파이프드라이브 같은 SaaS에다 붙여서, 각 단계 이행여부를 자동으로 체크하도록 해도 되겠네요. 그러면 업무상 뭔가 빼먹은 것이 있는지, 다음 처리할 것은 뭔지...이런 거 한눈에 들어오겠는데요.

언어분석

·

api로 작업해봤는데, 성능 괜찮더군요.

성능을 굳이 판단하자면 3.5와 4o의 사이에 있는 거 같았습니다.

적당한 추론 능력이 필요한 작업이라면 괜찮은 거 같습니다.

삭제 되었습니다.

DocJK

·

오! 저도 API 도입 관련해서 한번 고민해 봐야 하겠네요.

이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고

개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책

© • CLIEN.NET

보안 강화를 위한 이메일 인증

안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
개인정보에서도 이메일 인증을 할 수 있습니다.

지금 이메일 인증하기

등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.