CLIEN

본문 바로가기 메뉴 바로가기 보기설정 테마설정
톺아보기 공감글
커뮤니티 커뮤니티전체 C 모두의광장 F 모두의공원 I 사진게시판 Q 아무거나질문 D 정보와자료 N 새로운소식 T 유용한사이트 P 자료실 E 강좌/사용기 L 팁과강좌 U 사용기 · 체험단사용기 W 사고팔고 J 알뜰구매 S 회원중고장터 B 직접홍보 · 보험상담실 H 클리앙홈
소모임 소모임전체 ·굴러간당 ·주식한당 ·아이포니앙 ·일본산당 ·방탄소년당 ·MaClien ·자전거당 ·안드로메당 ·개발한당 ·이륜차당 ·AI당 ·냐옹이당 ·소시당 ·오른당 ·소셜게임한당 ·와인마신당 ·위스키당 ·바다건너당 ·PC튜닝한당 ·클다방 ·스팀한당 ·패스오브엑자일당 ·노젓는당 ·나스당 ·어학당 ·걸그룹당 ·육아당 ·IoT당 ·날아간당 ·키보드당 ·리눅서당 ·찰칵찍당 ·달린당 ·가상화폐당 ·골프당 ·3D메이킹 ·X세대당 ·ADHD당 ·AI그림당 ·사과시계당 ·배드민턴당 ·야구당 ·농구당 ·블랙베리당 ·곰돌이당 ·비어있당 ·FM당구당 ·블록체인당 ·보드게임당 ·활자중독당 ·볼링친당 ·캠핑간당 ·문명하셨당 ·클래시앙 ·콘솔한당 ·요리한당 ·쿠키런당 ·대구당 ·DANGER당 ·뚝딱뚝당 ·디아블로당 ·개판이당 ·동숲한당 ·날아올랑 ·전기자전거당 ·e북본당 ·갖고다닌당 ·이브한당 ·패셔니앙 ·물고기당 ·도시어부당 ·FM한당 ·맛있겠당 ·포뮬러당 ·젬워한당 ·안경쓴당 ·차턴당 ·총쏜당 ·땀흘린당 ·하스스톤한당 ·히어로즈한당 ·인스타한당 ·KARA당 ·꼬들한당 ·덕질한당 ·가죽당 ·레고당 ·LOLien ·Mabinogien ·임시소모임 ·미드당 ·밀리터리당 ·땅판당 ·헌팅한당 ·영화본당 ·MTG한당 ·소리당 ·노키앙 ·적는당 ·방송한당 ·그림그린당 ·소풍간당 ·심는당 ·라즈베리파이당 ·품앱이당 ·리듬탄당 ·Sea마당 ·SimSim하당 ·심야식당 ·윈태블릿당 ·미끄러진당 ·축구당 ·나혼자산당 ·스타한당 ·파도탄당 ·퐁당퐁당 ·테니스친당 ·테스트당 ·빨콩이당 ·공대시계당 ·여행을떠난당 ·터치패드당 ·트윗당 ·창업한당 ·VR당 ·시계찬당 ·WebOs당 ·WOW당 ·윈폰이당
임시소모임
고객지원
  • 게시물 삭제 요청
  • 불법촬영물등 신고
  • 쪽지 신고
  • 닉네임 신고
  • 제보 및 기타 제안
© CLIEN.NET
공지[점검] 잠시후 서비스 점검을 위해 약 30분간 접속이 차단됩니다. (금일 18:15 ~ 18:45)

모두의공원

GPT-4o-mini API 호출 겁나 싸네요.. 16

4
2024-07-19 13:57:10 수정일 : 2024-07-19 14:00:31 221.♡.2.209
유스튜

https://www.aipostkorea.com/news/articleView.html?idxno=2844

"경량 모델 중 가장 빠르고 저렴"…오픈AI, 경량 버전 'GPT-4o 미니' 출시


어제 GPT-4o-mini 가 출시됐습니다. 

API용으로 출시가 됐는데요. 

저도 데이터 전처리 하는게 있어서 비용이슈로 GPT-3.5-turbo를 사용해왔습니다. 

대충 300번 API 호출에 2000원정도 쓰고 있는데요.

이걸 GPT-4o로 하면 10,000원정도 들었습니다. 


4o-mini가 3.5 대비 60% 저렴해졌다길래 써봤는데

성능은 당연히 3.5보다 만족스럽고 속도도 빠른데 비용이 대박이네요..



KakaoTalk_20240719_131638532.png


290번 호출했는데요.. 80원정도 들었습니다... ㄷㄷㄷ


좀더 써봐야 정확한 비용이 측정이 될텐데 말도안되게 싸서 뭐지? 했는데

좀더 찾아보니..


GPT-4o-mini부터 SLM에 사용되는 양자화가 적용됐지 않을까? 추측중입니다



양자화는..

gpt-4o-mini의 토큰 비용이 저렴한 이유 중 하나는 양자화 때문일 수 있습니다.
양자화(Quantization)는 모델의 파라미터(가중치)를 더 작은 정밀도로 변환하는 기술입니다.
이는 모델의 크기를 줄이고, 메모리 사용을 감소시키며, 계산 속도를 높이는 장점이 있습니다.
양자화는 모델이 사용하는 숫자의 비트를 줄임으로써 이루어집니다.
예를 들어, 일반적으로 32비트 부동 소수점 숫자를 사용하던 것을 8비트 정수로 변환하는 것입니다.
이렇게 하면 모델이 더 적은 자원을 사용하고, 비용을 절감할 수 있습니다.
이 기술을 사용하면 성능 저하가 있을 수 있지만,
적절하게 적용하면 대부분의 경우 그 차이를 감지하기 어렵습니다.
따라서 양자화된 모델은 비용 효율적인 동시에 충분히 높은 성능을 유지할 수 있습니다.


라고 하네요 ㅎ 


좀더 찾아보니 mini에 양자화가 적용됐다는 공식 문서는 없습니다. 아마 양자화 때문이지 않을까? 라는 추측입니다 

유스튜 님의 게시글 댓글
SIGNATURE
15년의 영상 제작 경험을 바탕으로, 이제는 AI 컨설팅을 통해 콘텐츠의 확장을 고민하고 있습니다. 
바이브코딩과 AI 에이전트에 진심인 AI 컨설턴트입니다. https://uslab.ai
서명 더 보기 서명 가리기
  • 주소복사
  • Facebook
  • X(Twitter)
댓글 • [16]
_explorer
IP 125.♡.67.3
07-19 2024-07-19 13:59:32
·
미니만 따로 구독을 빼놓은건 아니죠?
저도 괜찮다는 평을 들어서 봤는데, 4o에 추가 비용만 저렴해 지는 건가요?
유스튜
IP 221.♡.2.209
07-19 2024-07-19 14:00:04
·
@_explorer님 구독에 사용되는게 아니라 추가 API 호출에서 사용할 수 있습니다
꾸미루미
IP 211.♡.163.50
07-19 2024-07-19 14:06:29
·
API 가격은 관심이 없었는데.. 바꿔 말하면 검색한 양 만큼 비용을 지불하는거네요.. 컴알못이라.. 그간 관심을 안가졌었는데.. 한 번 알아봐야겠습니다.
유스튜
IP 221.♡.2.209
07-19 2024-07-19 14:08:53 / 수정일: 2024-07-19 14:09:23
·
@꾸미루미님 매번 반복되는 업무들 있자나요
예를 들어 고객 설문 자료를 분석 하려면 그걸 GPT 브라우저에 일일이 물어보기 힘드니 파이썬에서 API 호출로 반복작업을 해서 엑셀로 저장하는거죠.

그러면 1000명의 설문조사 데이터가 있으면 그걸 분석해서 엑셀로 저장할 수가 있는데
1명 분석할때마다 1번 질문을 해서 API 호출 1회가 적용되는거죠
1번 호출할때마다 대략 8원정도 들었는데.. 이게 이제 30번에 8원꼴이 됐다는 글입니다 ㅎ
꾸미루미
IP 211.♡.163.50
07-19 2024-07-19 14:11:39
·
아 이해 했습니다. API 결제 하러 가야겠습니다.
그냥그런이
IP 39.♡.24.106
07-19 2024-07-19 14:14:18
·
@유스튜님 와 이렇게도 쓰시는군요.
당연히 만족하시니 그렇게 하실것 같긴한데
실제 수동으로 할때 대비 만족 하시나요??
그시절그때
IP 1.♡.247.235
07-19 2024-07-19 14:16:43 / 수정일: 2024-07-19 14:17:09
·
@유스튜님 아하...폼에다 붙여서 쓰시는 군요.

폼이 입력되면, api 불러서 요약하고, 그 다음에 구글시트에 저장하고 이런거죠?

근데, 요약이나 분석을 시키려면 파인튜닝을 따로 해야할 것 같은데요??? api가 파인튜닝도 지원하나요? 아님 그런거 없이, 매번 이렇게 이렇게 대답해줘...이런 식으로 파라메타를 길게 만들어서 넘기나요??
유스튜
IP 221.♡.2.209
07-19 2024-07-19 14:18:57
·
@그냥그런이님 사실 파이썬 api 호출 이전부터 작년부터 설문조사 분류작업은 GPT로 계속 해왔습니다 ㅎ

설문조사 항목중 마지막 건의사항 혹은 기타 주관식 항목있나자요
이걸 카테고리로 분류하고, 부정적 피드백만 따로 분류하고
요긴하게 쓰고 있습니다
유스튜
IP 221.♡.2.209
07-19 2024-07-19 14:19:37
·
@그시절그때님 파이썬에서 api 호출해서 씁니다.
구글시트에 GPT 익스텐션이 있어서 이걸로 해도 되는데.. 겁나 비싸더라구요;
회원님임
IP 223.♡.87.217
07-19 2024-07-19 14:07:17
·
구글 젬미니에 비해 성능은 어떤가요?
유스튜
IP 221.♡.2.209
07-19 2024-07-19 14:10:53
·
@회원님임님 제미나이는 아직은 많이 멀었죠. 제미나이 pro가 괜찮다곤 하지만.. 아직은 멀었습니다.

다만, 클로드3에서 프리뷰 기능으로 웹앱을 실행할 수 있는 기능이 생겼는데
구글클라우드 + 제미나이가 붙어서 바로 앱을 만들수 있게되면 개쩔지 않을까.. 기대중입니다
그시절그때
IP 1.♡.247.235
07-19 2024-07-19 14:11:17 / 수정일: 2024-07-19 14:12:55
·
헐~~~ 장난 아니네요. 3.5 터보 성능도 그닥에 복잡한 거 시키자니 비싸서 안썼는데, 이건 어디 써먹을데 없나 생각 좀 해봐야겠네요.

근데, API를 주로 뭐에 쓰세요?

저는 조건에 부합하는 메일의 첨부파일을 읽어서 요약한 다음, 업무용 메신저에 noti할 때 쓰는데, 막상 한달에 열댓번이나 호출하더라고요.
유스튜
IP 221.♡.2.209
07-19 2024-07-19 14:16:38
·
@그시절그때님 제가 요즘 관심가지는 분야가 데이터 전처리입니다.
회사에서 각종 자료들 엑셀에 취합하거나 모아야 하는 경우가 있자나요. 근데 포맷이 다 각기 달라서 써먹기가 힘든걸 하나의 형식으로 모으거나, 나중에 뽑아서 필요한 양식으로 조정한다거나 하는 식이요.

양식에 상관없이 알아서 분류 하는 작업이 딱일거 같아서 이쪽으로 작업중이에요
그시절그때
IP 1.♡.247.235
07-19 2024-07-19 14:23:06
·
@유스튜님 아하~~ 비정형 데이터 처리에는 딱이군요. 아이디어 얻어갑니다. 감사합니다!!!!

업무진행상황을 gpt로 모니터링 한 다음에, 파이프드라이브 같은 SaaS에다 붙여서, 각 단계 이행여부를 자동으로 체크하도록 해도 되겠네요. 그러면 업무상 뭔가 빼먹은 것이 있는지, 다음 처리할 것은 뭔지...이런 거 한눈에 들어오겠는데요.
언어분석
IP 61.♡.173.21
07-19 2024-07-19 14:28:20
·
api로 작업해봤는데, 성능 괜찮더군요.

성능을 굳이 판단하자면 3.5와 4o의 사이에 있는 거 같았습니다.

적당한 추론 능력이 필요한 작업이라면 괜찮은 거 같습니다.
삭제 되었습니다.
DocJK
IP 121.♡.131.192
07-19 2024-07-19 23:28:15
·
오! 저도 API 도입 관련해서 한번 고민해 봐야 하겠네요.
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp
지나치게 큰 이미지의 크기는 조정될 수 있습니다.
목록으로
글쓰기
글쓰기
목록으로 댓글보기 이전글 다음글
아이디  ·  비밀번호 찾기 회원가입
이용규칙 운영알림판 운영소통 재검토요청 도움말 버그신고
개인정보처리방침 이용약관 책임의 한계와 법적고지 청소년 보호정책
©   •  CLIEN.NET
보안 강화를 위한 이메일 인증
안전한 서비스 이용을 위해 이메일 인증을 완료해 주세요. 현재 회원님은 이메일 인증이 완료되지 않은 상태입니다.
최근 급증하는 해킹 및 도용 시도로부터 계정을 보호하기 위해 인증 절차가 강화되었습니다.

  • 이메일 미인증 시 글쓰기, 댓글 작성 등 게시판 활동이 제한됩니다.
  • 이후 새로운 기기에서 로그인할 때마다 반드시 이메일 인증을 거쳐야 합니다.
  • 2단계 인증 사용 회원도 최초 1회는 반드시 인증하여야 합니다.
  • 개인정보에서도 이메일 인증을 할 수 있습니다.
지금 이메일 인증하기
등록된 이메일 주소를 확인하고 인증번호를 입력하여
인증을 완료해 주세요.