팀장님이 영문 5500천자 정도 되는 회의록을 작성했길래 이걸 ChatGPT에 넣고 요약해달라고 했습니다. 다섯줄로 줄어들더라구요.
그닥 기밀 자료는 아니고 고객사는 화가 났다, 고객사는 우리 회사 물건을 더 구입할 예정이다, 잘 부탁한다 .. 대충 이런 메일입니다.
ChatGPT 성능이 꽤 괜찮은데요? 하면서 팀장님께 보여줬는데 ..
팀장 : 그런 회의록 같은거 함부로 ChatGPT 에 올리고 그러는거 아니야. 그 데이터를 OpenAI에서 기억해서 타사로 유출될 수도 있잖아.
저 : 그게... ChatGPT 는 클라리언트로 동작하는 방식이라 대화 나눈게 서버로 전송되지도 않고, Encrypt 되기 때문에 Client쪽에 있는 대화를 누가 접근할 수도 없는데요. 지금 세계에서 수백만명이 사용하고 있는 상황이라 그걸 데이터베이스화 할 수도 없습니다. 저장할 물리적 공간이 부족해요. 그리고 ChatGPT의 답변은 ChatGPT 는 Internet 상에 있는 문서들을 기반으로 학습한거고, 유저의 텍스트 입력을 통해 대답의 결과가 바뀌는 것도 (엥간한 노력이 아니고서는) 불가능해요.
팀장 : 그.. 키워드 같은걸로 저장할 수도 있잖아
저 : ...
OpenAI에서 공식적으로 대화의 내용이 수집되는게 아니라고 햇는데요 팀장님... ( 이라고 말하고 싶었지만)
알겠습니다. 했습니다. 뭐 팀장님이 하지말라면 하지말아야죠 하하하.
추가 : 아래 댓글로 많은 분들이 팀장님말이 맞다 서버로 전송된다고 하셔서 혹시나 해서 말씀드립니다만 기밀 내용은 사용하지 마시기 바랍니다 저처럼 생각없이 ChatGPT 쓰시면 큰일이 나실수도 있습니다 ㅎㅎㅎ
서버단에서 모든발화를 수집하여 처리하며, 로그수집후 활용 가능한데 현재 내부적으로 api 사용건은 활용을 안할 뿐입니다.
/Vollago
참고로… GPT inference에만 gpu v100 24개 정도 연산 성능이 필요해서 …서버사이드로만 처리 가능하다 보시면 될거에요.
저도 관련 업무를 현업 도입에 지원하려 노력하는 입장이라 이해는 갑니다… 이게 참 보안땜에 쉽지않네요 ㅠㅠ
Does OpenAI store the data that is passed into the API?
As of March 1st, 2023, we retain customer API data for 30 days but no longer use customer data sent via the API to improve our models. You can learn more in our data usage policy.
기업에서 언제 어떻게 수집할지 모르는 상황에서 외부유출에 민감한 자료는 조금 꺼려집니다.
open ai가 미국기업이 아니라 중국기업이라면 어떻게 하실건가요?
요즘보면 미국이나 중국이나 다 그놈이 그놈같아서...
기밀 자료는 안하는게 맞다고 저도 생각해요 ㅎㅎ
대화의 내용은 무조건 서버로 들어갑니다. 그리고 그걸 다시 학습의 자료로 사용할 것인지 아니면 로그로 남겨서 특이사항 등을 관찰하도록 할지 등은 일단 OpenAI에서 알아서 할 사항이겠구요...
기본적으로 그 정도 대화가 왔다갔다 해도 내용에 대한 로깅을 안한다는 건 말이 안되는 얘기죠
chatGPT 웹사이트만 봐도 예전에 내가 대화한 대화 세션들이 주욱 나열되어 있잖습니까? 그게 다 서버에 있는거죠
뭐, 세상일은 모르는 것이기 때문에 저도 가능하면 민감한 정보 등은 chatGPT에 올리지 않고 있습니다;;
https://news.nate.com/view/20230314n27493?mid=n0105
바닷가 모래밭에 단추 떨어뜨린걸 찾을 확률이 훨씬 높을 것 같아요
개인정보 등은 당연히 안되겠지만 민감 정보라... 기준이 모호하네요
그 언어모델로 중요한 걸 찾아내는건 일도 아니죠.
/Vollago
제 계정에서 얘기하고 친구 계정에서 관련 내용 알려달라고 했을 때 나오지는 않더군요
프롬프트를 더 한정지으면 될지 테스트 해봐야겠네요
만약 대화 내용까지 답변에 포함된다면 얘기가 달라지겠네요
그런데 그런식으로 따지면 M365야말로 훨씬 무서운거 아닌가요?
/Vollago
/Vollago
글 서두에 적은것 처럼 민감자료가 아니긴 했어요.
근데 Chat GPT 가 클라리언트에서 서버쪽으로 전송될 때, 가량 대화에서 주체 A, B, C 라는게 나오고 그게 서버쪽에서 연산할때, 이게 A가 뭔지 B가 뭔지 C가 뭔지 스태킹을 하기에는 OpenAI 가 감당하기에 너무 큰 데이터 량 아닌가요? 문득 궁금해지네요.
가령 철수가 영희랑 8월에 밥을 먹을 예정이야 근데 7000원은 좀 부담스럽대 ... 그럼 철수 A 영희 B 8월 C 7000원 D... 이렇게 해서 언어알고리즘에 따라 연관성을 추론해서 답변하는거잖아요.
근데 이걸 철수가 뭔지 영희가 뭔지 기억한다는게... (?) 상식적으로 불가능한거 같은데..
물론 농담이고 실제로 pdf 같은거 올리시면 큰일납니다.
좀 큰회사면 본인들이 구축하거나 외주 회사서비스 정식으로 들어올거에요. 기다려 보심이 ㅋㅋ
How to compose the email to the customer to say sorry nicely with "~~~" reason 하면 아주 기~~일게 잘 작성해주던데 요로케나 써먹어야겠네요. 회의록 요약은 셀프로...
특정 날짜 이전까지의 답변만 가능한 이유가, 기존 인터넷에 존재하는 문서 기반으로 특정 기간동안 학습시킨걸 토대로 답변하는거라서..
지금 ChatGPT를 사용하는 사람들이 온갖 괴랄한 질문들 다 던질텐데 이걸 다 저장할리가 없지 않을까요?
나 내일 프랑스 놀러가는데 4일 일정으로 여행 계획 짜줘... 이런거만 하루에 몇천건 있을텐데...
당장 다른 피씨에서 로그인해도 제 기존 대화내용이 다 나오구요....
경쟁사에 내용 노출은 극단적인 예시이겠으나 팀장이 그러한 우려를 표한것은 잘못되지도 않았고 잘 알지 못해 꼰대식 지적이라고 보기도 어려워 보이네요. 글쓴이 당사자도 처리 과정에 대한 인지 문제가 있었고요.
당장에는 팀장의 우려가 실현되지는 않겠지만 글쓴이가 잘못 알고 있던 것이 문제인 상황이라고 보여집니다. 어떤 다른 문제가 실제 존재하지만 그것 또한 잘못 파악하고 정말 사고가 났을지도 모르죠.
이것 관련해서 의혹이 있거나 법적공방이 들어가기만 해도, 회사 윗사람 중 누군가는
'내가 저번에 하지 말라고 한거 직원들에게 제대로 전달했어?'라고 나올 거니까요.
옳고 그름의 문제가 아닙니다.
회사에서 돈을 받는건 회사가 원하는 일을 해주기 때문에 받는 겁니다.
최소한 몰래 쓰세요.