웹에서 봐도 느리거나 먹통되는 현상을 보시면 일단 기기 성능에 의한 이유는 확실히 아닙니다. 안드로이드는 왜 괜찮게 비쳐지는지 잘 모르겠습니다만, LLM의 세션 구성이 겉보기와 다르게 꽤나 복잡한지 자주 꼬이는 것 같더라고요. 이건 언제쯤 자연스럽게 쇼업하도록 최적화될 수 있을 지 원.. Gemini는 훨씬 낫긴 하지만 그래도 가끔 먹통되구요. Claude도 자주 그러고..로딩이 느리거나 그런 적도 있고..그렇습니다. Perplexity의 경우에는 뭐 대화 세션 작살나는게 그냥 대수롭지도 않게 수시로 일어나고요..
제 개인적인 추측으로는 서버 자원 상 개개인의 대화를 GPU/TPU의 메모리에 늘 올려놓고 캐싱할 수는 없으니, 일정 시간이 지나면 언로딩했다가 사용자 요청이 있으면 GPU나 TPU에 로딩하면서 시간이 지연되거나 때로는 먹통이 되거나 그런 게 아닌가 싶습니다.
hstg
IP 118.♡.66.11
01-20
2026-01-20 18:35:46
·
@독고구패님 gpt의 설명은 웹은 전체 대화로그를 연산해야하는데 안드로이드는 적정 시점에서 끊어서 연산해서 차이가 있다고 합니다 윈도우 엡은 웹에서 사용과 본질적으로 차이가 없다고 하고요 쳇지피티 윈도우 사용성 개선이 너무 필요해요
새로운 댓글이 없습니다.
이미지 최대 업로드 용량 15 MB / 업로드 가능 확장자 jpg,gif,png,jpeg,webp 지나치게 큰 이미지의 크기는 조정될 수 있습니다.
안드로이드는 왜 괜찮게 비쳐지는지 잘 모르겠습니다만,
LLM의 세션 구성이 겉보기와 다르게 꽤나 복잡한지 자주 꼬이는 것 같더라고요.
이건 언제쯤 자연스럽게 쇼업하도록 최적화될 수 있을 지 원..
Gemini는 훨씬 낫긴 하지만 그래도 가끔 먹통되구요.
Claude도 자주 그러고..로딩이 느리거나 그런 적도 있고..그렇습니다.
Perplexity의 경우에는 뭐 대화 세션 작살나는게 그냥 대수롭지도 않게 수시로 일어나고요..
제 개인적인 추측으로는 서버 자원 상 개개인의 대화를 GPU/TPU의 메모리에 늘 올려놓고 캐싱할 수는 없으니,
일정 시간이 지나면 언로딩했다가 사용자 요청이 있으면 GPU나 TPU에 로딩하면서 시간이 지연되거나 때로는 먹통이 되거나 그런 게 아닌가 싶습니다.