Stackllama 라는 모델을 만들어 보는 (llama를 RLHF로 교육하는) 실습가이드 입니다 입문시에 공부하기 좋은 자료같아서 퍼왔습니다 https://huggingface.co/blog/stackllama *PEFT https://github.com/huggingface/peft