안녕하세요.


개인적으로 GPU 서버 대여해서, LLM 모델을 학습시켜보고 싶은데요.


데이터셋이 instruction, input, output 세트로 구성이 되더라구요.


instruction과 input 부분이 좀 헷갈리는데,


어떤 게 instruction으로 들어가고, 어떤 게 input으로 들어가야 되는 건가요?


예를 들어, 저는 법률 쪽 관련하여 질문에 대한 법률 전문가의 전문적인 답변을 하는 데이터 셋을 학습시켜고 싶은데


instruction으로 어떤 게 들어가야 하고, input으로 어떤 내용이 들어가야 하나요?