그냥 토큰만 다르게 해서 동시에 학습시키면 프롬프트만 다르게해서 다른 그림체로 뽑히잖아

학습비용이나 시간을 생각해보면 이쪽이 훨씬 이득 아님?

원본 모델의 크기가 12gb가 넘는데 신경망 크기에 비해서 작은 데이터를 학습시키는건 시간을 낭비하는거 아닌가라는 생각이 들었음