모델을 학습시키고 레포를 만들고 리더보드도 올려보고 하면서 원론적인 궁금증이 있습니다.
우리가 학습을 한다고 했을때
파운데이션 모델이 나올때마다 그 기본 성능이 올라가다보니 모델을 교체하면서
파인튜닝 작업을 해야하는데
1.
여기서 A,B,C로 된 각자 다른 데이터 셋이 있으면 A만 하는거보다 B+C만 하는게 전체적 성능 향상에 도움이되는지?
2.
그렇다고하면 데이터셋만 D,E,F,G 구해지는대로 족족 추가 학습하면 계속 선형적이진 않겠지만 품질이 올라가는지?
3.
여기서 A데이터셋만 학습시켜
LLAMA3_A
B만 학습시켜
LLAMA3_B 뭐이런식으로 레포를 찍어내는게 무슨 의미가 있는지?
4. 또한 이미 학습을 잘시킨 모델 예를들어 EEVE같은데다가
A라는 데이터셋을 학습시켜
EEVE_A혹은
이름을 마음대로 바꿔 MYMODEL_A 라는 이름으로 레포를 만들어 배포하고
혹여나 리더보드에 올려서 테스트 데이터셋과의 궁합이 운적으로 너무 좋아 원본모델인 EEVE보다 더 좋은 평가를 받게
될수도 있을꺼같은데 이게 도대체 어떤 의미인지?
닉네임대로 뉴비챗이라 모르는것도 많고 말도 많네요...