모델을 학습시키고 레포를 만들고 리더보드도 올려보고 하면서 원론적인 궁금증이 있습니다.


우리가 학습을 한다고 했을때


파운데이션 모델이 나올때마다 그 기본 성능이 올라가다보니 모델을 교체하면서


파인튜닝 작업을 해야하는데


1.

여기서 A,B,C로 된 각자 다른 데이터 셋이 있으면 A만 하는거보다 B+C만 하는게 전체적 성능 향상에 도움이되는지?  


2. 

그렇다고하면 데이터셋만 D,E,F,G 구해지는대로 족족 추가 학습하면 계속 선형적이진 않겠지만 품질이 올라가는지?


3. 

여기서 A데이터셋만 학습시켜

LLAMA3_A

B만 학습시켜

LLAMA3_B 뭐이런식으로 레포를 찍어내는게 무슨 의미가 있는지?


4. 또한 이미 학습을 잘시킨 모델 예를들어 EEVE같은데다가

A라는 데이터셋을 학습시켜

EEVE_A혹은

이름을 마음대로 바꿔 MYMODEL_A 라는 이름으로 레포를 만들어 배포하고

혹여나 리더보드에 올려서 테스트 데이터셋과의 궁합이 운적으로 너무 좋아 원본모델인 EEVE보다 더 좋은 평가를 받게

될수도 있을꺼같은데 이게 도대체 어떤 의미인지?


닉네임대로 뉴비챗이라 모르는것도 많고 말도 많네요...