모델을 학습시키고 레포를 만들고 리더보드도 올려보고 하면서 원론적인 궁금증이 있습니다.

Ai 언어모델 로컬 채널

알림 알림 중 알림 취소

구독자 3312명 알림수신 163명 @바바리맨

제한없는 언어모델을 위한 채널

질문 모델을 학습시키고 레포를 만들고 리더보드도 올려보고 하면서 원론적인 궁금증이 있습니다.

뉴비챗

추천 2 비추천 0 댓글 6 조회수 480 작성일 2024-04-24 23:58:50

⚠️ 이 게시물은 작성자가 삭제할 수 없도록 설정되어 있습니다.

https://arca.live/b/alpaca/104504900

모델을 학습시키고 레포를 만들고 리더보드도 올려보고 하면서 원론적인 궁금증이 있습니다.

우리가 학습을 한다고 했을때

파운데이션 모델이 나올때마다 그 기본 성능이 올라가다보니 모델을 교체하면서

파인튜닝 작업을 해야하는데

여기서 A,B,C로 된 각자 다른 데이터 셋이 있으면 A만 하는거보다 B+C만 하는게 전체적 성능 향상에 도움이되는지?

그렇다고하면 데이터셋만 D,E,F,G 구해지는대로 족족 추가 학습하면 계속 선형적이진 않겠지만 품질이 올라가는지?

여기서 A데이터셋만 학습시켜

LLAMA3_A

B만 학습시켜

LLAMA3_B 뭐이런식으로 레포를 찍어내는게 무슨 의미가 있는지?

4. 또한 이미 학습을 잘시킨 모델 예를들어 EEVE같은데다가

A라는 데이터셋을 학습시켜

EEVE_A혹은

이름을 마음대로 바꿔 MYMODEL_A 라는 이름으로 레포를 만들어 배포하고

혹여나 리더보드에 올려서 테스트 데이터셋과의 궁합이 운적으로 너무 좋아 원본모델인 EEVE보다 더 좋은 평가를 받게

될수도 있을꺼같은데 이게 도대체 어떤 의미인지?

닉네임대로 뉴비챗이라 모르는것도 많고 말도 많네요...

댓글 글쓰기

ㅇㅇ (39.7)

2024-04-25 00:00:49 삭제 수정 답글

걍해보면암 ㅋㅋ

펼쳐보기▼

뿌리골무

2024-04-25 00:03:52 답글

질보단 양을 밝히는 대기업 취직에 도움됨.

펼쳐보기▼

maywell

2024-04-25 01:33:43 답글

그게 참 문제가 많습니다.

펼쳐보기▼

뉴비챗

2024-04-25 01:52:32 답글

4번 말씀이시죠? ..

펼쳐보기▼

maywell

2024-04-25 02:01:41 답글

요즘 의미없는 모델 공장이 너무 많이 돌아감

펼쳐보기▼

ㅇㅇ (220.78)

2024-04-25 03:37:39 삭제 수정 답글

*수정됨

제가 인공지능 학과로 이제 전과해서 더 자세한 지식은 아직 잘 모르긴 합니다만...
제 짧은 지식으로는
1. 정형화되고 중복된 데이터 같은 것들이 필터링이된 데이터가 많으면 좋다는 것이고
이게 또 학습 방식에 따라 어떤 모델을 만들려고 하는지에 따라 다릅니다
2. 데이터가 있는 대로 추가학습만 계속 한다고 좋은 것은 아닙니다만 완전 다른 새로운 데이터는 추가되면 좋을 수는 있습니다. 이것도 만들려는 모델에 따라서 다릅니다
3. 어떠한 분야에 특화된 모델을 만들려고 하는 것이 아닌가 하고 추측해봅니다
4. 원본모델에 추가적인 학습을 시키는 것을 fine tuning이라고 합니다 만 이경우 과적합 현상이 없고 새로운 분야 즉 데이터로 학습시킨 정보가 질이 좋다면 더 좋은 모델을 만들 수 있습니다.
정도인 것 같습니다.

그리고 실질적으로 같은 데이터라도 어떠한 환경에서 하는지에 따라 영향을 받고, 운도 존재하긴 합니다 만 같은데이터로 반복적인 학습을 하면 평균적인 데이터가 나올거라고 생각은 합니다

펼쳐보기▼