잘려다가 이런 생각이 들었습니다.


1.데이터 양보다 질이 중요하다면 이를 어떻게 얻을 수 있을까?

2.사실 우리는 하나의 AI에 너무 많은 것을 바라는 것이 아닐까?


1번에 대해서

제가 알기로 GPT는 GPT-1,GPT-2,GPT-3,... 이런식으로 만들어 진 것으로 압니다.

생산은 소비보다 오래걸립니다.

제가 지금 몇십분을 써서 쓴 글을 여러분들은 몇분이면 읽을 것 입니다.

검증은 생산보다 빠릅니다.

그러면 생산을 AI에게 맡기고 검증을 인간이 하면 어떨까요?

실제로 최근 이런 AI가 나왔습니다.


GPT-2로 데이터셋을 만들고 GPT-3를 학습시켰다면...?

그저 사람이 해야할 것은 검증입니다.

혹시 GPT-3.5를 공개한 것은 데이터 부족으로 인한 공개가 아니었을까요? 이런 생각도 들었습니다.


저는 이런 것을 제안합니다.

데이터셋을 만들어주는 AI를 만들어 이를 사람이 검증하는 사이트를 만드는 것입니다.

물론 이런 사이트는 많이 있습니다. 하지만 이 사이트는 한국어를 전문으로 하며 2번에 대한 고민을 해결할 것을 만들었습니다.


사이트의 처음 구상은 다음과 같습니다.

1.사람이 질문을 올립니다.

2.다른 사람은 의도,주제를 분류하고 이를 대답하는 질문을 가져오고 출처를 남깁니다.(상식이나 논문 내용을 가져올시에만)


이를 반복하여 데이터 셋을 만듭니다. 일종의 지식in 같은거죠

그리고 충분한 데이터셋을 만들면 질문은 사람이 하고 AI가 대답을 합니다.

사람이 할 것은 단지 수정입니다.


이제 2번 문제를 보겟습니다.


현재 AI는 하나의 모델에서 너무 많은 문제를 처리합니다.

사실상 AI하나의 모델에서 단순한 소설쓰기,글 요약,철학 질문...

이 모든 것을 하나의 모델에서 하는 것이 아닌 저는 다른 방식을 제안합니다.

각각의 전문 분야의 모델을 만드는 것이죠 일종의 AutoGPT라고 생각하면 됩니다.

소설을 쓰는 요청이면 해당 소설 작성 전문 모델로 갑니다.

글을 요약하는 요청이면 글을 요약하는 전문 모델로 갑니다.


이때 만일 여러가지의 요청을 동시에 해야 하는 경우를 위해 (문제 풀기 같은 요청)

해당 전문 모델을 전문적으로 조율해주는 모델을 만듭니다. 마치 회사같은 느낌이죠

협업을 해야하는 경우 팀장이 이를 조율하며

그게 아닌 경우는 각자가 할일을 하는 것입니다.

마치 사람의 뇌처럼요


이때 1번 이야기에서 나온 의도분류,주제 분류가 빛을 발합니다.

미리 질문에서 의도,주제를 분류해 해당 AI에게 보내는겁니다.

팀장은 조율하고 생산은 전문AI에게 하는 것이죠


그냥 끄적인 말인데...될지는 모르겟네요...

한번 적어본 말입니다. 한번 평가해주세요