페북에서 만든 라마를 개량한 알파카를 개량한 알파카-로라 를 사용해서 한국어로 학습시켜봤다.
이런 질문/답변으로 73000개정도 있는 데이터셋으로 학습시켜봤다
데이터셋 원본은 ai hub에 있고 질문/답변으로 개조한건 깃허브에 올려놓음
https://github.com/Ludobico/KakaoChatData
배치사이즈 256으로 학습시키려는데 vram을 30기가나 처먹어서 코랩프로로 업그레이드함
1 에포크당 6시간 정도 걸림
결과
고장났다 이기
---
출처: https://arca.live/b/characterai/72333379?target=all&keyword=%EC%95%8C%ED%8C%8C%EC%B9%B4&p=1