페북에서 만든 라마를 개량한 알파카를 개량한 알파카-로라 를 사용해서 한국어로 학습시켜봤다.




이런 질문/답변으로 73000개정도 있는 데이터셋으로 학습시켜봤다

데이터셋 원본은 ai hub에 있고 질문/답변으로 개조한건 깃허브에 올려놓음

https://github.com/Ludobico/KakaoChatData



배치사이즈 256으로 학습시키려는데 vram을 30기가나 처먹어서 코랩프로로 업그레이드함



1 에포크당 6시간 정도 걸림


결과




고장났다 이기


---


출처: https://arca.live/b/characterai/72333379?target=all&keyword=%EC%95%8C%ED%8C%8C%EC%B9%B4&p=1