https://huggingface.co/datasets/squarelike/ReverseProxy-OAI-Log


옆집 구경하며 모은 프록시 로그 정리했음

gpt3.5 45mb

gpt4 52mb


nsfw 채팅 다수 포함


비쿠냐형식 따라해서 이런 느낌인데..

중복은 최대한 제거했지만, 이걸 실제로 학습하려면 수정을 좀 해야함

라마 토큰제한 2k는 생각 안하고 만들기도 했고, system 메세지 어떻게 할지도 고려해야할듯



이런거 만들면 수상하게 돈이 많은 누군가가 학습해서 올려주겠지??