파인튜닝 자료를 만들때 우리 고전소설들을 영어로 일괄 번역해야 한다거나 영어로 쓰인 bbs자료들을 한글로 일괄 번역해야 할때가 있었는데요. 그래서 다른분들도 사용하기 쉽게 webUI로 만들어봤습니다.
현재는 한영<->영한 번역만 가능하고 .txt파일들만 번역할수 있습니다. epub번역 추가는 지금 작업하고 있습니다.
번역할 파일들을 추가한 후 번역하기 버튼만 클릭하면 번역해줍니다.
특징
자신의 컴퓨터에서 제한없이 한영-영한 AI 번역이 가능합니다.
- 일반 기계번역에 비해 품질이 훨씬 우수합니다.
- 여러 txt파일들을 한번에 번역해줍니다. 현재(24.03.20)는 .txt파일만 지원합니다.
- 번역문(원문).txt 파일과 번역문.txt 파일, 이렇게 두가지 파일로 출력됩니다. 번역이 이상할 경우 원문과 바로 비교할수 있습니다.
- 사용이 아주 쉽습니다. 번역이 필요한 파일들을 드래그한 후 번역 실행하기 버튼만 클릭하면 됩니다. 알아서 한
영 으로 번역해 줍니다.
- 번역 성능이 뛰어난 모델로 최신 업데이트가 가능합니다 - 현재는 가성비가 가장 좋아보이는 NHNDQ만 사용합니다.
번역 속도 비교
헤르만 헤세의 싯다르타를 번역해봤습니다.
사양 | 운영체제 | CPU | GPU | 문장수 | 걸린시간 |
---|---|---|---|---|---|
LG전자 2020 그램 17 | 윈도우10 | i7 (1.3GHz) | 내장그래픽 | 378KB 2577개 | 2시간 55분 24초 |
Mac Pro M1 | iOS | 10코어 | 16코어 | 54분 23초 (mps적용완료) | |
데스크탑 | Ubuntu22.04 | i9-13900k | RTX4090 24GB | 5분 25초 |
설치 및 실행
초보자라면,
- 압축 파일 다운로드 클릭
- 압축해제 후
- 윈도우 사용자는 start_windows.bat 더블 클릭
- 맥이나 우분투 사용자는 커맨드 창에서 sh start_mac.sh 실행
- 처음 실행이라면 프로그램을 자동으로 설치한 후 실행합니다. 이미 설치가 되었다면 바로 실행합니다.
고급 사용자라면,
- git clone https://github.com/vEduardovich/dodari.git
- cd dodari
- 실행하기
- 윈도우는 start_windows.bat 실행
- 맥, 우분투는 sh start_mac.sh 실행
첫 실행시 관련 프로그램 설치와 AI 모델을 다운로드 하는데 아주 오랜 시간이 걸립니다!
상세한 내용은 - https://github.com/vEduardovich/dodari 에서 확인하실 수 있습니다.