핫산 알파버전 작동하는지 테스트해보고 바로 올림, 다른 컴퓨터에서 동작하는지는 아직 테스트 못함.

가이드 따라서 5분 내외의 짧은 음성으로 테스트 해서 정상작동을 확인해주세요
https://mega.nz/file/VHd1xCYD#qUOxg7P0suzXQ8ZacM-y_anXQoOHLBCfqBSzkoW-gyg


사전 준비 

1. cuda download


cuda는 gpu 쓰게해주는건데 음성->대본 추출하는 코드가 gpu랑 cpu 속도가 엄청 커서 저렇게 cuda 12.1 설치해주는걸 추천함


2. deepl api key

https://www.deepl.com/translator

deepl 가입해서 api 키 발급 (해외결제 카드 필요, 요금 x) 받아줘야함, 무료 요금제 기준 달당 10만자.


사용법



사실 최근건 번역중인지 아닌지 뜨는데 직전버전을 올려버림;; 

작업이 끝나면 알림이 오게 만들긴 했는데 잘 작동할지는 모르겠습니다.


1. Add Files 
 mp3, wav, mp4 파일을 올릴 수 있음, 한번에 여러개 올릴 수 있음

2 Add Folder

 폴더를 올림. 번역할 때 폴더 안에 모든 음성파일들이 번역됨(폴더 내 폴더에 있는것들 포함)

3. Set API Key

 아까 발급받은 API Key를 여기 넣어주면 됨. 제대로 등록됬으면 바로 창이 닫히고, 다시 열면 입력했던 키가 있을거임

4. Run

 등록된 모든 경로에 대해 음성 -> 대본 -> 번역 -> 자막 작업을 수행함.

 등록된 폴더 내부의 모든 음성파일에 대해서 이 작업을 수행함.

 중복 경로(ex)D 드라이브, D 드라이브//동음)는 알아서 상위 경로로 병합해서 중복 번역은 안됩니다.



음성 추출 모델 medium이 부담 안가는 선에선 괜찮은 모델인데 써보면 은근 음성 시간대를 잘 못잡음..

실제로 들으면서 자막 싱크를 좀 바꿔줘야해서 귀찮은 정도로 잘 못잡음

글카 좋으신분들 large로 바꿀 수 있게 해오겠습니다. 오늘은 정상 작동되는지만 테스트하려고 올려봅니다.



---

배포가 너무 오래걸리는것같아서 다 지우고 최소한의 기능만 넣어서 배포 먼저 해보려고 합니다.


github로 어떻게 배포하는지 몰라서 압축해서 메가에 올린 병신임..

프로젝트 들어가기전에 좀 더 만들어오겠습니다.

제대로 실행이 안되면 알려주십쇼..