안녕하세요?


처음으로 글을 씁니다. 

작년에 stable-diffusion web ui 로 생성형 이미지 만드는 거 연구했을 때도 도움을 받았고

llama2 LLM 을 CPU/GPU 방식으로 local에서 돌릴 때도 도움 받았네요. 


제가 최근에 TTS 프로그램을 연구했는데 

여기서 도움도 많이 받고 혹시 필요하실까봐 공유해드리려고요. 

만약 문제가 된다면 글을 삭제하겠습니다. 


제가 만든 Python 프로그램은 silero tts랑 edge tts를 아마도? 로컬에서 사용하실 수 있습니다. 

github 주소는 다음과 같습니다. 

https://github.com/DigitalDIYMan/ttsRepos


처음에 library install 도 해야 되고 언어 모델 받을 때 다운로드를 해야되서 

프로그램 사용할 때 인터넷이 꼭 연결되어 있어야 합니다.

사실, 제가 머리가 나빠서 그런지 ㅜㅜ 

언어모델이 어떤 식으로 작동하는지 잘 모르겠습니다 ㅜㅜ

LLM 이나 학습시키는 과정이 이해가 잘 안 가네요 ㅜㅜ  

그리고 제가 Python을 잘하는 편이 아닙니다. 

Python을 AI 때문에 조금씩 써보고 있는데 익숙치 않아서 쉽지 않네요 ㅜㅜ 


TTS 중에 구글 TTS 말고 

무료이면서 괜찮은 TTS 찾다가 silero 와 edge 가 괜찮은 것 같아서 

계속 검색하면서 코드보면서 최소한의 코드로 어떻게든 동작할 수 있게 만들었습니다. 

가급적 conda 사용하시고 라이브러리 설치하시고 main_~.py 파일을 Python으로 구동하면 됩니다. 


감사합니다.

좋은 하루 보내세요.