Whisper 구글 드라이브 연동과 옵션 설명 - 미치쿠사야/동인음성 채널

미치쿠사야/동인음성 채널

알림 알림 중 알림 취소

구독자 27295명 알림수신 380명 @자궁

Whisper 구글 드라이브 연동과 옵션 설명

도지도지

추천 6 비추천 0 댓글 4 조회수 987 작성일 2023-01-14 06:05:51 수정일 2023-01-15 03:32:38

https://arca.live/b/momoirocode/67474845

small이나 medium 모델은 집컴에서도 돌릴 수 있으니

기왕에 코랩 쓴다면 large v2 모델 추천하는데,

이게 시간이 제일 많이 걸리다 보니 저장이 끝까지 안되고 유실될 때가 종종 있어서

구글 드라이브 연동하는 방법 설명하고, 그동안 테스트해본 옵션도 가이드를 좀 써봤어
https://colab.research.google.com/drive/1qeTSvi7Bt_5RMm88ipW4fkcsMOKlDDss

일단 '연결' 눌렀을 때, GPU 백엔드로 할당되어야 속도가 보장됨

별다른 메세지 없이 연결되면 GPU 백엔드인 거고, 아래와 같은 메세지가 뜨면 할당량 다 써서 GPU 못쓰는 거야

할당량 다시 풀리는 걸 하루 정도 기다리거나, 다른 구글 계정 쓰도록.

GPU 백엔드 연결했다 치고, 구글 드라이브에 저장되도록 하는 방법을 설명할게

대본(자막)이 구글 드라이브에 저장되도록 하는 이유는, 이렇게 하면 여러 파일 처리할 때나 자리 비움으로 GPU 백엔드 연결이 끊겼을 때에도 파일이 구글 드라이브에 남기 때문이야.

코랩에서 다음 차례로 실행하면 됨.

1) 위스퍼 프로그램 설치

(처음 실행하는 경우, 구글에서 확인한 프로그램 아닌데 그래도 실행할 거냐고 물을텐데 Run Anyway 선택하면 됨)

실행이 완료되면,

2) 위스퍼 실행에 필요한 프로그램 설치

실행이 완료되면

얘를 실행하는게 아니라

더 스크롤을 내려서

3) 이쪽을 실행해서 구글 드라이브를 연결함.

연결하려면 해당 계정의 구글드라이브를 연결할 거냐고 물어볼텐데 전수 수락하면 된다.

또, 해당 구글 드라이브 들어가서 최상위에 Whisper 라는 이름의 폴더를 하나 만들어 둬야 저장이 돼. 이건 3) 실행 하기 전에 해도 되고, 실행한 후에 해도 되지만, 4) 실행하기 전에는 해둬야 함.

(이미 만들었으면 다시 만들 필요는 없음)

구글드라이브 연결 끝났으면,

4) 다음 명령 실행하고, public URL 뜨면 (URL은 실행할 때마다 달라짐) URL 클릭해서 쓰면 돼.

다음으로, 옵션 설명할게.

이게 기본 세팅.

VAD는 Voice activity detction의 약자인데, 음성이 없는 구간을 경계로 음성을 잘라서 처리하겠다는 얘기야.

none 이면 통으로 처리하고, 그 이외에는 아래 나오는 VAD - Max Merge Size 단위로 음성을 잘라서 처리함.

무식하게 딱 그 만큼씩 음성 파일을 잘라서 인식하면 대사가 잘릴 수 있는데(periodic-vad 선택하면 그렇게 됨)

기본 옵션인 silero-vad 에서는, 적당히 목소리 없는 구간 찾아서 잘라 처리해.

충분히 실험해봤지만, silero-vad 이외의 다른 옵션을 선택할 이유는 없는 것 같다.

VAD - Merge Window (s)
최소 이 시간 안에 있는 대사는 띄엄띄엄 간격을 두어 말하더라도 같은 줄에 있는 대사로 처리돼.
이 숫자가 짧으면 자막 나누는 개수가 늘어나고, 길면 전체 자막 개수는 줄지만 자막당 대사 길이가 늘어남

VAD - Max Merge Size (s)
앞에도 얘기했지만, whisper가 음성을 잘라서 처리하는 단위가 되는 시간이야.
짧게 두면 히어링 능력이 떡락하니 만지지 않는게 좋음

VAD - Padding (s)

자막 시작/끝 에 둘 여유 시간. 이게 길면 자막의 일찍 나오고 늦게 사라짐.

패딩 1초는 너무 긴 거 같아서 나는 0.3초 정도로 두고 쓰고 있어

VAD - Prompt Window (s)

이건 정확히 이해한 건지 좀 긴가민가한데,

대사 사이의 간격(무음)이 이 시간보다 길면 다음 자막으로 잘라서 처리하는 듯.

(Merge Window 이내에 있으면 자르지 않음)

숫자 1보다 작으면 쉼표나 마침표 처리가 잘 안되는 단점이 있으니 주의.

도움이 되길

댓글 [4] 글쓰기

LKM_

2023-01-14 06:07:01 답글

아무튼 정보추

펼쳐보기▼

rwr

2023-01-14 06:08:58 답글

다시 읽어보니까 Prompt Window는 위 정의가 맞는듯

펼쳐보기▼

백합외길인생

2023-01-14 06:54:38 답글

백합외길인생

2023-01-14 06:55:26 답글

요즘 이거에 관심 많은데 상당히 도움될듯

펼쳐보기▼

댓글 작성

업로드 중

0초

녹음 중지 삭제

글쓰기

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 만화핫산 음성핫산 리뷰 창작 정보 질문 대회 신문고

번호 제목

작성자 작성일 조회수 추천

생일선물로 야스다 야스를 주세요 [9]

릿카 2023.01.14 121 2

이런 알파메일들 오나홀인 여동생 내놔 [4]

비처녀순애 2023.01.14 222 1

오늘 수성의 마녀나 체인소맨 한번 1화만 봐봐야지 [13]

금요일밤 2023.01.14 89 1

크아앙 이사 싫어 [15]

키타산블랙 2023.01.14 125 2

아~할키스 달리고 싶다~ [4]

추적왕스토킹 2023.01.14 50 1

갑자기 네쿠라 땡기네 [4]

Ailkanoid 2023.01.14 64 2

그리고 사실 그때 신고로 보내봤던 글이 [8]

FreeTree 2023.01.14 141 1

일어나자마자 배아파서 기분애 나빠짐 [16]

흠실 2023.01.14 74 1

핫산조각 [RJ240137] 04 등을 씻겨드리겠습니다♪ [6]

유카눈나카노코눈나 2023.01.14 605 4

콘돔야스 [7]

키쿄우 2023.01.14 154 -1

아니 짤 안보냐고 [29]

Ailkanoid 2023.01.14 158 1

사실 딱한번 신고 해본적 있긴함 [9]

FreeTree 2023.01.14 129 1

핫산조각 [RJ240137] 03 방으로 안내♪

유카눈나카노코눈나 2023.01.14 389 2

수컷이 당하고 싶어하는것도 본능인가 [7]

짭쵸네코 2023.01.14 67 1

신고에 그냥이랑 및버거법 사유는 뭐임 [19]

금요일밤 2023.01.14 125 1

나 사실 게이임 [4]

Ailkanoid 2023.01.14 80 1

수컷의 본능인거같긴함 [3]

흠실 2023.01.14 77 1

동음에서 콘돔 섹스는 죄악 [13]

레이키라 2023.01.14 97 1

핫산조각 [RJ240137] 02 처음 뵙겠습니다♪ [2]

유카눈나카노코눈나 2023.01.14 354 2

무시무시한 악마 [2]

추적왕스토킹 2023.01.14 42 1

딱지는 신고 못해서 좀 슬픔 [6]

FreeTree 2023.01.14 71 1

Whisper 구글 드라이브 연동과 옵션 설명 [4]

도지도지 2023.01.14 988 6

데박...넘졸리내.... [3]

비처녀순애 2023.01.14 37 1

야 이 ㅅㅂㅅㅋ야 [2]

짭쵸네코 2023.01.14 42 1

아무도 날 이해모태 [3]

Gorillaz 2023.01.14 50 1

콘돔야스 할거면 모하러 동음들어 [1]

Liquidus 2023.01.14 182 2

메구가 떡있었으면 그냥그런망연작품1로 남앗을것 [6]

키쿄우 2023.01.14 106 1

이 시리즈도 괜찮은 듯 [5]

정신이상 2023.01.14 72 1

신고했어요 [4]

코야마하루 2023.01.14 53 1

사실 섹스를 안하는것이 좋은것이에요 [9]

FreeTree 2023.01.14 153 1

으엑 안성탕면 데박맛업서 [19]

동인음성 2023.01.14 83 1

이런여자애가 섹함뜨 하면 ㅁㅅ생각듬? [6]

Ailkanoid 2023.01.14 87 1

몇달만에왔는데 한국어동음나왔거나 나올예정인거이씀여? [2]

Ikaros 2023.01.14 309 0

충격 이 채널에는 그냥신고가 있다 [4]

짭쵸네코 2023.01.14 65 0

난 태그에 질내사정 없으면 안들음 [1]

흠실 2023.01.14 49 0

의외로 햄버거가 완전식품 아니엇음? [41]

금요일밤 2023.01.14 169 0

상남자가 되고싶다 [2]

릿카 2023.01.14 54 0

셀카찍음 [3]

아반떼 2023.01.14 57 0

계란만 머그면 영양소 부족해? [9]

CatHopping 2023.01.14 56 0

메구는 다른것보다 너무 길어서 ㅈ같음 [9]

금요일밤 2023.01.14 108 0

귀여움과 간지가 [6]

동인음성 2023.01.14 65 1

간지 귀여움은 중2병이 최고 아님? [4]

키타산블랙 2023.01.14 58 0

글쓰기

전체글 개념글