싱크봇 스크립트 자동 생성 - 연동 오나홀 채널

일단 싱크봇 AI 애널라이즈 몇 일 써보면서 느낀 점 정리해봄

1. 2D, 3D, 실사 별 인식 정확도 차이

아무래도 초기 기술이다보니 인식 정확도가 일정치 못하고

요건 인식 못하겠지 하는 장면이 되는데

정작 이건 AI 잘 먹겠지 싶은 장면에서

자동 생성이 안되는 등 인식 수준의 큰 편차를 보이지만

평균적으로 2d와 3d보다 실사 쪽이 더 생성이 잘 되는 느낌이고

단순 스크립트 생성률 뿐만 아니라 기믹 활성화 정도에서도

실사 쪽이 눈에 띄게 높은 편인데

2d나 3d는 단순 스트로크 위주로 짜여지는 것과 달리

실사 혹은 그에 가까울 수록 스트로크 외에

회전이나 수축 기믹 활성도가 월등히 올라가

스크립트의 몰입감이 차원이 달라짐

2d나 3d여도 오버워치 sfm처럼 실사에 가까울수록 좋고

실사와 동떨어진 데포르메가 많이 들어간 신체나

도트 애니메이션 등일수록 정확도가 많이 떨어진다고 보면 됨

특히 야애니 쪽은 같은 제작사, 비슷한 그림체, 비슷한 구도여도

어떤건 진짜 기가 막히게 잘 되는데

어떤건 아예 통으로 생성이 안 되는 식으로

스크립트 생성률, 기믹 활성화 정도가 좆대로 좆대로의 끝판왕이라

실사보다 야애니 쪽을 더 선호하는 사람은 실망할 가능성이 높음.

2. 모션 외에 다른 요소들도 자동 생성에 영향을 미치는가

위에서 야애니는 자동 생성이 잘 안되고

되더라도 기믹 활성도가 크게 떨어진다고 했는데

야애니 원본 자체는 생성이 안 되도 같은 장면을 이용한

hmv는 또 잘 되는 경우가 많아서 좀 헷갈림

audio 베이스로 음악 비트에 맞춰지는 경우도 있고

action 베이스로 모션에 맞춰지는 경우도 있는데

이게 모션 외에 음성이나 bgm에도 영향을 받아서 이런건지

아니면 그런게 아님에도 hmv의 경우

보통 비트에 맞춰 영상을 제작하기 때문에

audio에 맞춰 생성된 것'처럼' 느껴진건지는 좀 더 봐야할 것 같음

+ 롱 테이크 방식과

앵글과 구도가 다른 여러 숏을 빠르게 교차 편집 하는 방식

당연히 둘 중 전자쪽이 더 인식이 잘 될 것으로 생각했으나

이 부분에도 나름의 손실 부분에 대한 보정이 들어가는 것인지

일단 인식만 되면 교차 편집 쪽도 꽤 괜찮은 재현도를 보임

자동 생성이 어떤 로직을 거쳐서 되는건지 조건을 찾으려고

이것 저것 다양한 영상을 시도해보고 있는데

이거 탐구하는 맛이 쏠쏠하다 ㅋㅋ

3. 분석 대상이 복수일 경우 어떻게 인식하는지

3분할 화면이나 난교 상황등

한 화면에서 분석할 대상이 복수일 경우

화면에 중앙에 가장 가까운 대상,

화면에서 차지하고 있는 비중이 가장 큰 대상 등

인식 우선 순위의 로직이 있을것으로 생각하였지만

그런건 딱히 없어보이고

걍 싱크봇 지맘임

펠라와 삽입을 동시에 하고 있을 때도

어느 쪽이 연동될지는 랜덤

4. 결합부나 스트로크의 범위가 잘 보이지 않을 경우 어떻게 인식하는지

개인적으로 정말 궁금했던 부분이였음

얼굴 부분, 흔들리는 상체 부분 등 신체 일부만을 클로즈 업 하여

대충 삽입 중이라는 것은 유추 가능하나 결합부가 안 보이는 경우나

남성이 여성을 몸으로 상당 부분 가리는 경우,

후배위 정면, 정후면 앵글 같이

성기의 스트로크 범위가 보이지 않고

골반 운동 폭도 미약하게 보여

움직임을 예측하기 힘든 경우 등등

결합부나 스트로크의 범위가 잘 보이지 않을 경우에도

일단 인식만 되면 상당한 스크립트 정확도를 보여주었음

단순히 성기 쪽의 움직임만을 트레이스하는게 아니라

사람의 몸을 정확히 인식하고 그 움직임을 모방하여

둘의 성기가 완전히 가려져 있거나

신체의 아주 극히 일부만 보이는 상황에서도

이게 야스 중인지 아닌지를 파악하여

생성해주는 것 같아보이는데

흔히 엑스레이 샷이라고 하지

남성과 여성의 신체 없이 쥬지가 질벽을 가르며

쑤컹쑤컹하는 장면만 크롭 되있어도

이를 허공에 쥬지를 흔드는 것과 명확히 구분해 내서

연동되는 걸 보면 똑똑한 것 같다가도

허공에 트월킹 박는걸 딜도 라이딩하는거랑

구분 못해서 그대로 연동하는걸 보면

멍청한 것 같기도 하고...

기술이 신기한건 맞는데 아직까지 완전하진 못한 것 같음

5. 삽입 외의 행위를 어디까지 인식하는게 가능한지

당연히 삽입만큼 인식율이 높지는 않지만

인식만 되면 스크립트 재현성도 높음

손으로 뷰지 쑤시기,

풋잡, 펠라, 파이즈리 등 삽입 외의 행위들도 나름대로 잘 인식함

스크립트 자동 생성이 안된 부분과 된 부분을 전체적으로 다 훑어보며

인식율이나 재현성, 어느 부분에 취약한지 등을 파악해야 하기에

더 자세한건 시간이 꽤 걸릴 것으로 예상되지만

궁금한건 도저히 참을 수 없는 성격이라

나의 평가는 계속 된다