대충 NAI 이미지 AI 정보글 - 텍스트게임 채널

텍스트게임 채널

채널위키 알림 알림 중 알림 취소

구독자 15697명 알림수신 149명 @텍갤공지

텍스트게임에 관한 채널입니다.

정보 대충 NAI 이미지 AI 정보글

Airacomet

추천 28 비추천 2 댓글 14 조회수 5806 작성일 2022-10-03 16:41:52 수정일 2022-10-04 14:57:18

https://arca.live/b/textgame/59930920

폰 앱으로 간단하게 썼기에 부실한 내용과 가독성은 양해 부탁

1. NAI 이미지 AI가 정확히 뭐임?

원래 AI 던전같이 텍스트 소설을 쓰는 플랫폼인 Novel AI에서 최근에 새로 출시한 기능임.

아예 새로운 AI라고 알고 있는 사람도 좀 있을 텐데, 사실 스테이블 디퓨전이라는 기존 AI를 개조한 거임.

기능으로는 텍스트를 기반으로 이미지 제조, 이미지를 기반으로 비슷한 이미지 제조가 가능함.

2. 작동 원리가 뭐임?

사진 출처: https://youtu.be/J87hffSMB60

이건 디퓨전 계열 AI라면 다 동일한데, 처음엔 노이즈만 주고 점점 이미지를 뽑아가는 방식임.
이 과정에서 사용자가 준 키워드/텍스트가 들어가게 됨.

이런 특성으로 인해 노이즈값을 너무 줄이거나 하는 등 설정을 나쁘게 건드리면 머신러닝에 사용된 소스 사진이 그대로 나오는 등의 불상사가 생기니 주의해야 하고, 반대로 노이즈를 너무 늘리면 추상화가 나옴.

3. 이미지 제조 팁 같은게 있나?

태그는 사실상 단부루와 동일하니 넘기고, 노이즈는 위에 설명되어 있음

중괄호 {} 를 쓰면 그 키워드가 1.05배 강화되고, 대괄호 [] 를 쓰면 그 키워드가 1.05배 약화됨.
그리고 한 번만 씌울 수 있는 게 아니고, {{키워드}} 이런 식으로 괄호를 겹치면 겹칠수록 강해짐.
키워드를 배치하는 순서도 영향을 줌.

스텝 (step)도 중요한 요소인데, 위에서 설명한 이미지를 점점 뽑아가는 과정이 스텝임.
고로 스텝이 너무 적으면 노이즈에서 이미지로 가는 과정이 너무 짧아져서 저퀄 이미지가 나올 확률이 높음.

스케일 (scale) 은 AI가 사용자의 텍스트를 얼마나 참조할지 정하는 값임.
낮으면 AI가 좀 더 자유로워지지만 텍스트와 별 관련 없는 이미지가 나오고, 높으면 이미지가 너무 정형화되고 창의력이 없어짐.

스트렝스 (strength) 는 이미지 제조 과정에서 얼마나 변형을 넣을 지 결정하는 값임.
이것도 대충 스케일이랑 비슷하다 보면 편함. 주의할 점으로 높으면 높을수록 자유로워지고 낮으면 낮을수록 정형화됨.

혹여나 안 뜨면 enhance 버튼 밑에 magnitude에서 show individual settings 누르면 뜰 거임.

한 물체나 인물을 중심적으로 제조하고 싶다면, (대상) focus라 쓰면 됨.
예시: character focus, girl focus 등

모델로는 anime (curated), anime (full), furry 이렇게 3 종류가 있는데, curated는 엄선된 이미지로 찬 모델, full은 그냥 온갖 거 다 집어넣은 모델, furry는 말 그대로 퍼리 전용 모델임.

단, 무조건 curated 모델이 좋은 것도 아닌게 퀄리티 좋고 무난한 그림으로만 학습시켰다 보니 전체적으로 학습량이 부족함.

한마디로 야한 거나 마이너한 건 curated로는 잘 안 나옴.

Undesired content 는 사실상 필터 기능인데, 저퀄 그림이나 야한 거 제외시킬 때 씀.

대부분의 상황에선 모델을 full로 하고 필터로 저퀄 그림들을 빼는 게 좋음.

정해져있는 필터 바로 밑의 텍스트 입력칸에 태그 넣으면 그 태그가 들어간 그림은 배제되니 참고

고급 기능으로 | 가 있는데, 키워드|키워드 <- 이렇게 하면 둘이 밸런스를 맞춰줘서 한쪽으로 너무 쏠리는 걸 방지해줌.

아무리 해도 원하는 대상/장면이 잘 안 나온다 싶으면 스케치나 그림을 기반으로 AI가 제조해주는 기능을 사용하고, 상술한 괄호로 키워드를 강화하는 게 좋음.