Dynamic Thresholding DNA_2304pic Final Master

AI 반실사 그림 채널

채널위키 알림 알림 중 알림 취소

구독자 45059명 알림수신 886명 @탐6생활

📷 실사체 AI그림. 이게 그림이라고?

🎓 정보 Dynamic Thresholding DNA_2304pic Final Master

에스프레소크림

추천 80 비추천 1 댓글 61 조회수 17559 작성일 2023-03-05 08:12:48 수정일 2023-03-05 15:18:52

https://arca.live/b/aiartreal/71175496

추가 팁 Top percentile of latents to clamp(이게 진짜 팁임. 숨겨둬서 죄송.ㅎㅎ)

저번 글 이후로 게시판을 보면서 Dynamic Thresholding에 세팅 값을 쉽게 찾지 못하는 것 같아서
‘아~ 이건 객관적인 자료를 정리해서 올리면 AI 그림 유저분들에게 도움이 되겠다’라는 생각에 긴 시간을 투자해 자료를 모으는 도중 아주 큰 고민에 빠졌습니다.

제가 배우고 경험한 이미지(사진, 영상 등의 기본적인 것들)에 바라보는 기준과 게시글에 올라오는 DT(Dynamic Thresholding) 적용 그림들은 너무 달랐습니다.  저 번 글에 DT의 샘플 그림에서 색보정 잘 된 그림을 네모 표시하며 예를 들었는데 게시글에 올라오는 그림들은 과하게 색보정 된 그림들이 계속해서 올라왔습니다.

굳이 모른척 하고 넘어갈 수 있는 부분인데 괜히 내가 아는 부분에 대해서 ‘이게 맞는 것 같아요’라고 설명, 설득하는 것이 과연 맞을까라는 생각에 이 글을 작성하면서도 20번 넘게 지웠다 썼다를 반복하며 지금도 제가 생각하는 괜찮은 이미지의 개인적 기준을 들이대는 게 옳은가를 고민을 하게 됩니다. (굳이 논란을 만드는 성격이 아님)

그래서 ‘간단한 설명과 함께 테스트 자료만 올리고 끝내는 게 맞지 않을까’라는 생각이 계속 맴돌았습니다. 하지만 내가 배웠던 것에 지금까지 크게 이상한 점은 없었고 내가 생각하는 것과 의견이 다를 수 있어도 이 글을 보고 유연하게 받아들이고 혹은 도움이 된다고 생각하는 유저분들도 있을 거라는 생각에 마지막 정보글을 내 생각과 경험 그대로 전단하는 게 아름다운 마무리(?)라고 최종 판단을 했습니다.  

<속마음>

현 채널 뉴비님들의 상향 평준화와 고수님들의 신박한 아이디어로 채널의 그림들은 날로 좋아지고 있습니다. DT 적용 그림도 다양해지고 있고 색보정이 잘된 DT 설정값을 찾으면 훨씬 좋아질 것 같다는 생각과 함께 이 글을 시작하게 되었습니다.
어서 DT 잘 적용해서 야ㅉ 올려주세…퍽! 사실 이 글의 목적은 이겁니다.…
<속마음>

그렇기 때문에 이 글은 어떠한 강요(조금의 강요?…)와 정답이 없고 개인적 판단에 쓰는 것이기에 읽는 유저분들이 내게 도움이 되고 필요한 것만 얻어 가길 간절히 바랍니다.

이 정보글은 Dynamic Thresholding의 DNA_2304장을 정리한 자료입니다.

Dynamic Thresholding은 간단하게 설명하면 기존의 그림을 좀 더 풍부한 색으로 보정을 해서 만들어 주는 기능이라고 보시면 됩니다. (포토샵, 라이트룸 같은 보정 결과보다는 훨씬 못 미칩니다.)

DT는 사진으로 비교하면 RAW 파일, 영상으로 비교하면 Log 촬영 파일을 색보정을 해준 결과물이라고 생각하시면 됩니다.

DT는 피부 표현을 잘 해주지만 실사 그림에서 가장 우선 순위는 풍부하고 안정적인 색표현입니다.

모델이 발전하면 피부 표현, 질감 표현은 훨씬 좋아지더라도 색표현은 결국 사용자의 DT의 설정값이나 태그로 결정이 될 겁니다.
(어떻게 발전할지는 모릅니다. ㅎㅎ)

이 내용은 만화, 반실사 유저들 보다 실사 유저들에게 좀 더 좋습니다.
만화나 반실사는 색에 포용도가 넓어서 DT의 색보정이 이상해도 그렇게 어색하지는 않으니까요.

색보정 된 그림은 일반 그림 보다 훨씬 좋다고 말할 수 있으며 좋지 않은 경우는 단 하나 밖에 없습니다.

‘사용자가 색보정을 못 했다’

AI 그림에서 DT는 유저가 색보정할 필요가 없습니다.
색보정 된 수많은 그림중에 하나만 선택하면 됩니다.

즉, 그림색이 어색한 건 ‘사용자가 색보정 된 그림을 잘못 선택했다.(이쿠~)’ (초반에 설명드렸던 제 개인적인 판단입니다.)

여러분은 어떤 사과가 보기 좋고 맛있어 보이나요?

맛에는 개인적 취향이 있겠지만 보기 좋은 건 아마 대부분 2번을 선택할 거라 생각합니다.

자~ 그러면 범위를 좀 넓혀 보겠습니다.

여러분은 어떤 바나나가 보기 좋고 맛있어 보이나요?

보기 좋은 건 아마 대부분 6, 7, 8, 9 번이고 보기 좀 그런 것은 10, 11, 12, 13, 14, 15번입니다.
개인에 따라 11~15번이 맛있어서 선택할 수도 있습니다. 취향의 영역입니다.
그래서 DT의 색보정 잘된 6~9번 이외 취향의 영역인 11~15번을 선택할 수도 있다는 겁니다.
게시글은 취향의 영역인 11~15번이 꽤 올라오고 있습니다.(6~9번이 없는 게 아닙니다. 고수들이 얼마나 많은데 ㅎㅎ)

그렇습니다. DT는 이렇게 다양한 색보정 된 그림을 보여줍니다.
그 중에 맛있어 보이는 잘 표현된 그림을 선택을 하면 됩니다.

취향과 별개로 잘못 선택한 DT 그림의 예를들면

왼쪽의 백인 인어 공주가 나와야 하는데 DT 설정값을 못 찾거나 과하게 설정해 오른쪽으로 흑인 인어 공주가 나옵니다.
이것도 취향의 영역....일까....요.....(조심 조심)

과한 CFG의 오류는 백인과 황인이 흑인이 되거나 과한 음영이 생기거나 색감이 시체가 되거나 물이 빠지거나 의상의 본래 색이 없어 지거나 등등 많이 있습니다.

아니 그러면 내가 색과 색보정에 대해서 공부를 해야 하냐?

꼭 그렇지 않습니다. 위 사과, 바나나, 인어 공주처럼 그냥 봐도 좋아보이는 것! 쉽게 구별할 수 있습니다.

그런데 게시물의 어색한 색보정 그림들은 왜 계속 늘어날까요?

1. DT의 설정값의 결과의 표본이 너무 많습니다.

DT는 기본적으로 Mimic Scale Scheduler, CFG Scale Scheduler에 각 Constant, Linear Down, Cosine Down, Half Cosine Down, Linear Up, Cosine Up, Half Cosine Up, Power Up 이렇게 8개의 Scheduler가 있으며
CFG Scale은 1~30, 0.5 단위로 조절 Mimic CFG Scale은 1~30, 0.5 단위로 조절이 가능합니다.

가장 기본적인 수치만 계산을 하면
8*8*60*60 = 230,400 장의 결과물이 나옵니다.

거기에 Top percentile of latents to clamp, Minimum value of the Mimic Scale Schedule, Minimum value of the CFG Scale Scheduler, Power Scheduler Value 값 까지 계산하면 …

2. 230,400장 중에서 단 1장을 선택해야 합니다.

일반 유저들이 전부 테스트할 수 있는 범위가 아닙니다.
그렇게 때문에 대충 적당한 값 몇 개만 때려 넣어서 그림을 선택하다 보니 위 썩은 사과, 상한 바바나, 흑인 인어 공주를 나도 모르게(이게 맞겠지?) 선택하게 됩니다.

3. 혹은 다른 유저가 사용한 exif의 DT값을 그대로 사용하다 보니 내 모델과 셋팅값 테그에 최적화 되어있지 않아서 색보정이 어색한 그림을 사용하거나

4. 채널의 유저분들이 심성이 착해서 그림이 좋든 안 좋든 ‘추천’을 눌러주다 보니 ‘아~ 좋은 DT 그림이구나’라고 오해할 수도 있습니다.

실사 그림을 볼까요?

여러분을 선택하시겠습니까?

그나마 1번은 괜찮습니다. 1번을 선택하셨다면 눈썰미가 좋으십니다.

분석해 볼까요?

색의 차이가 보이죠?
이게 최고의 색보정은(포토샵, 라이트룸 등) 아니지만 AI 그림의 DT 세팅 값들 중에서는 최선의 색보정 그림입니다.
그 이상을 넘어가면 2번, 3번 같은 취향의 그림이 됩니다.

혹시 내가 이런 2번, 3번을 최종 그림을 뽑고 있다면 한 번쯤 값을 조절해서 맞추면 더 좋은 그림이 나올거라 생각을 합니다.

물론 HDR의 느낌을 원한다면 2번과 3번의 중간지점이나
아래 4, 5, 6에서 피부톤이 변화지 않는 선에서 채도를 높혀 HDR을 표현하는 세팅 값을 찾을 수 있습니다.(어렵습니다. ㅎㅎ;;)

본론으로 들어가서 DT 색보정 그림을 어떻게 선택해야 할까요?

오늘의 핵심! Dynamic Thresholding의 DNA 자료입니다.

DNA 테스트 세팅 값입니다.

<속마음>

너무 많은 양을 테스트 해야 해서 X/Y/Z에 CFG Scale을 사용하다보닌 Detection Detailer를 사용 못하게 되었습니다.
그런데 이게 '약간의 변수(ㅅㅂ)'가 있을 수 있다는 걸 자료 정리 마지막에 알게 되었습니다. ㅠ___ㅠ
그렇다고 처음부터 한 장 한 장 뽑을 수는 없고 DT 설명에 큰 문제는 아니기에 따로 설명을 드리겠습니다.
<속마음>

이 설정값으로 뽑았고 속옷만 입은 그림을 선택한 이유는 인물의 색 표현이 좋아야 전체적인 그림이 조화를 이룬다고 판단을 했습니다. (게시물 흑인, 시체 방지, 내 검정색 치마가 회색으로 표현 된다면 DT 설정 잘못)

각 Scheduler 교차 비교

가장 보편적인 중간값 CFG 7, 10, 15, 20, 25
Mimic CFG 5, 10, 15, 20, 25, 30를 교차 비교해서

8*8*36 = 2304장의 표본을 뽑았습니다. (장 당 2분 걸린 건 비밀)

살펴볼까요~ Scheduler 순서는 CFG가 메인이고 Mimic CFG입니다.
그래서 CFG - Constant, Linear Down, Cosine Down, Half Cosine Down, Linear Up, Cosine Up, Half Cosine Up, Power Up 순서로 교차 비교했습니다.

1. Constant-Constant

2. Linear Down-Constant

3. Cosine Down-Constant

4. Half Cosine Down-Constant

5. Linear Up-Constant

6. Cosine Up-Constant

7. Half Cosine Up-Constant

8. Popwer Up-Constant

9. Constant-Linear Down

10. Linear Down-Linear Down

11. Cosine Down-Linear Down

12. Half Cosine Down-Linear Down

13. Linear Up-Linear Down

14. Cosine Up-Linear Down

15. Half Cosine Up-Linear Down

16. Power Up-Linear Down

17. Constant-Cosine Down

18. Linear Down-Cosine Down

19. Cosine Down-Cosine Down

20. Half Cosine Down-Cosine Down

21. Linear Up-Cosine Down

22. Cosine Up-Cosine Down

23. Half Cosine Up-Cosine Down

24. Power Up-Cosine Down

25. Constant-Half Cosine Down

26. Linear Down-Half Cosine Down

27. Cosine Down-Half Cosine Down

28. Half Cosine Down-Half Cosine Down

29. Linear Up-Half Cosine Down

30. Cosine Up-Half Cosine Down

31. Half Cosine Up-Half Cosine Down

32. Power Up-Half Cosine Down

33. Constant-Linear Up

34. Linear Down-Linear Up

35. Cosine Down-Linear Up

36. Half Cosine Down-Linear Up

37. Linear Up-Linear Up

38. Cosine Up-Linear Up

39. Half Cosine Up-Linear Up

40. Power Up-Linear Up

41. Constant-Cosine Up

42. Linear Down-Cosine Up

43. Cosine Down-Cosine Up

44. Half Cosine Down-Cosine Up

45. Linear Up-Cosine Up

46. Cosine Up-Cosine Up

47. Half Cosine Up-Cosine Up

48. Power Up-Cosine Up

49. Constant-Half Cosine Up

50. Linear Down-Half Cosine Up

51. Cosine Down-Half Cosine Up

52. Half Cosine Down-Half Cosine Up

53. Linear Up-Half Cosine Up

54. Cosine Up-Half Cosine Up

55. Half Cosine Up-Half Cosine Up

56. Power Up-Half Cosine Up

57. Constant-Power Up

58. Linear Down-Power Up

59. Cosine Down-Power Up

60. Half Cosine Down-Power Up

61. Linear Up-Power Up

62. Cosine Up-Power Up

63. Half Cosine Up-Power Up

64. Power Up-Power Up

대충 보이는 특징을 살펴보면

1. 특정 CFG, Mimic CFG에 색보정이 잘 된 그림이 분포해 있다.
2. 색보정이 잘 된 CFG+Mimic CFG 최소값에서 Mimic CFG의 값이 증가해도 그림의 큰 변화가 없다.(색보정 잘 된 구간)
3. CFG의 수치가 증가하면 뭐든지 과해진다. 피부, 색, 근육, 나이,...

- CFG가 낮을 수록 피부가 매끄럽고 젊고 생기있어 보이며
- CFG가 높을 수록 피부 표현이 잘 되지만 얼굴의 피로도가 증가해서 나이가 들어 보입니다.

(주름이나 다크써클이 증가해서 나이가 들어 보임)

추가 - DT는 변태(?)라서 같은 수치의 CFG, Mimic CFG 에서도 조금씩 그림이 변한다. 엄청 민감하다.
이 민감함이 Detection Detailer 적용시 반응을 한다.(ㅅㅂ-초반글에서 말한 생각하지 못 한 변수)

가장 쉬운 색보정 그림 찾는 방법입니다.

1. 64개의 Scheduler를 마음에 드는 것을 1개 선택

- DNA 보면 필요없는 조합이 보입니다.

- 마음에 드는 조합 3개 정도는 꼭 테스트해보길 바랍니다.

2. 그러면 2304장이 -> 36장으로 줄어듭니다.

3. 얼굴 망가진 거, 원본에서 크게 벗어난 거, 흑인화, 시체색, 등등 제외 하면 색보정 잘 된 그림만 남습니다.
- 마음에 드는 것 10장 정도 픽!

4. CFG, Mimic CFG 값을 기준으로 다른 그림을 뽑아 봅니다.
- 그림에 따라서 색보정 되는 범위가 다르기 때문에 여러장 뽑아서 색보정이 잘 되는 교집합의 값을 찾으면 됩니다.

- 그러면 정말 괜찮은 그림만 남습니다.

5. 남은 그림들 중 1장(중간값)을 고르면 그게 최적화 된 DT 값입니다.

- 위 DNA 자료는 바질 믹스가 기준이긴 하지만 모델에 따라 색보정 값이 조금씩 다르기 때문에 마음에 드는 Scheduler를 선택해서 36장 정도 뽑아보고 위 3~5번 과정을 거치면 됩니다.

끝! 이게 다 입니다. 참~쉽죠?

이제 마지막입니다. 여기부터는 더욱 개인적인 경험과 생각입니다.

색에 대해 민감하지 않으면 위 DT 색보정 그림에서 마무리 하면 됩니다. 하지만 조금이라도 내 그림의 완성도를 높이고 싶다면 아래 내용을 읽으시길 강요(?)드립니다.

DT의 최대 활용법은 태그의 간소화입니다.
(동해물과 백두산이 마르고 닳도록~ 이젠 지겹습니다. 태그 간소화.)

‘AI 그림의 기준은 태그의 간소화’

이미 많은 유저분들이 태그를 간소화가 많은 변수를 줄일 수 있다는 것을 압니다.

변수를 줄인다는 것은 그 만큼 내 의도대로 표현할 수 있고 표현할 수 있는 폭이 넓어진다는 뜻입니다.

특히 ChatGPT 같은 서술형 문장은 많은 토큰을 사용합니다. 단어형 보다는 정확한 결과물을 만들어줍니다.
필요없는 토큰을 정리한다면 ChatGPT의 서술형이나 단어형에서도 좋은 결과물을 만들어 낼 수 있습니다.

우리가 기본 75토큰 내에서 태그의 순서나 가중치에 따라 그림이 변화는 걸 알 수 있습니다.

예) 10개의 태그가 있고 10/75 토큰이라면 가 태그마다 7.5%의 비율의 할당 명령을 받겠지만 순서에 따라 가중치에 따라 그 비율이 달라집니다.
자 태그가 늘어나서 100/150 토큰이 있습니다. 그러면 10/75의 태그와 100/150의 같은 태그의 할당 명령 비율은 같을까요?
다릅니다.

물론 10/75 태그가 적기 때문에 많은 정보가 없어서 표현의 정확도는 떨어질 수 있습니다.
내가 원하는 방향으로 75/75를 꽉 채운다면 다를 수 있겠죠.

많이 본 태그고 많이 사용하는 태그죠?
4K, UHD, ultra detailed, high detail, high quality texture, detailed beautiful delicate face, detailed beautiful delicate eyes, colourful, distinct_image, extremely detailed CG, (photorealistic, cinematic light:1.4),
realistic, (F1.4, 1/800s, ISO 100, photorealistic), Ray tracing, (face only:1.2), (ulzzang-6500-v1.1:0.8), (pureerosface_v1:0.4), (detailed skin:1.3),

DT 2304장에서 1장을 찾았는데 위와 같은 태그를 추가했더니 어라? 색이 망가졌습니다.?

다른 Scheduler, CFG, Mimic CFG 값을 조절 해서 찾아보지만 생각보다 시간이 많이 걸립니다.
계속해서 적당한 색보정값을 찾고있는데 어라? 아무리 찾아도 색보정이 제대로 된 그림이 없습니다.

자 이럴경우 어떻게 DT 적정 값을 찾고 최종 색보정 그림을 선택해야 할까요?
어렵죠.

자세히 설명을 해보겠습니다.
부정에 (low quality:1.5), (worst quality:1.5)가 있으면 더이상 퀄리티나 해상도가 부족함이 없습니다.
이건 이미 많은 유저분들의 검증으로 인해 기준값으로 자리 잡혀있습니다.

그러면 긍정의 8K, UHD 필요 할까요? 8K, UHD를 넣어서 해상도가 더 좋아진다?
이 태그가 적용이 된다면 퀄리티가 압도적으로 좋아져야 합니다. 그렇다면 4K가 아닌 8K 10K를 넣는 게 더 좋겠죠?
실상 결과물은 더 좋아지는 건 없습니다.

현재 512*512, 768*768 해상도로를 기준으로 뽑고 있습니다. 해상도가 작죠.
4K(UHD) 태그가 제대로 활용이 되려면 기본 해상도가 4K(3840*2160)로 되어야 변화의 폭을 체감할 수 있을 겁니다.

그래픽카드가 6090정도 시대에 가능할까요?(모릅니다)

그렇기 때문에 우리가 평소에 사용하는 해상도 관련 긍정 태그는 지금은 큰 효과가 없습니다.
만일 4090으로 기본 4K(3840*2160) 뽑아서 화질의 차이가 난다면 사용 가능하겠죠.
그런데 그렇게 뽑는데 얼마의 시간이 걸릴까요?

현재 기본 퀄리티와 해상도는 부정 태그 2개와 Hires.Fix 1.5~2배면 다 커버가 됩니다.
4K(UHD) 태그? 단지 토큰은 소모가 되고 태그로 인해 그림만 바뀝니다.

이런 태그들이 많습니다.

디테일 관련 태그는 하나 써도 충분합니다. 뭐~detailed, 뭐~ detailed… 토큰 낭비입니다.

그러면 DT와 연관이 있는 색에 관련 된 태크는

colourful, distinct_image, extremely detailed CG, (photorealistic, cinematic light:1.4),
realistic, (F1.4, 1/800s, ISO 100, photorealistic), (ulzzang-6500-v1.1:0.8), (pureerosface_v1:0.4), Ray tracing,
이 태그가 영향을 줄 것 같은데요. 가중치까지!

태그 순서가 바뀌어도 색이 바뀌고 가중치만 조금 바뀌어도 색이 바뀌는데 어떤 태그가 어떻게 색이 변화되고 추가 되는지 아시고 사용하시는 분 댓글로 설명 부탁드립니다.

과연 설명 가능한 사람이 있을까요?

내가 사용하는 태그를 검증하지 않습니다. 왜? 귀찮으니까요.
그냥 효과가 있겠지 하고 넘어갑니다.

애써 힘들게 찾은 DT값이 내가 정확히 모르는 태그로 인해 최종 그림의 색이 망가졌습니다.

DT는 게임으로 비교하면 전설급 장비입니다. (AI 그림에서는 공짜죠)
그런데 사용자의 캐릭터가 마법사인데 추가 스탯(태그)을 지혜와 마나가 아닌 힘과 스태미나를 찍어버립니다.
생각만 해도 어질어질하죠? 스탯 초기화나 캐릭터 삭제를 해야 합니다.

‘응~ 나는 힘법사가 좋아. 지팡이로 패고 다닐래~’
네. 이건 취향 존중해 드리지 않습니다.(ㅂㄷㅂㄷ)

글 서두에 설명을 드렸죠.

색보정 된 그림은 일반 그림 보다 훨씬 좋다고 말할 수 있으며 좋지 않은 경우는 단 하나 밖에 없습니다.

‘사용자가 색보정을 못 했다’

이 경우는 사용자가 DT값을 잘 찾았는데 알지 못하는 태그를 무분별하게 남용해서 어렵게 찾은 DT의 기능을 최대한 살리지 못 한 겁니다.

태그 모르고 썼는데 결과물이 괜찮다 -> 개이득
태그 모르고 썼고 DT를 썼는데 결과물이 괜찮다 -> 핵 개이득
태그 알고 썼고 DT도 알고 썼는데 결과물이 괜찮다 -> 안정적인 그림을 계속 생산. 뭘 뽑아도 성공할 사람

태그 모르고 썼고 DT를 썼는데 결과물이 안 좋다 -> 태그로 인해 썩은 사과, 상한 바나나, 흑인 인어 공주가 탄생을 한다면? 이 수많은 변수를 어떻게 수정하실 생각입니까? 물론 최악으로 표현되지는 않을 겁니다.

태그의 간소화는 태그를 적게 사용하라는 뜻이 아니라 불필요한 태그를 줄이고 나에게 필요한 태그를 채워서 내 의도에 맞게 표현하라는 뜻입니다.

그렇기 때문에 75톤큰이 넘더라도 나에게 맞고 필요한 태그를 넣으면 됩니다. 75토큰에 맞추라는 얘기가 아닙니다.

DT를 최대한 활용을 하고 싶으면 간소화 된 태그에서 색보정을 잘 된 수치를 찾는게 우선이고 그게 변수를 줄이는 방법입니다.

태그 간소화를 실제로 사용하는 유저분들은 많습니다.

그리고 DT 적용이 아니더라도 이미 몇 몇 게시물은 정말 엄지척한 결과물이 있습니다. #고수죠

(본인만의 간소화 방법과 필살기 태그들이 있을 겁니다.)

<말 많네... 안 읽어도 됨>
여담이지만 바질 모델에서 photorealistic 태그 예를 들겠습니다.

저는 DT를 접하고 태그를 간소화해서 기준값을 잡고 태그를 하나씩 추가할 때 교차 비교(태그 및 가중치 비교 포험)를 합니다.

이 태그가 정말 나한테 필요한가?
이 태그가 퀄리티나 전체적인 그림에 좋은 영향을 주는가?

자료는 지워서 없지만 이번 DT 테스트를 하면서 photorealistic 태그를 넣고(가중치 포함) 300장 넘게 뽑았는데 어떤 특정값에 그림의 한 부분이 ‘빛 덩어리가’가 생깁니다.

AI 실사 그림을 많이 뽑으신 분들은 한 번쯤은 경험해 보셨을 겁니다.

특정 부위에 색이 이물질이 낀 것 처럼 다르게 나타나는 현상

photorealistic가 전체적인 색 톤에 아주 조금 영향을 주는 것도 있지만 어느 한 부분이 랜덤으로 ‘빛 덩어리가’ 생기는 걸 확인을 했습니다.

쉽게 설명하면 휴대폰 화면에 랜덤으로 큰 덩이리로 불량화소가 발생한다고 보시면 됩니다.

그래서 변수를 차단하기 위해서 photorealistic 버렸습니다.

제 기준에 있으나 없으나 퀄리티 향상에 영향을 주는 태그가 아니기 때문입니다.

이런식으로 태그를 확인하고 원하는 방향으로 전체틀을 잡아갑니다.

<말 많네... 안 읽어도 됨>

물론 이렇게까지 태그를 분석할 필요는 없습니다. 너무~~~피곤하니까요. (무슨 부귀 영화를 누릴거라고…ㅎㅎ;;)

적당히 뽑고 적당한 선에서 보고 즐기는 게 어찌보면 좋을 수 있습니다. 하지만 기준값을 정하고 DT를 찾고 필요한 태그를 추가하면서 변수를 줄이고 만들어지는 최상의 그림은 그 나름대로의 보상이라고 생각을 합니다. (처음이 힘들 뿐)

저는 이렇게 태그를 간소화하고 추가하고 분석하는 과정에서 좋은 그림이 나와서 재밌고 이런 정보들이 정확한 것은 아니지만 공유를 해서 같이 AI 그림을 즐기는 분들에게 도움이 되면 더 좋지 않을까라는 생각에 하는 것이기 때문에 굳이 저 처럼 이렇게 무식하게 안 하셔도 됩니다.

꼭 하고 싶다면 태그 하나씩 하나씩 쌓아가면서 만들 그림의 필요 태그를 찾기만 해도 됩니다.
(교차 비교, 가중치 비교 까지는 정말 피곤하고 힘드니까 진짜 하지마세요!!)

DT DNA+DT 태그 간소화 팁은 간단한데 너무 길게 적었습니다.

총 정리

1. 내가 사용하는 설정 기준값 정하기

2. 기준값과 간소화 된 태그에서 DT 색보정 값 찾기(DNA 참고)

3. 2번에 태그를 추가 하면서 색이 너무 틀어지지 않게 필요한 태그들로 정리하기

4. 최종 정리 된 DT와 태그에 Hires.Fix + DD 적용해서 뽑기

5. 내 최선의 최고의 그림 탄생

6. 서로 서로 정보 공유하기 (중요 중요)

개인적인 생각과 경험이 담겨있어 읽으시면서 어떤 부분은 본인과 맞지 않을 수 있습니다.

저 또한 현재는 이 방법이 좋다고 생각하고 차 후 모델이나 신기술(코랩 가능한 AI 움짤, AI 영상)이 나온다면 또 다른 방법으로 바뀔거라 생각이 듭니다.
부디 넓은 시선으로 받아 드리길 바라며 1이라도 도움이 되었으면 좋겠습니다.('')(..)

저의 마지막 정보글이며 길 글 읽어주시느라 고생하셨습니다.

그럼 이만. 전 이제 은퇴합니다.

행복한 야ㅉ.. 뽑으세요~

유저 : 아니 선생님? Detection Detailer가 약간의 변수라는 데 설명 없이 도망간다고요?
글쓴 : 자료를 뽑고 있는데...야ㅂ 그냥 써. 큰 차이 없음. 시간 날 때 추가 설명할께요

DD 미적용 확인

DD 적용

큰 차이 없음. 휴~

하지만 뽑을 때 DD 적용해서 뽑으세요. 한 번에 끝내야지. i2i 돌리고 귀찮음.

유저 : 아니 선생님? 님이야 8*8 Scheduler 64개 중에서 뭐가 좋은지 알지. 우린 저거 봐도 몰라요. 몰라!
뭐 골라야 돼? 뒤지기 전에 빨리 정해줘!
글쓴 : 아니 야ㅂ. 좀! 보면 보이는 데 사용해보고 테스트하세요~ 난 바질이라 다르잖아요

*그림에 따라 범위 값이 달라질 수 있음. 제발 본인에 맞춰서 테스트!!
개인적으로 CFG-Constant 평타. CFG 15, 20, 25 라인 안정적임(바질 바질)

아래 6, 7 ,8 피부 표현도 적당하고 색보정이 잘 된 것 같음
6. Cosine Up-Constant
7. Half Cosine Up-Constant
8. Popwer Up-Constant

30. Cosine Up-Half Cosine Down 은 피부가 보들 보들 함 /*__*//

유저 : 오키. 야ㅉ 뽑으로 간다. 수고링~
글쓴 : 오옷! 기대하겠음. 으헤헤헤

끝난줄 알았는데... 또 뭐야?!
추가 팁 Top percentile of latents to clamp (고정할 잠재성의 상위 백분위수)
이건 또 뭔 해석이냐?

고백하는데 사실 DT의 잠재력을 100% 올려주는 건'Top percentile of latents to clamp'의 사용이다.

이게 무슨 소리냐? 그림으로 보자.

느껴지는가!

DT_DNA 로 색보정 된 그림을 찾을 수 없는 경우가 있다.
한 두번만으로 내가 찾은 DT 값이 최적의 값이 아닐 수 있으니 여러 번 다른 그림으로 테스트를 해보라는 것이다.

예를들면 PU-C_20-15 (Power Up-Constant CFG20-Mimic CFG15)의 그림은
사진의 RAW 파일 같은 색이 덜 채색 된 경우 더 높은 CFG와 Mimic CFG를 높여서 쨍한 색보정 된 그림을 찾아야 하는데 높여도 색보정 된 그림이 안 나올 때가 있다.

그럴 땐 우리는 DT의 숨겨진(?) 기능을 사용해야 한다. Top percentile of latents to clamp 값을 조절해보자.
(90~100까지 0.05 단위로 조절이 가능하며 0.05 단위마다 변화가 생긴다)

수치를 낮추면 모든 색이 밸런스를 유지하면서 쨍한 그림이 만들어진다. 판타스틱!

물론 단점도 있다. 그림 약간 바뀌고 얼굴의 피로도 증가도 발생할 수도 있다.
(피로도 증가는 위 내용을 다 읽었으면 대처가 가능하다. 이 건 숙제!)

물론 위 DNA에서 색보정이 잘 된 그림으로 마무리 해도 되고
예시의 PU-C_20-15 그림이 나올 경우 Top percentile of latents to clamp 값을 조절해서 좀 더 쨍한 그림을 뽑아도 된다.

언제나 우리에겐 다양한 방법의 선택지가 있다. 그걸 다 발견하지 못했을 뿐이다.

진짜 감~

거근의공식

2023-03-05 08:14:52

잘풀리는집

2023-03-05 08:16:11

교수님, 여기다 논문을 써놓고 가시면 어떻합니까?

펼쳐보기▼

Aㅔ붕이

2023-03-05 08:16:57

근첩A

2023-03-05 08:17:34

반실사챈의 보배인 데스웅

펼쳐보기▼

0080FF

2023-03-05 08:18:59

다쓰 이대로 괜찮은가? 뭐 이런식으로 꼭 다쓰를 너무 강렬하게 쓰는거 말하고 싶었는데 좋은 글이네

펼쳐보기▼

EY3

2023-03-05 08:22:10

Ai우유

2023-03-05 08:26:07

AiPsLr

2023-03-05 08:28:20

일단 개추 누르고 정독하겠습니다

펼쳐보기▼

아돌바람

2023-03-05 08:33:41

추천하는 설정치를 추가해주면 더 좋을거 같음..

펼쳐보기▼

dddao12321

2023-03-05 08:44:22

대박이네.. 진짜 님은 박사이신가요?... 뭘해도 될 사람이네 이분은... 글쓴이가 가장 추천하는 설정치 혹시 있나요?

펼쳐보기▼

늬하늬

2023-03-05 08:47:00

교수님 power scheduler value 값에 따른 비교 분석도 추가해주시면 안될까요?

펼쳐보기▼

에스프레소크림

2023-03-05 08:57:27

AiPsLr

2023-03-05 08:53:34

개인적으로 사진이 머드팩 한것처럼 누렇게 뜬다? 이럼 에러라고봄, 디테일은 좋지만 동시에 근육 , 뼈에 형태, 관절 접히는 부분등
(특히 무릎ㄷㄷ)이 비현실적으로 과장되서 무서움.. 과유불급!

펼쳐보기▼

에스프레소크림

2023-03-05 08:58:19

ㅇㅇ

2023-03-05 09:00:08

그동안 정보글들엔 전부 개추를 박았지만
무조건적인 프롬프트 빼기만이 정답인가?에 대해선 개인마다 다르다고 생각함
예를들어 girl 하나만 입력해서 나오는 결과는 어릴수도 나이들수도 동양인일수도 서양인일수도 피부가 하얄수도 검을수도 등등
토큰을 소모해서 노이즈를 생성한다는 것은 자유도를 떨어뜨린다는 단점이면서 원하는 픽에 가까워지는 장점일 수도 있음
다양한 결과 = 내가 원하는 결과일 때 프롬프트 다이어트가 유용하지만 75토큰은 상당히 작기 때문에 좀 더 특이적이고 원하는 맞춤 결과를 위해선 75토큰 이상 쓰는 것이 좋음
단적으로 나는 지금 120토큰 안팎으로 쓰는데 지금 상당히 만족함 근데 퀄리티 태그 한두개씩 빼면 바로 얼굴 자유도가 증가해서 내가 원하는 얼굴이랑 점점 멀어짐

펼쳐보기▼

AiPsLr

2023-03-05 09:13:42

hkhk

2023-03-05 09:20:01

기관총을 갈기는 입장이냐, 스나이퍼 라이플로 맞히는 입장이냐에 따라 다를거라고 생각함. 스나이퍼라면 최대한 프롬들 챙겨서 한장을 만들어내는게 의미가 있을거고, 기관총식으로 무한 가챠 돌려놓을거라면 예측 범위 안에서 어느정도 다양하게 나오는걸 선호할 것임

펼쳐보기▼

존잘러

2023-03-05 15:50:59

매우 동감함 프롬을 줄이는게 프롬이 더 적용이
잘되고 퀄리티가 올라간다? 팬티엄시대도 아니고 ai가 75토큰까지만 잘 받아들일까? 애초에 퀄리티나 프롬인식은 모델의 학습정도나 그래픽카드의 성능이 중요함. 프롬이 잘 안먹는 이유는 75토큰을 초과하기보단 모델의 학습범위와 프롬내 중복되거나 혹은 상호베타적인 태그가 프롬내에 같이 쓰이는 경우 때문일 이유가 더 큼

펼쳐보기▼

존잘러

2023-03-05 16:04:04

뭐 ai로 그림뽑는거에 프롬고수 하수 이런거 나누는것도 웃기지만 이 시스템에 이해도가 높은 사람은 토큰을 얼마나 적게 쓰느냐가 아니라 몇 토큰을 사용하던지 자신이 원하는 이미지를 정확하게 뽑아내는 사람이 아닐까? 1gir 프롬하나 넣고 글카 혹사시키면서 랜덤가챠 할바엔 걍 딴사람 이미지 다운받는게 나을거같고 결국엔 원하는 그림 뽑으려고 이거 하는거니까

펼쳐보기▼

이것참

2023-03-05 09:01:16

kihihi

2023-03-05 09:02:35

유리아쥬

2023-03-05 09:09:16

대단하십니다 추천 박고갑니다 혹시 선생님은 그럼 기본프롬 셋팅 어떤거 쓰시나요? 알려주세요 뿌잉 ㅠ

펼쳐보기▼

에스프레소크림

2023-03-05 09:21:12

긍정 (masterpiece), (detailed), 1girl, pale skin, 
부정 (low quality:1.5), (worst quality:1.5), strabismus,
여기서 필요한 태그를 채워 나갑니다. 본문의 내용 처럼 75토큰 넘어도 됩니다.

Sampling method : DPM++ SDE Karras (실사 모델 사용 시, 그 외 DPM++ 2M Karaas)

Sampling Steps : 20

Hires.Fix 
- Denosing strength : 0.4~0.5
- Upscaler : ESRGAN_4x
- Upscale by : 2

Script - Detection Detailer
Primary detection model (A)
- bbox.mmdet_anime-face_yolov3.pth
- Denoting strength (Inpaint) : 0.1

펼쳐보기▼

유리아쥬

2023-03-05 10:44:16

굉장히 심플하시네요 디테일하개 다른것도 설명해주셔서 답변 감사합니다!!

펼쳐보기▼

와사지

2023-03-05 09:17:25

hkhk

2023-03-05 09:18:34

Cosine Up-Half Cosine Down 이런 보물을 찾아내시다니

펼쳐보기▼

갓챠조아

2023-03-05 09:21:18

메카니끄

2023-03-05 09:23:56

은퇴는 어디서 허락 받으신건가요?

펼쳐보기▼

에스프레소크림

2023-03-05 09:33:22

건강검진 센터요...

펼쳐보기▼

메카니끄

2023-03-05 09:34:59

아.... 그동안 너무 감사했습니다.. 너무 큰 배움이였어요.. 건강관리 잘하시고 꼭 다시 돌아오시길

펼쳐보기▼

soleole88

2023-03-05 09:50:25

dt7698hf

2023-03-05 10:06:19

ultimate

2023-03-05 10:12:20

파르나

2023-03-05 10:33:48

앙기모떼레디리

2023-03-05 13:01:30

와 정독했습니다 아는내용도 있었는데 글이 좋아서 생각정리도 됐네요

펼쳐보기▼

앙기모떼레디리

2023-03-05 13:42:56

*수정됨

방금 맘에드는거 몇개 써봤는데 
CFG15 미믹 15 constant x half cos down
벌써 원래 꺼보다 훨씬 좋은거 찾음 ㄷㄷ

펼쳐보기▼

작작큰작

2023-03-05 13:05:16

showmaker11

2023-03-05 13:39:57

이…이게 머노…

펼쳐보기▼

류엘

2023-03-05 14:55:07

교수님이십니까?

펼쳐보기▼

babel2

2023-03-05 15:59:16

그저...GOD !!!!!!!

펼쳐보기▼

탐9생활

2023-03-05 18:39:05

교수님 감사드립니다. 안식년 이후에 뵙겠습니다.

펼쳐보기▼

iliilli1l

2023-03-05 19:30:35

선생님 미니멈 값은 다 0으로 놓으신건지요?

펼쳐보기▼

azureb

2023-03-05 20:02:02

추천추천!!

펼쳐보기▼

Kuchidakede

2023-03-05 23:20:03

다쓰 글 정독!!! 와드 박고 갑니다!

펼쳐보기▼

Sihwaa

2023-03-05 23:23:52

야레여래

2023-03-06 00:41:06

에-작가님
계약서 보내드렸어요~
-도서출판 AI-

펼쳐보기▼

Jonypposto

2023-03-06 00:58:44

*수정됨

많이 배워갑니다

펼쳐보기▼

마로미

2023-03-06 08:18:19

피부가 갈색이 되는건 어떤 수치의 영향인거같음?
cfg스케일 30일땐 괜찮은데 25로만 내려도 피부가 갈색이 되고 mimic cfg를 어떻게 조정해도 하얀 피부로 안돌아오는데

펼쳐보기▼

금발의제니

2023-03-06 15:48:31

*수정됨

그림의 수치가 
Minimum value of the Mimic Scale Scheduler
Minimum value of the CFG Scale Scheduler
이 두가지 수치맞죠??  저는 아무리 해도 아무변화가 없네요 ㅠ

펼쳐보기▼

에스프레소크림

2023-03-06 15:54:49

아뇨. 그 수치가 아니에요.
기본 설정에 있는 Batch size 밑에 있는 CFG Scale과

Enable Dynamic Thresholding (CFG Scale Fix) 체크하면 아래에 나오는 Mimic CFG Scale 이에요.

펼쳐보기▼

금발의제니

2023-03-06 16:00:37

그럼 저 두 수치는 0,0으로 두고 타입만 cosine-consine 식으로 바꾸고 하는거네요^^  그런데 cfg가 10만 넘어가면 근육에 점투성이에 시체색이 나오네요 ㅠ 다시 한번 시도 해보겠습니다~~

펼쳐보기▼

금융도박전문가

2023-03-07 18:38:30

와 반실사챈 장난 아니구나... 감사합니다

펼쳐보기▼

웅재

2023-03-20 11:44:44

잘 읽었습니다 행님. 행님덕에 챈 수준이 한단계 더 올라갑니다

펼쳐보기▼

웅재

2023-03-20 11:44:55

ㅇㅇ

2023-03-24 19:45:22

madeon

2023-04-11 07:18:18

글 여러개 찾아봤는데 이게 젤 도움됨 
개추주고싶은데 아쉽네

펼쳐보기▼

hisnameisK

2023-04-12 05:58:07

와~ 이건 강추 박아야 한다~크흐~! 엄지척!@@!

펼쳐보기▼

lifeplasty

2023-04-14 05:57:43

Damdae

2023-05-05 10:56:58

선생님, DT 최적값 쉽게 찾는 영상을 만들면서 
이 개념 글을 인용했습니다
좋은 자료 만들어주셔서 감사하고 
사용처 붙이겠습니다 
https://www.youtube.com/watch?v=QBvQYVNcl74&t=38s

YouTube

스테이블 디퓨전 확장기능 Dynamic thresholding으로 최적값 찾기. (AI 그림 사용법 가이드)

intro : 00:00왜 최적값을 찾아야 하나? - 0:171단계 - 1:191단계 정리 - 5:102단계 - 5:443단계 - 7:54

선생님, DT 최적값 쉽게 찾는 영상을 만들면서 
이 개념 글을 인용했습니다
좋은 자료 만들어주셔서 감사하고 
사용처 붙이겠습니다

펼쳐보기▼

ocmJin

2023-10-19 17:23:03

와...이건 인정할 수 밖에 없다...

펼쳐보기▼

경경우럭따

2023-11-29 13:28:04

좋은자료입니다

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 27905901

공지 채널 규정 - [2024.01.05] - 채널 이용 전 필독

ㅇㅇ 2023.02.03 103112

공지 입문자를 위한 스테이블디퓨전 설치 및 제작가이드,정보링크,채널규정요약

크런키z 2023.09.05 43620

공지 이 콘텐츠는 해당 국가에서 이용할 수 없습니다 [[ 451 에러 뜨면 클릭 ]

머리는차갑게가슴은뜨겁게 2024.01.18 27615

공지 반실사성인 허용 기준 ,수익화 및 광고 관련

크런키z 2024.01.05 12757

공지 실사 모델 정보 & 채널 가이드

탐9생활 2022.11.25 310498

공지 "저 뉴빈데 이 짤 어떻게 만들어요?" 알려드립니다

JAIHO 2023.02.10 280633

공지 기본적으로 실사 성 인물은 금지입니다

탐6생활 2024.04.17 2351

숨겨진 공지 펼치기(3개)

전체글 개념글