추가 팁 Top percentile of latents to clamp(이게 진짜 팁임. 숨겨둬서 죄송.ㅎㅎ)



저번 글 이후로 게시판을 보면서 Dynamic Thresholding에 세팅 값을 쉽게 찾지 못하는 것 같아서
‘아~ 이건 객관적인 자료를 정리해서 올리면 AI 그림 유저분들에게 도움이 되겠다’라는 생각에 긴 시간을 투자해 자료를 모으는 도중 아주 큰 고민에 빠졌습니다.


제가 배우고 경험한 이미지(사진, 영상 등의 기본적인 것들)에 바라보는 기준과 게시글에 올라오는 DT(Dynamic Thresholding) 적용 그림들은 너무 달랐습니다. 
저 번 글에 DT의 샘플 그림에서 색보정 잘 된 그림을 네모 표시하며 예를 들었는데 게시글에 올라오는 그림들은 과하게 색보정 된 그림들이 계속해서 올라왔습니다.

굳이 모른척 하고 넘어갈 수 있는 부분인데 괜히 내가 아는 부분에 대해서 ‘이게 맞는 것 같아요’라고 설명, 설득하는 것이 과연 맞을까라는 생각에 이 글을 작성하면서도 20번 넘게 지웠다 썼다를 반복하며 지금도 제가 생각하는 괜찮은 이미지의 개인적 기준을 들이대는 게 옳은가를 고민을 하게 됩니다. (굳이 논란을 만드는 성격이 아님)

그래서 ‘간단한 설명과 함께 테스트 자료만 올리고 끝내는 게 맞지 않을까’라는 생각이 계속 맴돌았습니다. 하지만 내가 배웠던 것에 지금까지 크게 이상한 점은 없었고 내가 생각하는 것과 의견이 다를 수 있어도 이 글을 보고 유연하게 받아들이고 혹은 도움이 된다고 생각하는 유저분들도 있을 거라는 생각에 마지막 정보글을 내 생각과 경험 그대로 전단하는 게 아름다운 마무리(?)라고 최종 판단을 했습니다. 



<속마음>

현 채널 뉴비님들의 상향 평준화와 고수님들의 신박한 아이디어로 채널의 그림들은 날로 좋아지고 있습니다. DT 적용 그림도 다양해지고 있고 색보정이 잘된 DT 설정값을 찾으면 훨씬 좋아질 것 같다는 생각과 함께 이 글을 시작하게 되었습니다.
어서 DT 잘 적용해서 야ㅉ 올려주세…퍽! 사실 이 글의 목적은 이겁니다.…
<속마음>

그렇기 때문에 이 글은 어떠한 강요(조금의 강요?…)와 정답이 없고 개인적 판단에 쓰는 것이기에 읽는 유저분들이 내게 도움이 되고 필요한 것만 얻어 가길 간절히 바랍니다.



 정보글은 Dynamic Thresholding DNA_2304장을 정리한 자료입니다.



Dynamic Thresholding은 간단하게 설명하면 기존의 그림을 좀 더 풍부한 색으로 보정을 해서 만들어 주는 기능이라고 보시면 됩니다. (포토샵, 라이트룸 같은 보정 결과보다는 훨씬 못 미칩니다.)

DT는 사진으로 비교하면 RAW 파일, 영상으로 비교하면 Log 촬영 파일을 색보정을 해준 결과물이라고 생각하시면 됩니다.


DT는 피부 표현을 잘 해주지만 실사 그림에서 가장 우선 순위는 풍부하고 안정적인 색표현입니다.

모델이 발전하면 피부 표현, 질감 표현은 훨씬 좋아지더라도 색표현은 결국 사용자의 DT의 설정값이나 태그로 결정이 될 겁니다.
(어떻게 발전할지는 모릅니다. ㅎㅎ)


이 내용은 만화, 반실사 유저들 보다 실사 유저들에게 좀 더 좋습니다.
만화나 반실사는 색에 포용도가 넓어서 DT의 색보정이 이상해도 그렇게 어색하지는 않으니까요.

색보정 된 그림은 일반 그림 보다 훨씬 좋다고 말할 수 있으며 좋지 않은 경우는 단 하나 밖에 없습니다.

‘사용자가 색보정을 못 했다’


AI 그림에서 DT는 유저가 색보정할 필요가 없습니다.
색보정 된 수많은 그림중에 하나만 선택하면 됩니다.


즉, 그림색이 어색한 건 ‘사용자가 색보정 된 그림을 잘못 선택했다.(이쿠~)’ (초반에 설명드렸던 제 개인적인 판단입니다.)


여러분은 어떤 사과가 보기 좋고 맛있어 보이나요?

맛에는 개인적 취향이 있겠지만 보기 좋은 건 아마 대부분 2번을 선택할 거라 생각합니다. 


자~ 그러면 범위를 좀 넓혀 보겠습니다.

여러분은 어떤 바나나가 보기 좋고 맛있어 보이나요?

보기 좋은 건 아마 대부분 6, 7, 8, 9 번이고 보기 좀 그런 것은 10, 11, 12, 13, 14, 15번입니다.
개인에 따라 11~15번이 맛있어서 선택할 수도 있습니다. 취향의 영역입니다.
그래서 DT의 색보정 잘된 6~9번 이외 취향의 영역인 11~15번을 선택할 수도 있다는 겁니다.
게시글은 취향의 영역인 11~15번이 꽤 올라오고 있습니다.(6~9번이 없는 게 아닙니다. 고수들이 얼마나 많은데 ㅎㅎ)

그렇습니다. DT는 이렇게 다양한 색보정 된 그림을 보여줍니다.
그 중에 맛있어 보이는 잘 표현된 그림을 선택을 하면 됩니다.



취향과 별개로 잘못 선택한 DT 그림의 예를들면

왼쪽의 백인 인어 공주가 나와야 하는데 DT 설정값을 못 찾거나 과하게 설정해 오른쪽으로 흑인 인어 공주가 나옵니다.
이것도 취향의 영역....일까....요.....(조심 조심)


과한 CFG의 오류는 백인과 황인이 흑인이 되거나 과한 음영이 생기거나 색감이 시체가 되거나 물이 빠지거나 의상의 본래 색이 없어 지거나 등등 많이 있습니다.


아니 그러면 내가 색과 색보정에 대해서 공부를 해야 하냐?

꼭 그렇지 않습니다. 위 사과, 바나나, 인어 공주처럼 그냥 봐도 좋아보이는 것! 쉽게 구별할 수 있습니다.

그런데 게시물의 어색한 색보정 그림들은 왜 계속 늘어날까요?


1. DT의 설정값의 결과의 표본이 너무 많습니다.


DT는 기본적으로 Mimic Scale Scheduler, CFG Scale Scheduler에 각 Constant, Linear Down, Cosine Down, Half Cosine Down, Linear Up, Cosine Up, Half Cosine Up, Power Up 이렇게 8개의 Scheduler가 있으며
CFG Scale은 1~30, 0.5 단위로 조절 Mimic CFG Scale은 1~30, 0.5 단위로 조절이 가능합니다.

가장 기본적인 수치만 계산을 하면
8*8*60*60 = 230,400 장의 결과물이 나옵니다.

거기에 Top percentile of latents to clamp, Minimum value of the Mimic Scale Schedule, Minimum value of the CFG Scale Scheduler, Power Scheduler Value 값 까지 계산하면 … 



2. 230,400장 중에서 단 1장을 선택해야 합니다.


일반 유저들이 전부 테스트할 수 있는 범위가 아닙니다.
그렇게 때문에 대충 적당한 값 몇 개만 때려 넣어서 그림을 선택하다 보니 위 썩은 사과, 상한 바바나, 흑인 인어 공주를 나도 모르게(이게 맞겠지?) 선택하게 됩니다. 



3. 혹은 다른 유저가 사용한 exif의 DT값을 그대로 사용하다 보니 내 모델과 셋팅값 테그에 최적화 되어있지 않아서 색보정이 어색한 그림을 사용하거나



4. 채널의 유저분들이 심성이 착해서 그림이 좋든 안 좋든 ‘추천’을 눌러주다 보니 ‘아~ 좋은 DT 그림이구나’라고 오해할 수도 있습니다.



실사 그림을 볼까요?


여러분을 선택하시겠습니까?




















그나마 1번은 괜찮습니다. 1번을 선택하셨다면 눈썰미가 좋으십니다.

분석해 볼까요?

색의 차이가 보이죠?
이게 최고의 색보정은(포토샵, 라이트룸 등) 아니지만 AI 그림의 DT 세팅 값들 중에서는 최선의 색보정 그림입니다.
그 이상을 넘어가면 2번, 3번 같은 취향의 그림이 됩니다.


혹시 내가 이런 2번, 3번을 최종 그림을 뽑고 있다면 한 번쯤 값을 조절해서 맞추면 더 좋은 그림이 나올거라 생각을 합니다.

물론 HDR의 느낌을 원한다면 2번과 3번의 중간지점이나
아래 4, 5, 6에서 피부톤이 변화지 않는 선에서 채도를 높혀 HDR을 표현하는 세팅 값을 찾을 수 있습니다.(어렵습니다. ㅎㅎ;;)




본론으로 들어가서 DT 색보정 그림을 어떻게 선택해야 할까요?


오늘의 핵심! Dynamic Thresholding의 DNA 자료입니다.

DNA 테스트 세팅 값입니다.


<속마음>

너무 많은 양을 테스트 해야 해서 X/Y/Z에 CFG Scale을 사용하다보닌 Detection Detailer를 사용 못하게 되었습니다.
그런데 이게 '약간의 변수(ㅅㅂ)'가 있을 수 있다는 걸 자료 정리 마지막에 알게 되었습니다. ㅠ___ㅠ
그렇다고 처음부터 한 장 한 장 뽑을 수는 없고 DT 설명에 큰 문제는 아니기에 따로 설명을 드리겠습니다.
<속마음>

이 설정값으로 뽑았고 속옷만 입은 그림을 선택한 이유는 인물의 색 표현이 좋아야 전체적인 그림이 조화를 이룬다고 판단을 했습니다. (게시물 흑인, 시체 방지, 내 검정색 치마가 회색으로 표현 된다면 DT 설정 잘못)


각 Scheduler 교차 비교

가장 보편적인 중간값 CFG 7, 10, 15, 20, 25
Mimic CFG 5, 10, 15, 20, 25, 30를 교차 비교해서

8*8*36 = 2304장의 표본을 뽑았습니다. (장 당 2분 걸린 건 비밀)



살펴볼까요~ Scheduler 순서는 CFG가 메인이고 Mimic CFG입니다.
그래서 CFG - Constant, Linear Down, Cosine Down, Half Cosine Down, Linear Up, Cosine Up, Half Cosine Up, Power Up 순서로 교차 비교했습니다.




1. Constant-Constant



2. Linear Down-Constant




3. Cosine Down-Constant




4. Half Cosine Down-Constant




5. Linear Up-Constant




6. Cosine Up-Constant




7. Half Cosine Up-Constant




8. Popwer Up-Constant




9. Constant-Linear Down




10. Linear Down-Linear Down




11. Cosine Down-Linear Down




12. Half Cosine Down-Linear Down




13. Linear Up-Linear Down




14. Cosine Up-Linear Down




15. Half Cosine Up-Linear Down




16. Power Up-Linear Down




17. Constant-Cosine Down




18. Linear Down-Cosine Down




19. Cosine Down-Cosine Down




20. Half Cosine Down-Cosine Down




21. Linear Up-Cosine Down




22. Cosine Up-Cosine Down




23. Half Cosine Up-Cosine Down




24. Power Up-Cosine Down




25. Constant-Half Cosine Down




26. Linear Down-Half Cosine Down




27. Cosine Down-Half Cosine Down




28. Half Cosine Down-Half Cosine Down




29. Linear Up-Half Cosine Down




30. Cosine Up-Half Cosine Down




31. Half Cosine Up-Half Cosine Down




32. Power Up-Half Cosine Down



33. Constant-Linear Up




34. Linear Down-Linear Up




35. Cosine Down-Linear Up




36. Half Cosine Down-Linear Up




37. Linear Up-Linear Up




38. Cosine Up-Linear Up




39. Half Cosine Up-Linear Up




40. Power Up-Linear Up




41. Constant-Cosine Up




42. Linear Down-Cosine Up




43. Cosine Down-Cosine Up




44. Half Cosine Down-Cosine Up




45. Linear Up-Cosine Up




46. Cosine Up-Cosine Up




47. Half Cosine Up-Cosine Up




48. Power Up-Cosine Up




49. Constant-Half Cosine Up




50. Linear Down-Half Cosine Up




51. Cosine Down-Half Cosine Up




52. Half Cosine Down-Half Cosine Up




53. Linear Up-Half Cosine Up




54. Cosine Up-Half Cosine Up




55. Half Cosine Up-Half Cosine Up




56. Power Up-Half Cosine Up




57. Constant-Power Up




58. Linear Down-Power Up




59. Cosine Down-Power Up




60. Half Cosine Down-Power Up




61. Linear Up-Power Up




62. Cosine Up-Power Up




63. Half Cosine Up-Power Up




64. Power Up-Power Up



대충 보이는 특징을 살펴보면

1. 특정 CFG, Mimic CFG에 색보정이 잘 된 그림이 분포해 있다.
2. 색보정이 잘 된 CFG+Mimic CFG 최소값에서 Mimic CFG의 값이 증가해도 그림의 큰 변화가 없다.(색보정 잘 된 구간)
3. CFG의 수치가 증가하면 뭐든지 과해진다. 피부, 색, 근육, 나이,...

    - CFG가 낮을 수록 피부가 매끄럽고 젊고 생기있어 보이며
    - CFG가 높을 수록  피부 표현이 잘 되지만 얼굴의 피로도가 증가해서 나이가 들어 보입니다.

        (주름이나 다크써클이 증가해서 나이가 들어 보임)


추가 - DT는 변태(?)라서 같은 수치의 CFG, Mimic CFG 에서도 조금씩 그림이 변한다. 엄청 민감하다.
           이 민감함이 Detection Detailer 적용시 반응을 한다.(ㅅㅂ-초반글에서 말한 생각하지 못 한 변수)


가장 쉬운 색보정 그림 찾는 방법입니다.

1. 64개의 Scheduler를 마음에 드는 것을 1개 선택

    - DNA 보면 필요없는 조합이 보입니다.

    - 마음에 드는 조합 3개 정도는 꼭 테스트해보길 바랍니다.


2. 그러면 2304장이 -> 36장으로 줄어듭니다.


3. 얼굴 망가진 거, 원본에서 크게 벗어난 거, 흑인화, 시체색, 등등 제외 하면 색보정 잘 된 그림만 남습니다.
    - 마음에 드는 것 10장 정도 픽!

4. CFG, Mimic CFG 값을 기준으로 다른 그림을 뽑아 봅니다.
    - 그림에 따라서 색보정 되는 범위가 다르기 때문에 여러장 뽑아서 색보정이 잘 되는 교집합의 값을 찾으면 됩니다.

    - 그러면 정말 괜찮은 그림만 남습니다.


5. 남은 그림들 중 1장(중간값)을 고르면 그게 최적화 된 DT 값입니다.

     - 위 DNA 자료는 바질 믹스가 기준이긴 하지만 모델에 따라 색보정 값이 조금씩 다르기 때문에 마음에 드는 Scheduler를 선택해서 36장 정도 뽑아보고 위 3~5번 과정을 거치면 됩니다.



끝! 이게 다 입니다. 참~쉽죠?





이제 마지막입니다. 여기부터는 더욱 개인적인 경험과 생각입니다.

색에 대해 민감하지 않으면 위 DT 색보정 그림에서 마무리 하면 됩니다. 하지만 조금이라도 내 그림의 완성도를 높이고 싶다면 아래 내용을 읽으시길 강요(?)드립니다.




DT의 최대 활용법은 태그의 간소화입니다.
(동해물과 백두산이 마르고 닳도록~ 이젠 지겹습니다. 태그 간소화.)


‘AI 그림의 기준은 태그의 간소화’


이미 많은 유저분들이 태그를 간소화가 많은 변수를 줄일 수 있다는 것을 압니다.

변수를 줄인다는 것은 그 만큼 내 의도대로 표현할 수 있고 표현할 수 있는 폭이  넓어진다는 뜻입니다.

특히 ChatGPT 같은 서술형 문장은 많은 토큰을 사용합니다. 단어형 보다는 정확한 결과물을 만들어줍니다.
필요없는 토큰을 정리한다면 ChatGPT의 서술형이나 단어형에서도 좋은 결과물을 만들어 낼 수 있습니다.


우리가 기본 75토큰 내에서 태그의 순서나 가중치에 따라 그림이 변화는 걸 알 수 있습니다.

예) 10개의 태그가 있고 10/75 토큰이라면 가 태그마다 7.5%의 비율의 할당 명령을 받겠지만 순서에 따라 가중치에 따라 그 비율이 달라집니다.
자 태그가 늘어나서 100/150 토큰이 있습니다. 그러면 10/75의 태그와 100/150의 같은 태그의 할당 명령 비율은 같을까요?
다릅니다.


물론 10/75 태그가 적기 때문에 많은 정보가 없어서 표현의 정확도는 떨어질 수 있습니다.
내가 원하는 방향으로 75/75를 꽉 채운다면 다를 수 있겠죠.


많이 본 태그고 많이 사용하는 태그죠?
4K, UHD, ultra detailed, high detail, high quality texture, detailed beautiful delicate face, detailed beautiful delicate eyes, colourful, distinct_image, extremely detailed CG, (photorealistic, cinematic light:1.4),
realistic, (F1.4, 1/800s, ISO 100, photorealistic), Ray tracing, (face only:1.2), (ulzzang-6500-v1.1:0.8), (pureerosface_v1:0.4), (detailed skin:1.3), 



DT 2304장에서 1장을 찾았는데 위와 같은 태그를 추가했더니 어라? 색이 망가졌습니다.?

다른 Scheduler, CFG, Mimic CFG 값을 조절 해서 찾아보지만 생각보다 시간이 많이 걸립니다.
계속해서 적당한 색보정값을 찾고있는데 어라? 아무리 찾아도 색보정이 제대로 된 그림이 없습니다.

자 이럴경우 어떻게 DT 적정 값을 찾고 최종 색보정 그림을 선택해야 할까요?
어렵죠.


자세히 설명을 해보겠습니다.
부정에 (low quality:1.5), (worst quality:1.5)가 있으면 더이상 퀄리티나 해상도가 부족함이 없습니다.
이건 이미 많은 유저분들의 검증으로 인해 기준값으로 자리 잡혀있습니다.

그러면 긍정의 8K, UHD 필요 할까요? 8K, UHD를 넣어서 해상도가 더 좋아진다?
이 태그가 적용이 된다면 퀄리티가 압도적으로 좋아져야 합니다. 그렇다면 4K가 아닌 8K 10K를 넣는 게 더 좋겠죠?
실상 결과물은 더 좋아지는 건 없습니다.


현재 512*512, 768*768 해상도로를 기준으로 뽑고 있습니다. 해상도가 작죠.
4K(UHD) 태그가 제대로 활용이 되려면 기본 해상도가 4K(3840*2160)로 되어야 변화의 폭을 체감할 수 있을 겁니다.

그래픽카드가 6090정도 시대에 가능할까요?(모릅니다)

그렇기 때문에 우리가 평소에 사용하는 해상도 관련 긍정 태그는 지금은 큰 효과가 없습니다.
만일 4090으로 기본 4K(3840*2160) 뽑아서 화질의 차이가 난다면 사용 가능하겠죠.
그런데 그렇게 뽑는데 얼마의 시간이 걸릴까요?

현재 기본 퀄리티와 해상도는 부정 태그 2개와 Hires.Fix 1.5~2배면 다 커버가 됩니다.
4K(UHD) 태그? 단지 토큰은 소모가 되고 태그로 인해 그림만 바뀝니다.

이런 태그들이 많습니다.

디테일 관련 태그는 하나 써도 충분합니다. 뭐~detailed, 뭐~ detailed… 토큰 낭비입니다.


그러면 DT와 연관이 있는 색에 관련 된 태크는

colourful, distinct_image, extremely detailed CG, (photorealistic, cinematic light:1.4),
realistic, (F1.4, 1/800s, ISO 100, photorealistic), (ulzzang-6500-v1.1:0.8), (pureerosface_v1:0.4), Ray tracing,
이 태그가 영향을 줄 것 같은데요. 가중치까지!


태그 순서가 바뀌어도 색이 바뀌고 가중치만 조금 바뀌어도 색이 바뀌는데 어떤 태그가 어떻게 색이 변화되고 추가 되는지 아시고 사용하시는 분 댓글로 설명 부탁드립니다.

과연 설명 가능한 사람이 있을까요?


내가 사용하는 태그를 검증하지 않습니다. 왜? 귀찮으니까요.
그냥 효과가 있겠지 하고 넘어갑니다.


애써 힘들게 찾은 DT값이 내가 정확히 모르는 태그로 인해 최종 그림의 색이 망가졌습니다. 


DT는 게임으로 비교하면 전설급 장비입니다. (AI 그림에서는 공짜죠)
그런데 사용자의 캐릭터가 마법사인데 추가 스탯(태그)을 지혜와 마나가 아닌 힘과 스태미나를 찍어버립니다.
생각만 해도 어질어질하죠? 스탯 초기화나 캐릭터 삭제를 해야 합니다.

‘응~ 나는 힘법사가 좋아. 지팡이로 패고 다닐래~’
네. 이건 취향 존중해 드리지 않습니다.(ㅂㄷㅂㄷ)


글 서두에 설명을 드렸죠.


색보정 된 그림은 일반 그림 보다 훨씬 좋다고 말할 수 있으며 좋지 않은 경우는 단 하나 밖에 없습니다.

‘사용자가 색보정을 못 했다’


이 경우는 사용자가 DT값을 잘 찾았는데 알지 못하는 태그를 무분별하게 남용해서 어렵게 찾은 DT의 기능을 최대한 살리지 못 한 겁니다.


태그 모르고 썼는데 결과물이 괜찮다 -> 개이득
태그 모르고 썼고 DT를 썼는데 결과물이 괜찮다 -> 핵 개이득
태그 알고 썼고 DT도 알고 썼는데 결과물이 괜찮다 -> 안정적인 그림을 계속 생산. 뭘 뽑아도 성공할 사람

태그 모르고 썼고 DT를 썼는데 결과물이 안 좋다 -> 태그로 인해 썩은 사과, 상한 바나나, 흑인 인어 공주가 탄생을 한다면? 이 수많은 변수를 어떻게 수정하실 생각입니까? 물론 최악으로 표현되지는 않을 겁니다.



태그의 간소화는 태그를 적게 사용하라는 뜻이 아니라 불필요한 태그를 줄이고 나에게 필요한 태그를 채워서 내 의도에 맞게 표현하라는 뜻입니다.

그렇기 때문에 75톤큰이 넘더라도 나에게 맞고 필요한 태그를 넣으면 됩니다. 75토큰에 맞추라는 얘기가 아닙니다.



DT를 최대한 활용을 하고 싶으면 간소화 된 태그에서 색보정을 잘 된 수치를 찾는게 우선이고 그게 변수를 줄이는 방법입니다.


태그 간소화를 실제로 사용하는 유저분들은 많습니다.

그리고 DT 적용이 아니더라도 이미 몇 몇 게시물은 정말 엄지척한 결과물이 있습니다. #고수죠

(본인만의 간소화 방법과 필살기 태그들이 있을 겁니다.)


<말 많네... 안 읽어도 됨>
여담이지만 바질 모델에서 photorealistic 태그 예를 들겠습니다.

저는 DT를 접하고 태그를 간소화해서 기준값을 잡고 태그를 하나씩 추가할 때 교차 비교(태그 및 가중치 비교 포험)를 합니다.


이 태그가 정말 나한테 필요한가?
이 태그가 퀄리티나 전체적인 그림에 좋은 영향을 주는가?


자료는 지워서 없지만 이번 DT 테스트를 하면서 photorealistic 태그를 넣고(가중치 포함) 300장 넘게 뽑았는데 어떤 특정값에 그림의 한 부분이 ‘빛 덩어리가’가 생깁니다.

AI 실사 그림을 많이 뽑으신 분들은 한 번쯤은 경험해 보셨을 겁니다.

특정 부위에 색이 이물질이 낀 것 처럼 다르게 나타나는 현상

photorealistic가 전체적인 색 톤에 아주 조금 영향을 주는 것도 있지만 어느 한 부분이 랜덤으로 ‘빛 덩어리가’ 생기는 걸 확인을 했습니다.

쉽게 설명하면 휴대폰 화면에 랜덤으로 큰 덩이리로 불량화소가 발생한다고 보시면 됩니다.

그래서 변수를 차단하기 위해서 photorealistic 버렸습니다.

제 기준에 있으나 없으나 퀄리티 향상에 영향을 주는 태그가 아니기 때문입니다.


이런식으로 태그를 확인하고 원하는 방향으로 전체틀을 잡아갑니다.

<말 많네... 안 읽어도 됨>



물론 이렇게까지 태그를 분석할 필요는 없습니다. 너무~~~피곤하니까요. (무슨 부귀 영화를 누릴거라고…ㅎㅎ;;)

적당히 뽑고 적당한 선에서 보고 즐기는 게 어찌보면 좋을 수 있습니다. 하지만 기준값을 정하고 DT를 찾고 필요한 태그를 추가하면서 변수를 줄이고 만들어지는 최상의 그림은 그 나름대로의 보상이라고 생각을 합니다. (처음이 힘들 뿐)


저는 이렇게 태그를 간소화하고 추가하고 분석하는 과정에서 좋은 그림이 나와서 재밌고 이런 정보들이 정확한 것은 아니지만 공유를 해서 같이 AI 그림을 즐기는 분들에게 도움이 되면 더 좋지 않을까라는 생각에 하는 것이기 때문에 굳이 저 처럼 이렇게 무식하게 안 하셔도 됩니다. 



꼭 하고 싶다면 태그 하나씩 하나씩 쌓아가면서 만들 그림의 필요 태그를 찾기만 해도 됩니다.
(교차 비교, 가중치 비교 까지는 정말 피곤하고 힘드니까 진짜 하지마세요!!)



DT DNA+DT 태그 간소화 팁은 간단한데 너무 길게 적었습니다.


총 정리

1. 내가 사용하는 설정 기준값 정하기

2. 기준값과 간소화 된 태그에서 DT 색보정 값 찾기(DNA 참고)

3. 2번에 태그를 추가 하면서 색이 너무 틀어지지 않게 필요한 태그들로 정리하기

4. 최종 정리 된 DT와 태그에 Hires.Fix + DD 적용해서 뽑기

5. 내 최선의 최고의 그림 탄생

6. 서로 서로 정보 공유하기 (중요 중요)


개인적인 생각과 경험이 담겨있어 읽으시면서 어떤 부분은 본인과 맞지 않을 수 있습니다.

저 또한 현재는 이 방법이 좋다고 생각하고 차 후 모델이나 신기술(코랩 가능한 AI 움짤, AI 영상)이 나온다면 또 다른 방법으로 바뀔거라 생각이 듭니다.
부디 넓은 시선으로 받아 드리길 바라며 1이라도 도움이 되었으면 좋겠습니다.('')(..)





저의 마지막 정보글이며 길 글 읽어주시느라 고생하셨습니다.


그럼 이만. 전 이제 은퇴합니다.

행복한 야ㅉ.. 뽑으세요~

















유저 : 아니 선생님? Detection Detailer가 약간의 변수라는 데 설명 없이 도망간다고요?
글쓴 : 자료를 뽑고 있는데...야ㅂ 그냥 써. 큰 차이 없음. 시간 날 때 추가 설명할께요

DD 미적용 확인



DD 적용

큰 차이 없음. 휴~

하지만 뽑을 때 DD 적용해서 뽑으세요. 한 번에 끝내야지. i2i 돌리고 귀찮음.


유저 : 아니 선생님? 님이야 8*8 Scheduler 64개 중에서 뭐가 좋은지 알지. 우린 저거 봐도 몰라요. 몰라!
           뭐 골라야 돼? 뒤지기 전에 빨리 정해줘!
글쓴 : 아니 야ㅂ. 좀!  보면 보이는 데 사용해보고 테스트하세요~ 난 바질이라 다르잖아요

*그림에 따라 범위 값이 달라질 수 있음. 제발 본인에 맞춰서 테스트!!
개인적으로 CFG-Constant 평타. CFG 15, 20, 25 라인 안정적임(바질 바질)

아래 6, 7 ,8 피부 표현도 적당하고 색보정이 잘 된 것 같음
6. Cosine Up-Constant
7. Half Cosine Up-Constant
8. Popwer Up-Constant 

30. Cosine Up-Half Cosine Down 은 피부가 보들 보들 함 /*__*//


유저 : 오키. 야ㅉ 뽑으로 간다. 수고링~
글쓴 : 오옷! 기대하겠음. 으헤헤헤


끝난줄 알았는데...    또 뭐야?!
추가 팁 Top percentile of latents to clamp (고정할 잠재성의 상위 백분위수)
이건 또 뭔 해석이냐? 



고백하는데 사실 DT의 잠재력을 100% 올려주는 건'Top percentile of latents to clamp'의 사용이다.

이게 무슨 소리냐? 그림으로 보자.


느껴지는가!


DT_DNA 로 색보정 된 그림을 찾을 수 없는 경우가 있다. 
한 두번만으로 내가 찾은 DT 값이 최적의 값이 아닐 수 있으니 여러 번 다른 그림으로 테스트를 해보라는 것이다.

예를들면 PU-C_20-15 (Power Up-Constant CFG20-Mimic CFG15)의 그림은
사진의 RAW 파일 같은 색이 덜 채색 된 경우 더 높은 CFG와 Mimic CFG를 높여서 쨍한 색보정 된 그림을 찾아야 하는데 높여도 색보정 된 그림이 안 나올 때가 있다.

그럴 땐 우리는 DT의 숨겨진(?) 기능을 사용해야 한다. Top percentile of latents to clamp 값을 조절해보자.
(90~100까지 0.05 단위로 조절이 가능하며 0.05 단위마다 변화가 생긴다)

수치를 낮추면 모든 색이 밸런스를 유지하면서 쨍한 그림이 만들어진다. 판타스틱!

물론 단점도 있다. 그림 약간 바뀌고 얼굴의 피로도 증가도 발생할 수도 있다.
(피로도 증가는 위 내용을 다 읽었으면 대처가 가능하다. 이 건 숙제!)

물론 위 DNA에서 색보정이 잘 된 그림으로 마무리 해도 되고
예시의 PU-C_20-15 그림이 나올 경우 Top percentile of latents to clamp 값을 조절해서 좀 더 쨍한 그림을 뽑아도 된다.

언제나 우리에겐 다양한 방법의 선택지가 있다. 그걸 다 발견하지 못했을 뿐이다.

진짜 감~