U-net 블록 병합에 대해 대충 알아보자 (작성 중)

AI 그림 채널

채널위키 알림 알림 중 알림 취소

구독자 74896명 알림수신 1656명 @NO_NSFW

인공지능으로 제작한 그림을 자랑하고 정보를 공유하는 채널

정보 U-net 블록 병합에 대해 대충 알아보자 (작성 중)

애옹이도둑

추천 35 비추천 0 댓글 26 조회수 4011 작성일 2023-01-26 14:17:29 수정일 2023-01-26 14:31:47

https://arca.live/b/aiart/68377943

모든 이미지 및 설명 출처:

https://rentry.org/BlockMergeExplained

이 글은 과거에 제가 쌌던 질문 비스무리한 정보 글의 셀프 답변과도 같은 그 무언가이기도 함...

전부 읽기 싫다, 나는 꿀만 빨고 싶다!

1. 중앙(MID0)에서 먼 레이어는 질감, 선의 두께 같은 디테일을 표현한다 (화풍, 그림체 등)

2. 중앙과 가까운 레이어는 디테일한 특성을 표현한다 (옷의 종류, 얼굴 배치 및 간격 등)

3. 어떤 레이어가 무슨 특성을 담당하는지는... 직접 노가다 뛰는 수 밖에 없다...

무지성 병합에 앞서... 우리는 레이어(블록)에 대한 개념을 이해할 필요가 있음

하지만 나도 잘 모르니까 가르쳐 줄 자신은 없고 겉핥기식으로만 정리해뒀음

구글에 페이퍼 제목에 리뷰 붙여서 검색하면 한국어 리뷰 나올거임

An Introduction to Convolutional Neural Networks

U-Net: Convolutional Networks for Biomedical Image Segmentation

High-Resolution Image Synthesis with Latent Diffusion Models

스테이블 디퓨전의 구조를 단순화하면 아래 이미지처럼 그릴 수 있음

이미지 출처

스테이블 디퓨전이 이미지를 구성할 때 컨볼루셔널 뉴럴 네트워크(CNN) 중 하나인 U-net 구조를 사용하는데

스테이블 디퓨전은 입구(IN) 12개, 중앙(MID) 1개, 출구(OUT) 12개로 총 25개의 레이어를 가지고 있음

좌측의 원본으로부터 디퓨전 과정을 거친 노이즈 이미지가 총 25개의 U-net 레이어를 차례대로 거치며 프롬프트[CLIP -> (Cross-attention) -> Layer]의 영향을 받는데

이 때 입구 레이어에서 중앙까지 노이즈로부터 특성을 뽑아냈다가 출구 레이어에서 손과 발 등의 사람이 인식할 수 있는 형태로 재구현하게됨

이로써 우측의 최종 이미지가 만들어짐 (VAE 생략)

이 과정을 이해했다면 어떤 레이어가 대충 어떤 특성을 담고 있는지 유추 해볼 수 있을거임

바깥과 가까운 레이어는 전체적인 윤곽을 담당할 확률이 높으니 실사와 씹덕풍을 섞고 싶다면 이 곳을 노려보는게 좋고

2~4 쯤에 위치한 사람의 키, 가슴 크기, 전체적인 신체의 형태 등 신체적 특성을 담고 있을 가능성이 있고...

7~9 쯤에 위치한 레이어는 이전 레이어를 함축시킨, 그니까 캐릭터 그 자체나 얼굴 같은 특성을 담고 있을 수도 있겠지?

위에서 나도 몰?루 같은 표현을 많이 사용했는데...

각 특성들이 실제론 곡선이나 점, 각진 모서리 등으로 나눠지고 컴퓨터가 사용하기 좋게 텐서(숫자) 형태로 저장되어있어서

추상적으로나 이해할 수 있지, 사람이 사용하는 단어들로는 이건 이거다! 같은 1대1 비교가 현실적으로 불가능함...

간단히 말해서 그냥 무지성으로 해보는 수 밖에 없다는 것임

https://github.com/ashen-sensored/sd-webui-runtime-block-merge


과거 병합 방식	블록 병합 방식

여기까지 작성했다가 퇴근 시간이라 급하게 올림

집가서 이어 쓸 예정...

menaci

2023-01-26 14:18:59

xkzhdnpfcl

2023-01-26 14:20:18

4번이 제일 궁금했던 내용인데 노가다였구나..

펼쳐보기▼

XDive

2023-01-26 14:21:31

초광속입자

2023-01-26 14:21:48

ㅇㅇ

2023-01-26 14:22:11

Marionette

2023-01-26 14:23:15

뽀낭

2023-01-26 14:25:56

INAFF

2023-01-26 14:26:03

https://bbs.ruliweb.com/community/board/300143/read/60013804

루리웹

(AI) AI를 이용해서 고퀄리티 그림체 이미지 모델 만들기 튜토리얼 14 | 유머 게시판 | 루리웹

1편 : https://bbs.ruliweb.com/community/board/30014...

INAFF

2023-01-26 14:26:15

난 여기서 많이 도움받았음

펼쳐보기▼

애옹이도둑

2023-01-26 14:26:57

루리웹은... 사용하지 않아요....

펼쳐보기▼

INAFF

2023-01-26 14:27:29

저분은 AI학습챈에서도 활동하는 분이라 다른거 거르고 저사람 글만 봄

펼쳐보기▼

라붕붕쿤

2023-01-27 01:31:11

챈에는 어딨음? 난 못찾겠노

펼쳐보기▼

INAFF

2023-01-27 01:32:56

존댓말만 쓰는 사람 있음 학습챈은 기본적으로 익명 닉네임으로 떠서 원래 닉네임은 모르겠네

펼쳐보기▼

라붕붕쿤

2023-01-27 01:33:12

아 학습 난 여기라는줄알았노

펼쳐보기▼

녹용탕약

2023-01-26 22:55:04

아, 여기.
시리즈 글 자체가 양질의 정보로 정리해둬서 참 좋긴 함.

펼쳐보기▼

ㅇㅇ

2023-01-27 05:41:05

아무리 근카라이브라지만 아예 -근- 주소를 박아놓네 ㅋㅋㅋ

펼쳐보기▼

호랑할배

2023-01-26 14:26:18

파랑파랑

2023-01-26 14:34:17

오에엑

펼쳐보기▼

ㅇㅇ

2023-01-26 14:44:51

qwer

2023-01-26 14:58:33

*수정됨

오렌지믹스2 병합법 중 1, 1, 1, 0, 0, 0 부분이 노이즈 중 세밀한 부분을 basil로 해석 => 구현은 Anything에게 맡김 이었던거네

펼쳐보기▼

qwer

2023-01-26 15:00:39

DeepCreamPy

2023-01-26 21:07:16

나 옛날에 딥러닝 공부할때는 저 각 레이어의 역할을 정확히는 알 수 없다고 배웠었는데
저 특정 레이어들의 역할을 명확히 밝혀내는게 가능함?

펼쳐보기▼

Cinnamomo

2023-01-27 00:24:53

완전하지는 않아도 결과론적 해석을 통해 얼추 유추는 가능한레후 https://arca.live/b/aiart/68129941

펼쳐보기▼

INAFF

2023-01-27 00:34:43

팔피바

2023-01-27 00:28:43

아카라

2023-02-08 07:35:02

그럼 u-net이라는건 

모델을 내가 만들려고 할 때, 내 입맛대로 특정한 부분을 수정할 수 있는 모델 생성/병합/수정 방법을 말하는 건가요? 

u-net기반 모델이라는 말을 쓰던데.. 그러한 의미로 보이네요

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 그림 공지 운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28163653

공지 AI 그림 채널 통합 공지 (2023-10-05)

NO_NSFW 2022.10.23 591419

공지 ( 진행중 ) 대회 관련 공지 / 현재 진행중인 대회

NO_NSFW 2023.02.01 68328

공지 AI그림 채널 신문고

NO_NSFW 2022.12.10 74297

공지 곤살레스(아카 AI) 관련 공지

NO_NSFW 2024.03.26 10007

공지 본 채널은 AI 그림의 수익화를 반대합니다.

NO_NSFW 2023.05.11 56283

공지 공지 정보글에 여러분들의 기여가 필요합니다

DeepCreamPy 2023.02.21 82917

숨겨진 공지 펼치기(2개)

일반 오늘자 AI챈 한짤요약.jpg [6]

AI천재 2023.01.26 345 1

그림 전투 후의 거대로봇! [3]

Darts7726 2023.01.26 340 3

그림 nai버리고 글카사서 오랜만에 webui 복귀 [2]

cobro 2023.01.26 435 3

일반 아니 바빠서 지금 왔더니 해골물 이슈 터졌네 ㅋㅋㅋㅋ

ㅇㅇ 2023.01.26 269 0

그림 [5장] 자러 가기 전에 골라봄. [3]

ㅇㅇOOoo 2023.01.26 482 3

그림 어비스하드 [2]

ㅇㅇ 2023.01.26 288 0

그림 와일드카드 [4]

0080FF 2023.01.26 635 3

일반 오늘 3090 egpu사왔는데 고장나서 환불받기로함 [7]

ㅇㅇ 2023.01.26 391 1

일반 절대 안나오는 시츄에이션이 있는듯

마로미 2023.01.26 266 0

그림 퍼리도 좀 괜찮게 뽑네 [4]

쪼아유 2023.01.26 522 0

일반 이젠 ckpt가 불편한거 같음 [1]

나도모른다 2023.01.26 243 0

일반 그림 뿌연거 도와주신 선배님들 감사합니다 해결했슴다.. [2]

불타는메론 2023.01.26 270 2

그림 오늘자 잘 나온 파스텔믹스 짤 [3]

몰큰 2023.01.26 355 5

그림 어째 익숙한 마크가 보인다 [2]

파랑파랑 2023.01.26 247 2

일반 nft 하는사람있어?? [5]

펑펑 2023.01.26 268 -6

일반 파이썬은 뭐 하려하면 버전문제가 제일 짜증나...

화인즈 2023.01.26 321 0

일반 Depth-guided model이랑 InstructPix2Pix 이거 좀 사기같네 [5]

INAFF 2023.01.26 1203 26

그림 만드는 도중 팅겻네

DiaryOfSta 2023.01.26 140 0

그림 침이 길게 늘어뜨려지는 업계포상을 원했는데 이게 한계다

다크빌 2023.01.26 376 1

일반 lowvram쓰면 결과 달라지는것임? [2]

ㅇㅇ 2023.01.26 213 0

그림 야경 조와 [2]

스피리테일 2023.01.26 202 1

그림 지나치게 귀여운거 아닌가 [7]

한마리 2023.01.26 289 4

전체글 개념글