Perturbed Attention Guidance (Self-Attention Guidance와 비슷한데 더 잘됨)

AI 그림 채널

채널위키 알림 알림 중 알림 취소

구독자 75238명 알림수신 1662명 @NO_NSFW

인공지능으로 제작한 그림을 자랑하고 정보를 공유하는 채널

정보 Perturbed Attention Guidance (Self-Attention Guidance와 비슷한데 더 잘됨)

추천 31 비추천 0 댓글 44 조회수 2167 작성일 2024-04-01 17:32:43 수정일 2024-04-14 11:23:04

https://arca.live/b/aiart/102651788

안녕하세요.

Perturbed-Attention Guidance란 논문이 나와서 소개드립니다.

예전에 조금 유행했던 Self-Attention Guidance (SAG) 와 유사하게 샘플 퀄리티를 개선하는데, 더 개선된 버전입니다.

무엇보다 SAG보다 가이던스 스케일을 훨씬 크게 설정할 수 있고, 단독으로도 사용할 수 있습니다.

프로젝트 페이지: https://ku-cvlab.github.io/Perturbed-Attention-Guidance/

논문: https://arxiv.org/abs/2403.17377

논문 소개글 번역:

최근 연구에 따르면 확산 모델은 고품질 샘플을 생성할 수 있지만, 그 품질은 분류기 유도(CG) 및 분류기 없는 유도(CFG)와 같은 샘플링 유도 기술에 크게 좌우된다는 것이 입증되었습니다. 이러한 기법은 무조건적인 생성이나 이미지 복원과 같은 다양한 다운스트림 작업에는 적용되지 않는 경우가 많습니다. 이 백서에서는 무조건 및 조건부 설정 모두에서 확산 샘플 품질을 개선하는 새로운 샘플링 안내, 즉 교란주의 안내(PAG)를 제안하여 추가 훈련이나 외부 모듈의 통합 없이 이를 달성할 수 있도록 합니다. PAG는 노이즈 제거 프로세스 전반에 걸쳐 샘플의 구조를 점진적으로 개선하도록 설계되었습니다. 여기에는 구조 정보를 캡처하는 자기 주의 메커니즘의 능력을 고려하여 확산 U-Net에서 선택된 자기 주의 맵을 아이덴티티 매트릭스로 대체하여 구조가 저하된 중간 샘플을 생성하고 이러한 저하된 샘플로부터 노이즈 제거 프로세스를 안내하는 것이 포함됩니다. ADM과 안정적 확산 모두에서 PAG는 조건부 및 무조건 시나리오에서 놀라울 정도로 샘플 품질을 개선합니다. 또한 PAG는 빈 프롬프트가 있는 컨트롤넷, 인페인팅 및 디블러링과 같은 이미지 복원 등 CG나 CFG와 같은 기존 가이던스를 충분히 활용할 수 없는 다양한 다운스트림 작업에서 기준 성능을 크게 향상시킵니다.

사실 제가 이 논문의 저자 중 한명인데, ai 그림을 너무 좋아해서 이 분야에서 뭔가를 이루고 싶어서 꾸준히 공부하다 보니 논문까지 쓰게 됐네요.

실험을 많이 하면서 Stable Diffusion에서는 퀄리티가 크게 증가하는걸 확인했는데 정작 관심있는 anime 모델에서는 시간이 없어서 시도를 못해봤었습니다ㅜㅜ

현재는 comfyui node / webui extension은 없고 diffusers pipeline만 구현된 상태입니다.

diffusers pipeline: https://huggingface.co/hyoungwoncho/sd_perturbed_attention_guidance

아래는 huggingface 디스코드에서 이 파이프라인을 공유했을 때 다른 분이 anime 모델에서 시도해 본 결과인데, 상당히 잘 되는 것 같습니다.

이걸 보고 저도 diffusers에서 사용가능한 anime 모델로 몇 개 시도해봤는데요.

상당히 잘 되는 것 같습니다!

결과 몇 개를 보여드리겠습니다.

(왼쪽: baseline (no PAG), 오른쪽: PAG)

"a cute corgi"

"masterpiece, best quality, highres, 1girl"

재미있는 것은 원래 비조건부 생성 (프롬프트를 ""로 줘서 랜덤 생성하는 것)에서는 CFG를 적용할 수가 없어서 엄청 이상한 이미지들이 많이 나오는데, 저희 가이던스를 쓰면 비조건부 생성에서도 성능이 상당히 잘 나오는 것을 볼 수 있습니다.

baseline (no PAG) vs PAG

체리피킹되지 않은 seed=0 결과입니다!

궁금하신 분들은 colab을 만들어봤으니 한번 시도해보시면 좋을것같습니다!

Colab: https://colab.research.google.com/drive/1ghPuNoOOW0YPCis7My2afIbHxyD18kPg?usp=sharing

가이던스 선택 기준: anime 모델에서는 스케일이 달라서 실험이 좀 더 필요한데, 저희가 일반 모델에서 쓰는 값은 다음과 같습니다.
- PAG 단독: 5.0정도. 더 늘려도 무방합니다.

- CFG + PAG: PAG는 프롬프트를 더 따르도록 설계된 게 아니라 퀄리티를 높이게만 설계됐기 때문에 프롬프트를 안 따르는 것처럼 보일 때가 있습니다. (대신 좀 더 다양한 이미지가 나옵니다) 그럴 때는 CFG를 적절히 섞어주면 되는데 CFG 4.5에 PAG 5.0 정도가 괜찮은 것 같습니다. PAG는 3.0~7.0 정도로 더 시도해보면 더 잘 되는게 나올 수도 있습니다! CFG가 높을수록 프롬프트를 더 따릅니다.

다른 장점으로는 프롬프트를 안 넣는 게 자연스러운 태스크들 (inpainting, super-resolution 등) 에서도 원래는 CFG를 쓰려면 프롬프트를 넣어줘야 했는데, PAG는 프롬프트가 필요없기 때문에 프롬프트를 없이 이런 태스크들을 높은 퀄리티로 수행할 수 있습니다.

그리고 anime 태스크에서 좀 더 기대되는 적용사례로는 ControlNet과의 조합입니다. ContolNet을 사용할 때 포즈 컨트롤넷을 프롬프트 없이 생성하면 조금 어색한 경우가 종종 생기는데, PAG를 사용하면 훨씬 높은 퀄리티의 성능을 얻을 수 있습니다.

SAG와의 차이점을 좀 말씀드리면 SAG는 일반적으로 올릴 수 있는 가이던스 스케일의 범위가 제한되어 있는데, PAG는 더 넓은 범위를 지원합니다 (더 크게 올려도 이미지가 깨지지 않습니다) 자세한 건 논문 Appendix E.3 (53-54페이지) 에도 나와있습니다.

관심가져주셔서 감사합니다!

자세한 사항은 프로젝트 페이지나 논문을 참고해주시면 감사하겠습니다.

프로젝트 페이지: https://ku-cvlab.github.io/Perturbed-Attention-Guidance/

논문: https://arxiv.org/pdf/2403.17377.pd f

작동 원리나 디테일같은 궁금한 것이 있으시면 물어봐주시면 답변드리겠습니다!

능력자 분들의 기여도 환영합니다. 혹시 comfyui node나 webui extension을 만드는 데 관심있는 분이 계시면 저희가 최대한 도와드리겠습니다!

여기서 정말 많은 도움을 받았는데 저도 정보글을 쓸 수 있는 날이 와서 기쁘네요ㅋㅋㅋ

감사합니다!

댓글 [44]

이하비스

2024-04-01 17:41:14

이하비스

2024-04-01 17:41:31

아니 이걸 논문을 써오네 ㄷㄷ

펼쳐보기▼

딸기맛봇치

2024-04-01 17:43:13

딸기맛봇치

2024-04-01 17:43:45

아니 논문 리뷰를 써오신 줄 알았더니 논문을 써오시면 어떡합니까

펼쳐보기▼

딸기맛봇치

2024-04-01 17:57:56

일단 내일 학교가면서 읽어보겠습니당

펼쳐보기▼

스와마망

2024-04-01 17:48:41

옴마나 이게뭐람 pipeline는 어떻게 써야될지 모르겠으니 며칠기다리면 확장나오길 기대합니다

펼쳐보기▼

2024-04-01 18:46:34

글 중간에 colab demo (https://oo.pe/https://colab.research.google.com/drive/1ghPuNoOOW0YPCis7My2afIbHxyD18kPg?usp=sharing) 실행버튼  누르시면 쉽게 테스트해볼 수 있습니다!  감사합니다!

oo.pe

External site open warning

글 중간에 colab demo (https://oo.pe/https://colab.research.google.com/drive/1ghPuNoOOW0YPCis7My2afIbHxyD18kPg?usp=sharing) 실행버튼  누르시면 쉽게 테스트해볼 수 있습니다!  감사합니다!

펼쳐보기▼

bedovyy

2024-04-01 19:39:44

SAG 개선판인가 보네요! 내일 몰래 돌려봐야겠습니다ㅋ

펼쳐보기▼

곰방울꽃

2024-04-02 02:39:09

대단합니다! 존경합니다!

펼쳐보기▼

요어다둘

2024-04-02 02:48:49

doomestdark

2024-04-02 03:41:52

*수정됨

오... 연구원 등판 실화임?

펼쳐보기▼

doomestdark

2024-04-02 03:49:35

예전에 ComfyUI에 SAG 적용한 PR 이 이렇게 구현되어서 ComfyUI 코어에 반영되었는데, 이것 처럼 PAG 구현해서 PR 해주실 수 있나요? 그러면 감사 감사...

https://github.com/comfyanonymous/ComfyUI/pull/2201/files

GitHub

Implement Self-Attention Guidance by Slickytail · Pull Request #2201 · comfyanonymous/ComfyUI

The SAG config is activated by the node _for_testing/Self-Attention Guidance, and then the sampler does it automatically. There are a few implementation details that need further work: We make one…

예전에 ComfyUI에 SAG 적용한 PR 이 이렇게 구현되어서 ComfyUI 코어에 반영되었는데, 이것 처럼 PAG 구현해서 PR 해주실 수 있나요? 그러면 감사 감사...

펼쳐보기▼

2024-04-03 07:55:47

아무래도 ai그림 커뮤니티에서 쓰려면 그래야겠죠? 한번 시도해보겠습니다. 혹시 요즘은 webui보다 comfyui가 더 많이 쓰이는 추세인가요?

펼쳐보기▼

겜개발

2024-04-03 17:19:24

*수정됨

빈도는 거의 5:5 혹은 용도에 따라 둘  모두 병용하는 경우가 많은거 같습니다.

펼쳐보기▼

겜개발

2024-04-02 08:40:27

중간 샘플을 의도적으로 망침(?) 으로서 최종본의 개선을 노린다는 걸로 이해가 되었는데 맞나요? 어떻게 그런 방식으로 동작하는지도 궁금합니다. 혹시 참고하면 좋은 이론이 있을까요?

펼쳐보기▼

겜개발

2024-04-02 08:44:09

아.. 좀더 읽어보니 구조적으로 망친 샘플을 내부에서 다시 이쪽으로 가면 안되는 샘플로 잡고 가이드라인이 생기는 거군요.. 신기하네요

펼쳐보기▼

2024-04-03 07:59:55

넵 답글달아주신 내용이 맞습니다! 의도적으로 perturbed sample을 만들어서 그 반대방향으로 보내주는거라고 보시면 됩니다. 그런데 perturbation을 아무렇게나 주면 잘 안되고, '나쁜 샘플'로 가는 방향의 반대방향이 '좋은 샘플'이 되도록, 나쁜 샘플을 잘 설계하는 것이 핵심입니다. 저희는 self-attention에 perturbation 을 줘서 원래 이미지의 외양를 최대한 유지하면서, 핵심 특징 (눈, 입) 등만 약화시키는 방식으로 이를 구현했습니다. 그래서 '나쁜 샘플'의 반대방향이 눈, 입과 같이 핵심 특징을 강화하는 방향으로 가이드를 줍니다.

펼쳐보기▼

겜개발

2024-04-03 11:53:25

오오 감사합니다. 근데 한가지 의문이 드는 점이 그러면 망치기 위해 추가적인 프로세싱 ( 시간? 메모리? 어떤 게 주 자원일지 모르겟습니다만) 과정이 분명 들어갈텐데 현재는 어느 정도로 영향을 주나요?

또 원래 이미지의 외양을 유지해서 나쁜 샘플로 사용하면 기존 외양 자체를 파괴하려 들지(?) 않을까요?

펼쳐보기▼

철권짱

2024-04-02 11:15:28

멍무이드아

2024-04-02 14:21:30

포리X

2024-04-02 23:44:48

hkhk

2024-04-03 07:13:24

self attention 을 정상적으로 적용해서 디노이징을 한 결과와 self-attention 을 방해해서 디노이징을 한 결과를 만들어서 두 결과의 차이를 CFG 처럼 적용한 것으로 이해하면 되나요? 

CFG 는 prompt 에 대해 cross-attention 을 할 때 쓴거라서 PAG 는 CFG 와 별개로 함께 적용 가능하고 시너지 효과도 나는 것 같네요

펼쳐보기▼

2024-04-03 08:21:33

넵 이해하신 방법이 정확히 맞습니다!

굉장히 예리한 통찰을 주셨는데, CFG는 cross attention 단에서 차이가 발생하고 PAG는 self attention 단에서 차이가 발생해서 서로 보완적으로 작동할 수 있습니다. 논문 Appendix E.2 에서 해당 내용을 분석해두었습니다! 간략히 말씀드리면 cross attention은 디노이징 초반에 많이 활성화되고, self attention은 이미지가 많이 형성된 후반에 많이 활성화되는 경향이 있어 CFG와 PAG를 같이 쓰면 전체 타임스텝에 걸쳐서 좋은 가이던스 시그널을 줄 수 있습니다.

펼쳐보기▼

hkhk

2024-04-03 07:19:20

PAG의 능력이 극대화되려면 원 모델에 self-attention 쪽의 성능이 좋아야 하니 혹시 PAG 가 잘 안 먹히는 모델이라면 masked image prediction 으로 학습하면 좋아질까요?

펼쳐보기▼

2024-04-03 08:29:17

좋은 아이디어인 것 같습니다! 저희는 self-attention을 perturb했을 때 perturbation이 너무 강하면 샘플이 OOD인 경우가 발생해서 문제가 생길 수 있다고 생각해서, CFG가 uncond를 따로 학습하는 것처럼 학습을 통해 OOD를 방지하는 방향으로만 생각했습니다. 그런데 self-attention 자체가 학습이 잘 안되어서 perturb가 별로 효과가 없는 경우가 있다면 그런식으로 self-attention이 잘 학습되도록 augmentation 을 줄 수 있을 것 같습니다. 저희는 training-free 방법론을 제안하지만 training을 허용하면 더 다양한 perturbation (블러 등)을 시도해볼 수 있습니다! 이는 Appendix E.1 마지막에  언급되어 있습니다.

펼쳐보기▼

hkhk

2024-04-03 08:38:04

제가 생각한건 존재하는 모델에 finetuning 을 하는 과정에서 데이터 샘플이 충분치 않거나, 추가되는 샘플의 분포가 기존 모델의 분포에서 많이 이탈하는 경우 (예 - 사람의 앞모습만 주로 학습된 모델에 사람의 뒷모습을 학습하는 경우) 에 학습을 보완하는 방법으로 쓸 수 있지 않을까 해서 생각해봤습니다.

펼쳐보기▼

hkhk

2024-04-03 07:28:20

PAG를 timestep schedule 의 구간이나 unet 의 downsample 단계에서 전체적으로 적용하지 않고 선택적으로 적용하면 더 효과가 있을까요? 예를 들어 전체적인 구도가 형성되는 초중반 타임 스텝 + 다운샘플링된 낮은 해상도에서만 적용 반대로 디테일이 완성되는 중후반 구간이나 고해상도 상태에서만 적용

펼쳐보기▼

hkhk

2024-04-03 08:32:20

위의 댓글 주신 것으로 보면 전역적인 feature 보다는 local feature 의 rectification 에 효과적인거 같은데, 그럼 early timestep 이나 높은 해상도의 unet block에 대해서는 PAG 를 skip하도록 하면 최적화에 효과적이지 않을까 생각이 드네요. 생략된 연산이 얼마나 결과물을 악영향을 줄지는 실험을 해봐야겠지만요..

펼쳐보기▼

2024-04-03 08:34:58

이것도 굉장히 흥미로운 접근인데, 위의 분석에 의하면 초반에 CFG, 후반에 PAG를 주는 식으로 줄 수 있습니다. 전체적인 structure를 개선하고 싶다면 초반에만, fine detail을 개선하고 싶다면 후반에만 주는 식으로요. 그렇지만 일단은 그냥 전체 타임스텝에 걸쳐서 줘도 각 타임스텝에서 필요한 좋은 시그널을 알아서 주는 것으로 보이고 퀄리티가 충분히 좋아져서 제일 단순한 방법만을 제시했습니다! 그렇지만 충분히 시도해볼 가치가 있는 내용인 것 같습니다!

또 각 레이어별로 역할이 다르기 때문에 레이어 선택의 영향이 있을 수 있습니다! 레이어 깊이별 ablation과 레이어 여러 개를 조합했을 때 ablation도 Appendix D.2에 제시되어 있습니다.

펼쳐보기▼

hkhk

2024-04-03 08:43:11

힌트 주신 부분 참고해서 paper 좀 더 자세히 읽어볼께요! 감사합니다

펼쳐보기▼

2024-04-03 08:35:51

저희 방법을 너무 잘 이해해주신 것 같아서 좋네요 ㅎㅎ

펼쳐보기▼

hkhk

2024-04-03 08:42:36

좋은 논문 만들어주셔서 정말 감사합니다. 솔직한 생각으로는 too good to be true 수준이라고 생각이 될 정도입니다. 공개해주신 소스코드 참고해서 여러가지로 실험해보고 흥미로운 부분 발견하게 되면 알려드리겠습니다! 가능하면 comfyui 용 노드도 만들어보겠습니다 (근데 이쪽은 누군가 이미 하고 있을 것도 같은..)

펼쳐보기▼

2024-04-03 09:46:05

정말 감사합니다ㅜㅜㅜ 흥미로운 발견 기대하겠습니다! 성능이 좋은데 역시 그림ai 커뮤니티에서 쓰이려면  comfyui 노드같은게 필요한 것 같네요ㅜ 혹시 만드신다면 정말정말 감사드리고 최대한 도와드리겠습니다!

펼쳐보기▼

hkhk

2024-04-03 09:02:49

4.1 의 generator loss 를 구하는 (9) 번 식 2번째 줄에서 p(y) / p(y^) 이 왜 없어진건가요? y 와 y^ 가 각각  desirable sample 과 undesirable sample을 나타내는거면 p(y) / p(y^) 가 1로 approx. 될거 같진 않은데요?

펼쳐보기▼

2024-04-03 09:34:42

p(y), p(y^)는 class의 prior probability인데 log p(y)가 xt와 무관한 텀이기 때문에 그래디언트 취하면서 0이 됩니다! 구체적으로는  D의 분자 p(y|xt) (xt가 desired class일 확률)를 베이즈룰로 p(y)p(xt|y)/p(xt) 로 전개해서, uncondtional probability p(xt)는 분자분모에서 cancel out되고, desired class일 probability p(y)와, desired class y가 condition된 xt의 condtional probability p(xt|y)로 factorize되는데, xt에 대한 그래디언트기 때문에 xt와 무관한 텀인 log p(y)가 날라가는 것을 축약해서 표현했습니다! 표현을 더 명료하게 할 필요가 있겠네요. 감사합니다.

펼쳐보기▼

hkhk

2024-04-03 09:37:20

납득했습니다. 자세한 설명 감사합니다!

펼쳐보기▼

hkhk

2024-04-03 09:20:33

*수정됨

Fig.3 에서 PAG 적용 안한 위쪽 라인 (collapsed structure) 이 e_theta_(x_t_)  이고 아랫쪽의 PAG 적용된 process 의 2번째줄도 동일한 e_theta_(x_t_)  인데 왜 아래쪽은 collapsed structure 가 나타나지 않는 것인가요? 위쪽과 아래쪽의 강아지 그림은 같은 seed 값으로부터 생성된 것인가요? 아래쪽의 강아지 디노이징 그림에서는 이미 구조가 망가지지 않게 되고 있어서 PAG 의 효과가 collapsed structue 를 방지하는 것이 아니라 오히려 local detail 을 강화하는 결과로 나타나고 있는건데, 이것은 PAG 의 취지와는 좀 다른 것 같습니다

펼쳐보기▼

2024-04-03 09:42:25

앗 같은 시드에서 생성된 게 맞습니다! 아래쪽 그림은 매 스텝에 PAG가 들어가고 있기 때문에 collapsed structure가 나타나지 않는 것으로 보시면 될 것 같습니다. t=T 주변을 보시면 inital latent는 같게 나타는 것을 보실 수 있는데, 초반 타임스텝부터 PAG에 의해 교정이 되고 있기 때문에 같은 시드임에도 collapsed structure가 나타나지 않는 것입니다!

펼쳐보기▼

hkhk

2024-04-03 09:50:48

Fig.3 (b)를  볼 때에는 e_theta_(x_t) 에 guidance signal delta_t_를 더한 1번째 줄의 강아지 모양이 PAG 가 적용된 결과이고 2번째 줄의 그림들은 original 이라고 써 있어서 PAG가 적용되지 않은 버전으로 생각했습니다.  그렇다면 1번째 줄의 그림은 PAG 가 2중으로 더 강하게 pertube 된 버전이라고 보면 되나요?

펼쳐보기▼

2024-04-03 09:43:07

이것도 꽤 혼동의 여지가 있는 것 같은데  same seed라는 말을 캡션에 넣어야겠네요. 감사합니다.

펼쳐보기▼

hkhk

2024-04-03 16:42:38

huggingface 의 pipe 예제로 이것저것 실험해보고 있습니다. 인체 표현의 정확도가 상당히 높아지는 것 확인했습니다. 
pag_applied_layers=["down", "mid", "up"],  # ['down', 'mid', 'up']
pag_applied_layers_index=["m0"],  # ['d4', 'd5', 'm0']
요 옵션들에 대해서 좀 더 설명해주실 수 있을까요?

펼쳐보기▼

2024-04-03 17:38:33

*수정됨

애니메이션 모델에서는 많이 테스트를 못해봤는데, 인체 표현 정확도가 높아지는 효과가 있다니 너무 좋네요ㅎㅎ 알려주셔서 감사합니다! pag_applied_layers_index는 perturbation을 적용할 레이어입니다. d는 down, m은 mid, u는 up block을 의미합니다. Fig.40을 보시면 가능한 레이어 목록과 대략적인 성능 (FID)가 나타나 있는데 이는 모델과 스케일에 따라 달라서 수치가 상대적으로 낮은 것들 중에 다양하게 시도해 보시는걸 추천드립니다!

펼쳐보기▼

hkhk

2024-04-03 18:21:17

1. 인체 표현 정확도가 높아지는건 실사모델에서 확인했습니다. (SG161222/Realistic_Vision_V2.0). 다만 pag 적용 레이어를 d m u 모두 걸면 pag scale 이 조금만 높아져도 깨지는 현상이 생기더라고요. m 만 걸면 그런 현상이 줄어들었습니다.
2. pag_applied_layers 랑 pag_applied_layers_index 이 따로 있는데 파이프라인을 보면 pag_applied_layers 는 안 쓰는거 같은데 맞나요?

펼쳐보기▼

밍밍한프로도

2024-04-04 05:35:47

오오... 논문 저자분도 오시는군요. 저도 아카라이브의 이미지 생성 AI 사용자 분석으로 논문 하나 썼었는데, 관심 있으시면 한 번 읽어보시길 추천드립니다. 인터페이스 디자인 개선과 사용자 분류 기준 및 상호작용을 main contribution으로 가져갔습니다 :)
https://doi.org/10.21606/iasdr.2023.448

DRS Digital Library

Designing interfaces for text-to-image prompt engineering using stable diffusion models: a human-AI interaction approach

The use of generative artificial intelligence (AI) is more vital ever than before to create new content, especially images. Recent breakthroughs in text-to-image diffusion models showed the potential to drastically change the way we approach image content creation. However, artists still face challenges when attempting to create images that reflect their specific themes and formats, as the current generative systems, such as Stable Diffusion models, require the right prompts to achieve the desired artistic outputs. In this paper, we propose future design considerations to develop more intuitive and effective interfaces that can be used for text-to-image prompt engineering from a human-AI interaction perspective using a data-driven approach. We collected 78,911 posts from the internet community and analyzed them through thematic analysis. Our proposed directions for interface design can help improve the user experience as well as usability, ultimately leading to a more effective, desired image generation process for creators.

*수정됨

오오... 논문 저자분도 오시는군요. 저도 아카라이브의 이미지 생성 AI 사용자 분석으로 논문 하나 썼었는데, 관심 있으시면 한 번 읽어보시길 추천드립니다. 인터페이스 디자인 개선과 사용자 분류 기준 및 상호작용을 main contribution으로 가져갔습니다 :)

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 그림 공지 운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 28580649

공지 AI 그림 채널 통합 공지 (2024-05-18)

NO_NSFW 2022.10.23 601496

공지 ( 진행중 ) 대회 관련 공지 / 현재 진행중인 대회

NO_NSFW 2023.02.01 70020

공지 AI그림 채널 신문고

NO_NSFW 2022.12.10 76240

공지 곤살레스(아카 AI) 관련 공지

NO_NSFW 2024.03.26 12544

공지 본 채널은 AI 그림의 수익화를 반대합니다.

NO_NSFW 2023.05.11 58216

공지 공지 정보글에 여러분들의 기여가 필요합니다

DeepCreamPy 2023.02.21 84780

숨겨진 공지 펼치기(2개)

일반 [nai]이거 한번 시작하니깐 멈추질 못하겠다. [5]

bedovyy 2024.04.01 381 2

일반 아까 한 말 취소 [1]

리다이린 2024.04.01 268 1

일반 팔 모양 만드는게 진짜어렵구만

ㅌㅅㅁ 2024.04.01 163 1

일반 처음 SDXL 사용법 보고 하는데... 캐릭터 하나에 집중이 안되네요. [1]

다이나밐 2024.04.01 492 -2

일반 nai3는 신 같습니다 ㄹㅇ

Simploid 2024.04.01 494 1

그림 animagine 프롬 대충입력하니까 그림 입문 반년차 느낌 나오네 ㅋㅋㅋ [3]

iau 2024.04.01 518 3

일반 챠퍗먀 로라 제작 기능 못써먹겠네

리다이린 2024.04.01 202 1

일반 하루 늦은 지포스50 쓰면 안되는 이유

평범한밀덕 2024.04.01 280 0

그림 귀팬티 [3]

ㅇㅇ 2024.04.01 449 6

전체글 개념글