SD3가 어느 정도의 위치/행동 지정이 가능한 건 맞는데

AI 그림 채널

채널위키 알림 알림 중 알림 취소

구독자 78192명 알림수신 1713명 @NO_NSFW

인공지능으로 제작한 그림을 자랑하고 정보를 공유하는 채널

일반 SD3가 어느 정도의 위치/행동 지정이 가능한 건 맞는데

딸기맛봇치

추천 1 비추천 0 댓글 17 조회수 668 작성일 2024-05-22 17:54:17 수정일 2024-05-22 17:54:45

https://arca.live/b/aiart/106879040

제일 중요한 건 그게 아님

우리 프롬으로 뭐 씀?

"태그" 씀

"왼쪽에 있는 남자는 모자를 쓴 채로 한 손을 들고 있고 오른쪽에 있는 여자는 드레스를 입고 있다. 중간의 아이는 곰 인형을 들고 있다."를 태그로 적어 보셈

그리고 그게 영어의 문장 구조를 따르긴 커녕 조사와 부사 등등이 하나도 없이 명사와 쉼표만으로 가득 찬 단어 뭉치라는 걸 볼 수 있을 거

디퓨전 모델이 똑똑하다고? 맞음 ㅇㅇ 근데 clip은 안 똑똑하기 때문에 저걸 clip이 명사 쉼표 덩어리를 자연어 이해하듯이 알잘딱으로 해석해 줄 거라는 기대는 좀 낮추는 게 낮을 거임

댓글 [17]

732

2024-05-22 17:55:17

완벽히 이해했어 콘

펼쳐보기▼

딸기맛봇치

2024-05-22 18:00:17

간단하게 Holding the wheel on a bicycle with left hand를
bicycle, holding with hand, left hand, bicycle wheel
이따구로 우리가 지금 적어 놓고 있다는 거

펼쳐보기▼

딸기맛봇치

2024-05-22 18:05:56

이걸 저능아한테 무슨 뜻이냐 물으면 앞의 문장이야 누가 자전거 바퀴 들고 있대가 나오겠지만 뒤의 문장은 잘 몰루가 튀어나온다는 건데
인물이 여럿 나오고 각각 행동 지정을 하면서 문장이 복잡해진다? 힘들어지겠지~

펼쳐보기▼

장갑성애자

2024-05-22 18:05:09

Nai4도 저 모델로 나온다쳐도 큰 발전은 기대하지말라는거?

펼쳐보기▼

딸기맛봇치

2024-05-22 18:07:45

정확히는 "태그"형식의 프롬프트가 가진 자체 한계를 말하는 거임

펼쳐보기▼

장갑성애자

2024-05-22 18:08:21

난 걍 3명 뽑았을때 덜섞이면 그걸로 만족임 자료 한 20~40개 있는 캐릭터도 무난하게 뽑히고

펼쳐보기▼

딸기맛봇치

2024-05-22 18:12:02

전자야 뭐 가능성이 낮아도 타율이 올라가긴 할 테니 어떻게 되겠지만 후자는 기대를 버려라
8백만 장 중 40장임
0.0005%

펼쳐보기▼

딸기맛봇치

2024-05-22 18:15:42

뭐 8백만 장 중 단 40개의 그림에 있는 태그도 학습시킬 순 있겠지
근데 그 정도의 학습률이면 다른 모든 게 싹 다 타버려서 아무 의미가 없음

펼쳐보기▼

스와마망

2024-05-22 18:25:10

적당한lllm쓰는 다른 대조 모델이나 차세대버전이 나오면 좋을련만

펼쳐보기▼

딸기맛봇치

2024-05-22 18:26:17

라마7B 그대로 때려박은 놈 있긴 함
성능이 병신이라 그렇지
그리고 사실 자연어 프롬에서는 클립 수준에서도 충분하니깐

펼쳐보기▼

스와마망

2024-05-22 18:27:09

그래도 좀더 똑똑해 졌으면 좋겠어...
아니면 중간에 번역모델하나 추가하거나

펼쳐보기▼

딸기맛봇치

2024-05-22 18:30:54

필요 없는데 추론/학습 느려지게 추가로 박을 필요가 없지
이번에 t5도 나중에 기능 추가하기 편하게 해주려는 느낌으로 집어넣은 거니

펼쳐보기▼

스와마망

2024-05-22 18:37:19

그러네 sd3도 인코더 하나 더 달린다고했었지

펼쳐보기▼

노후준비

2024-05-22 18:30:53

결국엔 학습이 문제인거구나 암만 AI시대 빨아재껴봤자 학습물의 결과라 학습을 뭐로 했냐고 다 정해지는거구만

펼쳐보기▼

포리X

2024-05-22 22:28:38

이미 SDXL에서 캡션 방식을 태그가 아닌 문장 형식으로 파인튜닝을 시도하는 경우가 늘어나고 있다는 것을 생각해보면 장기적으로는 문장 방식으로 넘어가지 않을까 생각해보기도 함.

펼쳐보기▼

딸기맛봇치

2024-05-23 03:13:19

예전처럼 자연어 캡셔닝이 불가능에 가까운 것도 아니니까 자연어로 넘어갈 거 같음 ㅇㅇ

펼쳐보기▼

라쿤

2024-05-23 01:52:12

포니도 자연어 좀더 강화한다는거같던데

펼쳐보기▼

본 게시물에 댓글을 작성하실 권한이 없습니다. 로그인 하신 후 댓글을 다실 수 있습니다. 아카라이브 로그인

전체글 개념글

최근 최근 방문 채널

최근 방문 채널

전체 일반 정보/자료 질문 그림 공지 운영

번호 제목

작성자 작성일 조회수 추천

공지 아카라이브 모바일 앱 이용 안내(iOS/Android)

*ㅎㅎ 2020.08.18 36286008

공지 AI 그림 채널 통합 공지 (2024-07-25)

NO_NSFW 2022.10.23 682369

공지 본 채널은 AI 그림의 수익화를 반대합니다.

NO_NSFW 2023.05.11 78759

공지 질문하기 전에 한번만 보고 가면

라스파이 2024.06.21 21888

공지 ( 진행중 ) 대회 관련 공지 / 현재 진행중인 대회

NO_NSFW 2023.02.01 84101

공지 AI그림 채널 신문고

NO_NSFW 2022.12.10 93644

공지 공지 정보글에 여러분들의 기여가 필요합니다

DeepCreamPy 2023.02.21 98234

숨겨진 공지 펼치기(2개)

226081 질문 module 'torch' has no attribute 'float8_e4m3fn' --> 이게 없다는데 어떻게 해야하나요? [4]

금발의제니 2024.09.22 91 0

226080 일반 좀있으면 nai v3나온지 1주년인가 [1]

ㅇㅇ 2024.09.22 209 0

226079 질문 자기가 자기 몸 감싸는 자세는 뭐지 [2]

아키타히로무 2024.09.22 171 0

226078 질문 naia UC는 뭐임? [7]

루이즈_프랑소와즈 2024.09.22 179 0

226077 일반 어우 설치부터 ㅈㄴ힘드네 [1]

djatlrqkr 2024.09.22 240 0

226076 그림 명일방주 버메일 [1]

호랑할배 2024.09.22 151 0

226075 질문 이거 내 프롬이 이상한건지 서버가 이상한건지 모르겠음;; [11]

Leningrad45 2024.09.22 232 0

226074 일반 사진편집 프로그램마다 exif 저장 유무가 다르네 [2]

popcorn9029 2024.09.21 160 0

226073 일반 뉴비왔다 스테이블 깔았슴! [2]

스타레일 2024.09.21 189 1

226072 일반 INRI

명란마요네즈 2024.09.21 116 0

226071 그림 28장) 악마의 눈을 뜬 지뢰녀 [1]

흑발벽안흑발청안 2024.09.21 246 1

226070 일반 아니 ㅁㅊ 난 분명 야짤 뽑으려고 한건데 [2]

엉클메이팅 2024.09.21 373 3

226069 질문 자체 제작 로라 관련 질문 [2]

이관진 2024.09.21 167 0

226068 그림 콘 만들다 드는 생각 [7]

초고추장커피국밥 2024.09.21 228 0

전체글 개념글

사용하고 계신 브라우저가 시간대 설정을 지원하지 않으므로 GMT 시간대가 적용됩니다.