Stable Diffusion(AOM3 모델, 30steps, 2M Karras)BING

둘다 "an otter wearing sunglasses is watching tv show on the couch in realistic style" 문장 그대로 프롬에 넣었고

diffusion에는 네거티브로 "person, male, female, 1girl, 1boy" 넣었음 사람 튀어나와서


빙은 약간 그림체가 일관된 느낌이면 AOM3은 다양한 느낌?

 학습 데이터가 달라서 그런거겠지만 BING이 뭔가 더 자연스럽게 표현하는거 같기도 하고


이건 기타 치는거 그려달라 한건데 걍 귀여워서 같이 올림