요새 로라 만든답시고 밤만 되면 컴을 갈구는데

잉요일에는 기절해버리는 바람에 하루 날림

새벽열차 탈 일이 있어서 그때 못했던 실험 지금 굴리는 중

LR 1/N & 알파 N배 했을때 결과 비슷할것인가 볼려는데

해석 가능할 수준의 결과가 보이면 좋겠네



언제부터인가 로라에 정규화라는 말 자체를 보기 어렵게 되었는데

그럼 이 쓰잘데기 없는 기능을 왜 넣은걸까 싶어서

실험은 못해보고 맷돌만 굴려본것이


가령 노란 야구모자를 쓴 빨간 트윈테일 캐 로라를 만든다 치자

재료가 존나게 없어 이미지 석장 달랑들고 학습해야 하는 상황

태깅이고 나발이고 이미지가 저러면 뭘 해도 과적합이 나겠지

로라니까 용서가 됨. 딴캐 그릴거면 로라 호출을 안 하면 되니까


자 그럼

저 캐릭 모자를 딴걸 씌우고 싶다면?

모자 벗기고 싶다면?

트윈테일만 되나?

이거때문에 정규화가 있는거 같음


노란 모자라 했는데

색은 집어치고 모자를 안 쓴 맨머리는 불가능할거다

학습 안했으니까

그럼 모자를 바꾸는 것은?

모자 프롬프트가 로라 학습으로 오염되서 무조건 노란 모자만 쓸테니까 정규화에서만 모자를 존나게 학습시켜 물타기 하는거


???

그럼 캐릭의 클래스가 모자라는 건가?

싶을건데

나도 예전에는 그 클래스라는게 그렇게 기능하는 줄 알았지

근데 다른 로라학습 글 본거중에

폴더명으로 지정하는 트리거워드/클래스명은 캡션이 지정되 있지 않을때나 기능한다는 거

이거 보고나서 요새 학습이미지 분류할때


N_트리거워드 클래스명

의 형식인 코햐스크립트 학습폴더에

클래스자리에 메모를 넣고 있음

흰색 배경 이라던가 뽀샵으로 크기를 키웠다던가


그러니 정규화라는 기능은

학습에 뭐 특별히 도움되는게 아니고

데이터가 너무 적은 경우 트리거워드만 조지고(과적합)

나머지 일반 프롬프트는 학습 안한것마냥 회복을 시켜주자 라는 용도

그러니 학습데이터가 존나 많으면 정규화가 필요 없다 하는거겠지

오염이 덜되니까


만일 위에 말한 캐릭 학습이미지가 천장쯤 있다치자

모두 다른 그림이라면

몽땅 모자쓴 그림만 모으기도 힘들겠지만

기적같이 모자쓴걸로 천장 수집했더라도 모자는 다 다르겠지



뭐 이런 이유로 학습데이터는 다다익선이고

한 가지 통일된 주제 외에는 모조리 다 다른 이미지라야 한다는거

웨딩드레스 이미지로만 백장 모아서 캐릭학습을 시켰는데 바지를 몬입네요

수학학원만 일주일에 스무시간 보내놓고 영어점수가 왜 쓰레기냐고 묻는거랑 같을겅미



요하간 확고한 이론을 가졌든, 감각적으로든

지금 로라 만들면서 정규화 이야기는 말하는 사람도 없고 묻는 사람도 없음


좋은 로라를 만들고 싶으면

걍 재료를 존나 모아라

이게 성공으로의 절반이다


나도 쓰레기 존나 만들어가면서도

이미지 백장일때랑 육백장일때랑 뭐 된다싶은 빈도 자체가 다르더라

과적합 옵션은 최후의 발악이라 본다


이건 잡담으로 끝낼거임

반년전에 학습이 영 안되길래 정규화 넣고 해본적이 있었는데

지금 생각해보면 등신짓이었지

제대로 배운것도 없는데 할 필요도 없는 정규화과정까지 거쳤으니