새벽부터 출장인 관계로 속편히 일찍 잘 겸해서

매번 2.5s/it 정도라

32000스텝 준비하고 20시간쯤 예상했는데

지금 보니까 26시간은 먹겠네 OTL

남은시간 12시간에 2.83s/it


뭔가 버전이 바뀔때마다 느려지는거 같은데

어짜피 느려질거면 웨이트캡션이나 좀

꼬라지가 집에 가면 걍 아무 학습 돌리고 바로 자야 할 판



데이터셋 학습이 caption_prefix 인자로 일괄 태그추가가 생각보다 편한데

다른 데이터셋 추가하는것도 폴더 이동 필요없이 경로만 바꾸면 되니 섞기도 좋고

문제는 일괄 태그로 추가한게 메타데이터에 남지를 않음

메모를 남기면 모르겠는데 중구난방 추가한걸 메모화하는것도 쉽지가 않음


셔플캡션 구분하는건 맘에 드는것이

A+B 로라를 만드는데

A는 트리거 하나

B는 트리거 셋이면

A쪽 데이터에 적당한 태그를 앞으로 보내서 트리거 셋 맞추는것도 짜증이었는데

데이터셋은 걍 킵토큰 지정 따로하고 끝



지금까지 데이터셋 사용으로 느낀 장단점은


이미지 경로가 직관적 - 리핏_클래스 형식도 지킬 필요없고 많이들 헷갈려하는 상위 디렉토리 지정도 신경쓸 필요 없음

리핏 제어 - 폴더가 여럿인 경우 하나하나 고쳐야 하는데 이건 toml 파일 하나 고치면 됨

일괄 태깅 - 코햐스크립트 일괄태깅 싸악 돌리던걸 prefix 옵션으로 대응. 단 제거하는건 없어서 일괄 돌려줘야 함

해상도 /배치수 짬뽕 - 해상도 낮은 학습데이터 굳이 업스케일 안하고 걍 낮은 해상도로 지정

512, 768, 1024 세 묶음으로 준비. 각각 배치수도 따로


prefix로 추가한 태그가 메타데이터에 기록이 안됨

모르고 보면 태깅도 안하고 학습한 병신로라로 보이기 딱 좋음

리핏 에포크 자동계산이 안됨 - 코햐스크립트 원론적인 문제

이미지 폴더내 리핏x에포크/배치수를 기본으로 하다보니

메타데이터로 학습시키면 해당하는 이미지수랑 매치가 안되서 에포크수가 개판남

걍 최대 스텝수도 대충 계산해서 수기입해야 함


일단은 이런 정도

한 번 바꾸고 나니 이젠 전량 데이터셋 파일로 학습시키네


출장와서 할게 없으니 제목하고 본문이 따로노는데