용량은 딱히 관계 없고 어떤 학습 데이터(그림)와 키워드(태그), 텍스트 인코더로 학습 됐느냐에 따라서 나눠짐
체크포인트 모델이 가질 수 있는 학습 데이터의 크기는 정해져있고 모델에 학습에 필요한 정보 있는가? 어떤 자료형으로 저장되어 있는가? 에 따라서 그 크기가 바뀜
예를 들어 1.9GB 는 학습 데이터는 짤리고 fp16 으로 저장된 것, 4GB 는 학습 데이터는 짤리고 fp32 로 저장된 것
두 모델을 합친다고 용량이 늘어나지 않는 것도 대표적인 예