계속 밖에있어서 이제야 리뷰하고 상황을 좀 파악했음.. 쥐송..


말로 자세히 설명해주고 싶은데, 내용도 산으로 가고 개발자 아니면 이해하기 힘든내용이 많아서 간단하게 요약하면


현재 상태

- 정상적으로 수집은 완료한 상태이지만 그대로 업로드는 할 수 없는 상황




봉착한 문제 (왜곡된 설명임)


1. 퍼온 HTML 텍스트 내의 IMG 링크의 경우 hjreps.com 주소에서만 유효함.


2. 아카라이브의 정식적인 API가 없어서 업로드 할 때 꼼수를 좀 써야댐.




해결방법 모색중임


1. IMG를 다운로드해서 인코딩 한다음 업로드.


2. 글쓰기(업로드) 할 때 요청하는 쿠키 / 토큰 등을 파악해서 직접 요청(업로드 액션)





- 정 안되면 크롤링데이터 관련 위법 유무 확인해보고 가능한 선에서 페이지 호스팅 해봄. 






열심히 노력 중 이에양....


+ 추가 

집계해보니까 오류때문에 수집 안된거 감안하고도 대략 2만건 정도의 렙후기가 스크랩된거같음!