시계열 데이터 분석중이라 datetime을 여러 시간 컬럼으로 쪼개고 있는데

그 중 dt.day에서 문제가 생겼음


약 5달치 데이터라 컬럼 생성 후 각 일자별 갯수를 그래프화했는데


이렇게 나옴

아무리 봐도 17일 데이터가 비정상적으로 많은 상황이다 보니 df['day'] == 17인 데이터만 따로 뽑아서 csv로 다운받아 확인해봤는데




17일이 아닌 다른 일자의 데이터들이 17일로 들어가있음...

22년 11월 18일부터 11월 22일까지 전부 17일로 저장되어 있더라




당연히 to_datetime으로 datetime 변환해줬고


df['day'] = df['DataSavedTime'].dt.day


코드도 진짜 별거 없는 저 한줄로 day 컬럼 만든거고 그 이후로 day 컬럼 건들지도 않는데

왜 이렇게 나오는질 모르겠음....



직접 series 만들어서 해보면 잘만 되는데 왜이러는질 모르겠네