이전글:https://arca.live/b/city/64133067?target=all&keyword=%ED%8F%89%ED%83%9D%EA%B0%95&p=1


지난번에 열섬현상과 미세먼지에 대해 영향을 끼치는 요인을 선정했으니 오늘은 그 요인이 타당한지에 대해 알아보도록 하겠음.


우선, 오늘은 열섬 현상에 관련된 요인들에 대해 검증할 예정인데 보닌에게는 열섬 현상과 기타 요인의 관계에 대해 직접적으로 알려주는 데이터가 없으므로 직접 만들어서 쓰도록 할 거임.


일단, 기상청 기후통계 홈페이지에 들어가서 방재기상관측 자료를 다운받도록 하겠음. 방재기상정보에는 일 최고 기온 데이터가 있어서 열섬 현상의 관측이 비교적 뚜렷한데다가 관측소의 개수가 전국 502개로 가장 많아 표본의 개수가 확실히 늘어나서 이번 프로젝트에 활용했음. 날짜는 비만 오지 않는다면 여름 아무 때나 상관없는데 보닌은 2020년 7월 2일로 함. 


기상청 방재기상관측 사이트

최고기온 정보


최고기온 정보를 받았으면 이제 관측지점 정보를 다운받은 뒤 결합함. 관측지점 정보는 메타데이터 클릭하면 다운받을 수 있음. 다운받을 때 보면 2020년 7월 2일에 관측이 진행되지 않은 곳의 정보도 담겨있는데 그건 지운 뒤 결합해야 함


관측지점정보 다운받는 곳

관측지점 정보를 결합한 모습


관측지점 정보를 잘 결합했다면 구분자로 구분된 텍스트 레이어 기능을 이용해서 그 파일을 이제 QGIS에 불러와 줌. 이때 아까 결합된 최고기온 데이터는 사라지지 않으므로 걱정하지 않아도 됨. 여기서 인코딩은 korean, x필드는 경도, Y필드는 위도로 설정해 줘야 나중에 부작용(?)이 안생김.



아까 만든 파일을 QGIS에 불러오는 모습


그 뒤로 500m 반경으로 벡터-지리정보 처리도구-벡터로 들어가서 버퍼를 씌워주면 됨. 여기서 버퍼의 역할은 바로 포인트 반경 500m내를 둘러싼 폴리곤이 되어주는 건데 본 프로젝트에서는 요 버퍼와 겹치는 녹지, 공장지 넓이, 도로 넓이, 하천 넓이, 상업지 넓이, 주거지 넓이를 구해서 요것들과 2020년 7월 2일 최고기온과의 상관관계를 구할 예정임,

 

포인트 좌표에 버퍼를 씌우는 모습

버퍼를 씌우고 난 모습


그 다음에는 토지 피복도를 QGIS에 불러와 줌 그러면 토지 피복도와 겹치지 않은 버퍼가 생길텐데 그런 버퍼들을 모두 선택한 뒤 선택 반전을 누르면 토지 피복도와 겹치는 부분의 버퍼만 선택됨. 이때 선택한 객체를 다른 이름으로 저장하기 버튼을 누르면 토지피복도와 중복되는 버퍼만이 선택될거임.

토지피복도와 겹치지 않는 버퍼만을 선택한 모습

선택반전을 누르는 모습

선택한 객체만 내보내기로 토지피복도와 겹치는 레이어만 내보내는 모습


지난번에는 토지피복도에서 녹지 영역을 먼저 분리해 냈는데 이번에는 도로 영역을 먼저 내보내도록 하겠음. 먼저 표현식을 활용해 객체 선택 기능을 활용하여 도로에 해당하는 코드의 영역만 선택한 뒤 분리해주고 분리된 도로 영역은 벡터-디졸브 기능을 활용하여 디졸브 시켜주면 됨. 이 과정에 대한 자세한 설명은 지난 글을 참고하시기 바람.


도로 영역만 선택하는 모습. 도로의 코드는 150이므로 표현식에다가는 "lv2_code"=150을 입력하면 됨

선택한 도로 객체를 분리하는 모습

도로 레이어를 디졸브시키는 모습

디졸브를 마치고 투명도를 올려준 도로 레이어의 모습.


그 다음에는 이전 글과 마찬가지로 버퍼 레이어에 맞추어 도로 레이어를 잘라낸 후에 필드 계산기 열기 기능을 활용해 잘린 도로 레이어의 면적을 구해주면 됨. 이전 글에서는 각 동의 면적이 달랐기에 각 동의 넓이도 따로 구해서 녹지 비율을 구했지만, 이번에는 버퍼들의 면적이 동일하기 때문에 굳이 그럴 필요가 없음.


잘라내기 기능을 실행하는 모습

도로의 면적을 구하기 위해 필드 계산기를 여는 모습

도로의 면적을 구하기 위해 수식을 입력하는 모습. 여기선 간단하게 $area만 입력하면 됨


다 구했으면 이제 레이어를 우클릭한 뒤 다른 포멧으로 내보내기를 눌러서 csv 파일로 내보내면 됨. 이후 앞서 했던 짓거리를 반복해서 도로 넓이 뿐만 아니라 하천 면적, 녹지 면적, 주거지 면적, 상업용지 면적 등에 대한 데이터도 만든 뒤 추출해주고 이 데이터들을 하나의 csv파일로 모아줌


아까 구한 데이터를 csv로 내보낸 모습

열거한 요인에 관한 데이터를 모두 만들어서 끌어모은 파일 "열섬 3.csv"


다 묶어줬으면 이제 요놈들을 통계적으로 분석하기 위해 Rstudio로 불러온 뒤 회귀분석 해주면 됨. Rstudio는 앞으로 연재할 계량지리학 프로젝트에서(2주 안에 시험 두개와 프로젝트 발표 3개를 해내야 하는 내인생이 레전드;;; 이러니까 지리공학과 소리 듣지)  자주 나올 친구인데 지금 간략히 설명하자면 뉴질랜드에서 개발한 통계 프로그램이라고 보면 됨.


Rstudio로 변수들 끼리의 상관관계를 구한 모습


여기서 결과값을 일일히 설명하면 지면이 모자르므로 자세한 건 다음 글에서 설명하겠는데 이번 글에서 꼭 설명해야 할 중요한 수치는 바로 p-value임. p-value는 한마디로 이야기하자면 통계모델의 신뢰도를 제공해 주는 수치인데 귀무가설(통계모델이 틀렸다고 가정한 가설)이 맞을 확률을 보여주는 값임. 즉 언론에서 여론조사를 할 때 스테레오타입으로 등장하던 신뢰범위 95%라는 소리는 p-value가 0.05보다 작다는 소리로 해석할 수 있음. 


쨌든 저 모델의 p-value는 0.03 정도이므로 저 모델은 신뢰구간 95% 내에서 유효하며 녹지넓이와 상업시설넓이 역시 p-value가 0.05를 초과하지 않았으므로 신뢰구간 95% 내에서 유효한 변수임을 확인할 수 있음.  


단계구분도 제작 편으로 넘어갑니다