무소의 뿔처럼

R) 차트 만들어보기~ 청주_코로나_구별 본문

R

R) 차트 만들어보기~ 청주_코로나_구별

값을변경 2022. 3. 26. 20:16

파일은 공공데이터포털에서 받아봄.

파일명: 충청북도 청주시_코로나19 확진자 및 사망자 현황_20211231.csv

확진자,확진일,거주지,추정감염경로,사망자,사망일,데이터 기준일
청주-5261,2021-12-31,청원구,조사중,,,2021-12-31
청주-5260,2021-12-31,청원구,청주 확진자 접촉,,,2021-12-31
청주-5259,2021-12-31,청원구,청주 확진자 접촉,,,2021-12-31
청주-5258,2021-12-31,세종시,조사중,,,2021-12-31

데이터는 이렇게 되어 있다. 

흠... 거주지를 차트로 만들 수밖에 없어 보인다.. 

 

차트 하나 만들어 보겠다는 생각으로

생각 없이 xlsx을 다운받아 배운 함수 넣다 보니 차트가 이상했다.

 

거주지에는 청주의 4개의 구 외에

세종시, 서울시, 증평군 등이 있었다.

상당구도 '상당구'와 '상당'으로 나눠져 있고, 오타도 있어서

엑셀로 정리하고 나머지 지역은 빼버렸다.

 

원본은 두고, 다른 csv로 저장해서 R studio에서 불러봄..

install.packages('readxl')
library(readxl)

CheongJu <- read_excel('C:/R_work/CheongJu_covid/co.xlsx')

View(CheongJu)

dim(CheongJu)

qplot(data=CheongJu,거주지)
qplot(data=CheongJu,확진일)

 

 

 


두 data를 어떻게 합쳐야 할지 몰라서 

라이브갭 가서 만듦.

 

기간 : 2020-03-26 ~ 2021-12-31

데이터 기준일 : 2021-12-31

11.3배, 14.1배, 8.8배, 8.9배 (소수점 둘째 자리 버림)

-전체적으로 몇 배나 늘었다는 건 알겟다..

 

-코로나 첫 확진자 2020. 01. 20

-위드 코로나 2021. 11. 01 시행

-오미크론 첫 확진자 2021. 12. 02 (2021. 11. 30. 오미크론 의심)


위드코로나 기준으로 앞, 뒤 1개월씩 비교해보기

초록색이 11월,

위드코로나 시작 첫 달인데 다들 조심하는 듯

10월, 12월 보다 확진자 수치가 낮다.

이때쯤 ' 어차피 걸릴 놈은 걸린다. ' 라는 말이 나왔었던 기억이 난다.

 

위드 코로나 이후 구별로 수치가 상이하길래 인구수 때문인가 하고 인구수 가져옴

  2021.10 2021.11 2021.12
상당구 84,084 84,461 84,548
서원구 88,854 88,934 89,194
청원구 89,066 89,547 89,575
흥덕구 123,290 123,659 123,699

 

흥덕구는 인구가 많아서 넘어가고

상당구, 서원구, 청원구는 비슷비슷한데 왜 그래프가 .. 차이가 클까

상당구에 유동인구 (회사, 시내, 육거리시장 등등)가 많아서 일 것 같다.

     출처 : 청주시 통계정보

 

청주 지리를 잘 모르고, 어디에 무엇이 위치해있고, 사람이 어디에 많은지

잘 모르기 때문에 그래프로만 봤을 때는 그렇지 않을까 하고

조심스럽게 결론 내어봄.

 

아쉬운 점 :  

확진환자가 나왔을 때 '진료소'기준인지, '거주지'기준인지 모르겠다.ㅠㅠ

동선을 모르니 걸렸겠다 싶은 장소를 기준 삼지는 못할 것이고..

공공데이터에서 받아본 엑셀 파일에 다른 지역 사람도 있는 거 보면

진료소 기준으로 판단해도 좋을 것 같다.

 

그러면 상당구가 저렇게 많이 나오는 것은 

상당구에 진료소가 많거나, 

회사 근처의 진료소를 갔거나,

시내 나온 김에 진료소를 들렸거나.. 인가?

 

언젠가 위드 코로나의 성공을 알수있는 차트를 

만들어 볼 수 있겠지? 

 

 

Comments