무소의 뿔처럼
R) 차트 만들어보기~ 청주_코로나_구별 본문
파일은 공공데이터포털에서 받아봄.
파일명: 충청북도 청주시_코로나19 확진자 및 사망자 현황_20211231.csv
확진자,확진일,거주지,추정감염경로,사망자,사망일,데이터 기준일
청주-5261,2021-12-31,청원구,조사중,,,2021-12-31
청주-5260,2021-12-31,청원구,청주 확진자 접촉,,,2021-12-31
청주-5259,2021-12-31,청원구,청주 확진자 접촉,,,2021-12-31
청주-5258,2021-12-31,세종시,조사중,,,2021-12-31
데이터는 이렇게 되어 있다.
흠... 거주지를 차트로 만들 수밖에 없어 보인다..
차트 하나 만들어 보겠다는 생각으로
생각 없이 xlsx을 다운받아 배운 함수 넣다 보니 차트가 이상했다.
거주지에는 청주의 4개의 구 외에
세종시, 서울시, 증평군 등이 있었다.
상당구도 '상당구'와 '상당'으로 나눠져 있고, 오타도 있어서
엑셀로 정리하고 나머지 지역은 빼버렸다.
원본은 두고, 다른 csv로 저장해서 R studio에서 불러봄..
install.packages('readxl')
library(readxl)
CheongJu <- read_excel('C:/R_work/CheongJu_covid/co.xlsx')
View(CheongJu)
dim(CheongJu)
qplot(data=CheongJu,거주지)
qplot(data=CheongJu,확진일)
두 data를 어떻게 합쳐야 할지 몰라서
라이브갭 가서 만듦.
기간 : 2020-03-26 ~ 2021-12-31
데이터 기준일 : 2021-12-31
11.3배, 14.1배, 8.8배, 8.9배 (소수점 둘째 자리 버림)
-전체적으로 몇 배나 늘었다는 건 알겟다..
-코로나 첫 확진자 2020. 01. 20
-위드 코로나 2021. 11. 01 시행
-오미크론 첫 확진자 2021. 12. 02 (2021. 11. 30. 오미크론 의심)
위드코로나 기준으로 앞, 뒤 1개월씩 비교해보기
초록색이 11월,
위드코로나 시작 첫 달인데 다들 조심하는 듯
10월, 12월 보다 확진자 수치가 낮다.
이때쯤 ' 어차피 걸릴 놈은 걸린다. ' 라는 말이 나왔었던 기억이 난다.
위드 코로나 이후 구별로 수치가 상이하길래 인구수 때문인가 하고 인구수 가져옴
2021.10 | 2021.11 | 2021.12 | |
상당구 | 84,084 | 84,461 | 84,548 |
서원구 | 88,854 | 88,934 | 89,194 |
청원구 | 89,066 | 89,547 | 89,575 |
흥덕구 | 123,290 | 123,659 | 123,699 |
흥덕구는 인구가 많아서 넘어가고
상당구, 서원구, 청원구는 비슷비슷한데 왜 그래프가 .. 차이가 클까
상당구에 유동인구 (회사, 시내, 육거리시장 등등)가 많아서 일 것 같다.
출처 : 청주시 통계정보
청주 지리를 잘 모르고, 어디에 무엇이 위치해있고, 사람이 어디에 많은지
잘 모르기 때문에 그래프로만 봤을 때는 그렇지 않을까 하고
조심스럽게 결론 내어봄.
아쉬운 점 :
확진환자가 나왔을 때 '진료소'기준인지, '거주지'기준인지 모르겠다.ㅠㅠ
동선을 모르니 걸렸겠다 싶은 장소를 기준 삼지는 못할 것이고..
공공데이터에서 받아본 엑셀 파일에 다른 지역 사람도 있는 거 보면
진료소 기준으로 판단해도 좋을 것 같다.
그러면 상당구가 저렇게 많이 나오는 것은
상당구에 진료소가 많거나,
회사 근처의 진료소를 갔거나,
시내 나온 김에 진료소를 들렸거나.. 인가?
언젠가 위드 코로나의 성공을 알수있는 차트를
만들어 볼 수 있겠지?
'R' 카테고리의 다른 글
크롤링 서버연결 오류_기록 (0) | 2022.04.24 |
---|---|
거리두기 해제_차트그려보기 (0) | 2022.04.20 |
클라우드 담당자 교육 필요분야 1순위& 1순위+2순위 (2017~2019) (0) | 2022.04.12 |
R) 클라우드 담당인력 수급애로사항 및 채용고려사항 2017~2019년 (0) | 2022.04.11 |
R) 전처리 함수 등 나열 (0) | 2022.03.26 |