Previously on the #Project_DJ 


지저분한 데이터 깔끔하게 만들기를 실습한다. 


데이터 전처리 도구 1. Dataprep  


참고로 Dataprep은 12개월 무료 체험 후 결제해야 사용할 수 있다. 강좌 명이 '데이터 저널리즘과 무료 도구를 이용한 시각화'이기에 다소 낚인 기분이지만, 1년은 꽤 긴 기간이니 넘어가도록 한다. 



Dataprep 실습을 위한 정제 전 데이터는 여기에서 다운로드 받으면 된다
managed long term care이라는 파일명으로, 아래 그림과 같이 지저분한 데이터다.



위 raw data가 Dataprep에서 정제 후 



이런 .csv 파일 모습으로 됐다. 

지금까지 Dataprep을 몇 번 사용하며 발견한 불편한 점은 한글 깨짐 현상이 발생한다는 것. 인코딩 기본 설정이 UTF-8로 돼 있는데도 왜 깨지는 것인가... 어떻게 해결해야 하는 것인가..... ㅠ 



데이터 전처리 도구 2. OpenRefine 

OpenRefine은 로컬(본인 컴퓨터)에서 작동하기 때문에 인터넷 연결 없이도 사용할 수 있다.