공공데이터포털에서 OPEN API 사용하기(with Python)
데이터를 구할 때 공공데이터포털에서 자주 구하는데 csv나 xlsx파일이 아닌 json이나 xml파일로 다운받아야 할 때가 많다!
그래서 어떻게 데이터를 받을 수 있는 건지 적어보겠다 ㅎㅅㅎ
이 글에서는 파일 형태가 "JSON"인 경우를 다뤄보겠다.
1. 먼저 공공데이터포털에 접속한다.
공공데이터 포털
국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Datase
www.data.go.kr
2. 로그인 후 원하는 데이터를 찾아 활용신청 클릭
3. 활용 목적 입력후 활용신청 버튼 클릭
4. 마이페이지에서 발급받은 키를 확인하고 이 키를 사용!
4. 요청변수들을 확인! 필수인 경우 그 변수 값을 꼭 입력해줘야 하니 참고해야 한다!
5. 이제 준비는 끝났고 파이썬을 통해서 데이터를 불러와보겠다.
다음과 같은 코드를 입력해 준다. 이 부분은 사용하는 데이터에 따라 다르다.
따라서 본인이 선택한 데이터 페이지에서 맨 아래에 샘플코드를 참고해서 작성하면 된다!
여기서 중요한 점은 params에서 서비스키 자리에 본인이 발급받은 키를 입력하면 된다!
위의 결과에서 사용해야 할 부분이 EarthquakeOutdoorsShelter아래의 리스트에서 2번째의 'row'아래에 있으므로
이렇게 코드를 작성해 주면 된다.
여기서 pd.json_normalize는 json을 데이터프레임으로 만들어준다!
엄청 간편하다
그러면 다음과 같은 깔끔한 데이터프레임을 생성할 수 있다!!
데이터의 형식에 따라 이 과정에 맞지 않을 수도 있으니 본인이 가져올 데이터가 어떤 구조인지 파악하고
그에 맞게 불러오는 것이 중요하다 *ㅅ*

이 글이 도움이 되었으면 좋겠네요!
모두 파이팅~~