일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- TF-IDF
- 깊이우선탐색
- 그리디
- dp
- 우선순위큐
- 건축물대장정보
- 재귀
- GroupBy
- NLP
- geopy
- 지진대피소
- 너비우선탐색
- 그래프탐색
- pandas
- 코사인유사도
- 수학
- 유클리드
- 분할정복
- 공공데이터
- 비트마스킹
- xmltodict
- 자연어처리
- 누적합
- 유사도
- 전처리
- 구현
- Geocoding
- cosine
- 백준
- 그래프이론
- Today
- Total
목록전처리 (3)
정리용

이전글 : https://pyjac.tistory.com/61 [openAPI] 공공데이터 - 건축물대장정보 (xmltodict) 0. 준비물 (1) 시군구 / 법정동 코드 정보 https://www.code.go.kr/index.do 행정표준코드 관리시스템 www.code.go.kr (2) 공공데이터 인증키 - 방법 생략 - (3) 라이브러리 설치 !pip install xmltodict 1. 데.. pyjac.tistory.com 1. csv 파일 불러오기 이전글에서 생성한 csv파일을 불러온다 import pandas as pd df = pd.read_csv('/content/drive/MyDrive/csv/건축물대장정보.csv') 2. 라이브러리 설치 geopy 라이브러리를 ..

0. 준비물 (1) 시군구 / 법정동 코드 정보 https://www.code.go.kr/index.do 행정표준코드 관리시스템 www.code.go.kr (2) 공공데이터 인증키 - 방법 생략 - (3) 라이브러리 설치 !pip install xmltodict 1. 데이터 파악 해당 페이지에서 Request시에 필수적으로 요청해야하는 항목을 파악한다 항목구분을 보면 시군구 코드(sigunguCd)와 법정동 코드(bjdongCd)가 필수임을 알 수있다. 추가적으로 모든 자료를 요청하기 위해 리스트수(numOfRows)도 같이 요청한다. 또한 해당 자료는 Json 이 제공되지 않고 xml 형태로만 제공되므로 xmltodict을 이용한다. 미리보기 디폴트로 제공되는 강남구 개포동을 불러온다. import r..

프로젝트를 진행하다보면 주소를 위경도로 나타내어 QGIS 등으로 이용해야하는 경우가 많이 있다. http://www.geocoding.co.kr/ 위와 같은 지오코딩 사이트를 이용해 수작업을 하거나 셀리니움을 이용하는 방법도 있지만 구글 스프레드 시트를 이용하면 쉽고 빠르게 변환할 수 있다. 1. 먼저 구글 드라이브를 들어가서 오른쪽 클릭을 하여 빈 스프레드 시트를 만들어준다. https://drive.google.com/drive Google Drive - 모든 파일을 한 곳에서 하나의 계정으로 모든 Google 서비스를 Google Drive로 이동하려면 로그인하세요. accounts.google.com 2. 부가기능 설치 탭에 들어가 Geocode by AWESOME TABL 을 검색하고 설치해준다..