Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 디지털기초역량훈련
- 웹개발자를위한자바스크립트의모든것
- es6
- 패스트캠퍼스
- 일본워홀서류
- css
- flexbox
- python turtle
- 파이썬터틀
- 독후감
- 일본워킹홀리데이계획서
- 일러스트레이터강의
- 클린코드
- 노개북
- 5장형식맞추기
- 내일배움카드
- 자바스크립트
- python
- 코딩 #개발자 #노마드북클럽 #노개북
- JavaScript
- 중첩된객체
- 파이썬
- 일본워킹홀리데이이유서
- 플렉스박스
- 9장단위테스트
- 국비지원
- 바이트디그리
- 7장오류처리
- 3장함수
- 디스트럭처링
Archives
- Today
- Total
목록표 크롤링 (1)
KARIU의 IT 블로그

파이썬으로 서울 지하철 데이터를 크롤링하다가 발견한 쉽고 간편한 방법이 있어서 소개합니다. 바로 위와 같이 모든 행들이 따로따로 분리 되어 있는 것이 아니라 노선의 "서울 지하철 4호선" 처럼 모든 행들이 하나로 합쳐져 있는 것도 있고 소재지의 "노원구" , "도봉구", "강북구" 등과 같이 임의적으로 쪼개져 행들이 합쳐져 있는 복잡한 표를 깔끔하게 가져오는 방법입니다. html_parser_table의 make2d를 이용하시면 깔끔하게 정보를 가져오실 수 있습니다. 1. 설치 html_parser_table의 make2d를 사용하기에 앞서 먼저 설치를 해줘야합니다. 위와 같은 명령을 터미널 창에 입력하여 html_parser_table을 설치합니다. 2. requests 요청과 해당 데이터가 있는 부분..
프로그래밍 언어/Python Crawling
2021. 5. 27. 23:28