Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 내일배움카드
- 일본워킹홀리데이이유서
- 노개북
- JavaScript
- 중첩된객체
- python turtle
- 9장단위테스트
- es6
- 플렉스박스
- 바이트디그리
- 패스트캠퍼스
- python
- css
- 5장형식맞추기
- 코딩 #개발자 #노마드북클럽 #노개북
- 일러스트레이터강의
- flexbox
- 디스트럭처링
- 3장함수
- 디지털기초역량훈련
- 파이썬터틀
- 일본워킹홀리데이계획서
- 클린코드
- 독후감
- 웹개발자를위한자바스크립트의모든것
- 자바스크립트
- 일본워홀서류
- 국비지원
- 파이썬
- 7장오류처리
Archives
- Today
- Total
목록표 크롤링 (1)
KARIU의 IT 블로그

파이썬으로 서울 지하철 데이터를 크롤링하다가 발견한 쉽고 간편한 방법이 있어서 소개합니다. 바로 위와 같이 모든 행들이 따로따로 분리 되어 있는 것이 아니라 노선의 "서울 지하철 4호선" 처럼 모든 행들이 하나로 합쳐져 있는 것도 있고 소재지의 "노원구" , "도봉구", "강북구" 등과 같이 임의적으로 쪼개져 행들이 합쳐져 있는 복잡한 표를 깔끔하게 가져오는 방법입니다. html_parser_table의 make2d를 이용하시면 깔끔하게 정보를 가져오실 수 있습니다. 1. 설치 html_parser_table의 make2d를 사용하기에 앞서 먼저 설치를 해줘야합니다. 위와 같은 명령을 터미널 창에 입력하여 html_parser_table을 설치합니다. 2. requests 요청과 해당 데이터가 있는 부분..
프로그래밍 언어/Python Crawling
2021. 5. 27. 23:28