반응형
네이버 부동산에는 정말 많은 매물들이 있는데
하나 하나 손으로 정리하려고 하면 상당히 귀찮습니다.
그래서 약간의 python 실력만으로도 손쉽게
원하는 단지의 매물 리스트를 뽑아내는 크롤러를 만들어 볼까 합니다
웹 동작 제어를 할 수 있게 해주는 Selenium과
크롤링해온 HTML을 parsing 해주는 BeautifulSoup을 이용하려고합니다.
첫번째로 Selenium을 사용하기 위해 Chromedriver 설치 파일이 필요합니다
1. 자신의 크롬 버전 확인하기
Chrome 브라우저의 우측 상단의 점 세개 버튼 - 도움말 - Chrome 정보 클릭하면
현재 사용하고 있는 Chrome의 버전을 확인할 수 있습니다.
저의 경우에는 Chrome dl 112.~ 버전임을 확인할 수 있습니다.
2. 크롬드라이버 다운로드 :
https://chromedriver.chromium.org/downloads
위의 크롬드라이버 다운로드 사이트에서 1.에서 확인한 버전에 맞는 드라이버를 다운받습니다
저는 112.~ 버전으로 112버전에 해당하는 설치파일을 받았습니다.
3. Selenium 실행
path_driver 에 다운 받은 Chromedriver.exe 의 경로를 넣어두고
python에서 다음과 같이 Selenium으로 크롬이 제어되는지 확인합니다.
아래 코드 처럼 실행시키고
# selenium 웹드라이버 import
from selenium import webdriver
# 웹드라이버 설치파일 위치
path_driver = "C:/Users/woori/Desktop/python/chromedriver.exe"
# 웹 드라이버 초기화
driver = webdriver.Chrome(executable_path = path_driver) # 웹 드라이버의 경로를 설정해주세요.
driver.implicitly_wait(10) # 암묵적으로 웹 페이지가 로드될 때까지 대기할 최대 시간을 설정해주세요.
# 네이버 부동산 홈url
url = "https://land.naver.com/"
# 지정된 url로 웹드라이버 실행
driver.get(url)
위와 같이 네이버 부동산 화면이 뜨면 끝!
'Python' 카테고리의 다른 글
업비트 API key 받아 pyupbit 사용해보기 [암호화폐 알고리즘 매매를 위한 디딤돌 쌓기 #1] (0) | 2023.06.04 |
---|---|
[네이버 부동산 매물 크롤링 #4] 매물 정보 크롤링 (1) | 2023.06.02 |
[네이버 부동산 매물 크롤링 #3] 매물 번호 크롤링 (1) | 2023.05.10 |
[네이버 부동산 매물 크롤링 #2] 네이버 부동산 URL 페이지 분석 (0) | 2023.05.08 |
댓글