본격적으로 네이버 부동산 매물을 크롤링하기 전에
부동산 페이지를 분석해보았습니다.
일단 저는 모바일 네이버 부동산 페이지를 크롤링할 예정이라
모바일 네이버 부동산 페이지의 단지 기본 페이지 부터 시작했습니다.
1) 모바일 네이버 부동산 매물 페이지 URL 분석
1-1) 네이버 부동산 단지 기본 페이지 분석
원하는 단지의 기본 페이지로 들어갑니다
저는 작년에 관심 많았던 용현동 부성로얄 페이지로 들어왔습니다.
일단 기본정보 페이지의 URL 주소를 분석해봅니다.
총 3개의 부분으로 이루어져 있습니다.
1) https://m.land.naver.com/complex/info : 네이버 부동산 매물 기본 주소
2) 8109 : 건물 번호로 보입니다 부성로얄은 8109, 서초그랑자이는 126726 입니다.
3) ? : 여기서부터 전달할 데이터가 작성된다는 의미 (GET 방식에서)
4) ptpNo=1 : 평형 타입이 첫번째 탭이 1, 두번째 탭이 2 이런 식입니다.
1-2) 매물 리스트 페이지 페이지 분석
두번째로 매물정보 페이지의 URL을 분석입니다.
단지 기본 정보에서 "매물" 탭을 누르면 다음과 같이 나옵니다.
이 페이지에서 내가 원하는 매물들의 리스트를 가져올 수 있습니다.
전체 url은 이렇게 생겼습니다.
이 url을 두개의 부분으로 분리 해볼 수 있을 것 같습니다.
첫번째 부분은 네이버 부동산에서 부성로얄(8109) 에 대한 정보를 나타내고
두번째 부분은
4개의 부분으로 이루어져 있는데 앞의 3가지는 빨간색으로 네모 친 탭들에 해당합니다.
1) tradTpCd= : 거래유형으로 매매는 A1 이런 식입니다.
2) ptpNo=1 : 평형 타입이 첫번째 탭이 1, 두번째 탭이 2 이런 식입니다.
3) bildN= : 동별 탭입니다 원하는 특정 동이 있는 경우 지정해 줄 수 있습니다.
articleListYN=Y 는 변경하면 기본 페이지로 연결 되는 걸로 봐서는
매물 리스트를 보여주는 부분인 듯 합니다.
1-3) 개별 매물 페이지 분석
이전 페이지에서 매물을 클릭하면 (아래 빨간색 box)
개별 매물에 대한 페이지로 이동합니다.
개별 매물에 대한 페이지는
~info/ + 매물 번호로 이루어져있습니다.
이 매물 번호로 URL을 조회할 수 있을 것 같습니다.
1-4) 결론
기본 단지정보 → 매물리스트 정보 → 개별 매물 정보 순으로
모바일 네이버 부동산 페이지를 이동해가면서 URL을 짚어 보니
원하는 단지의 개별 매물들에 대한 정보를 수집하기 위해서는
다음의 두 가지를 크롤링 해야할 것 같습니다.
1) 매물 리스트에서 매물 번호 크롤링
2) 매물 번호로 연결되는 개별 매물 페이지에서 매물정보 크롤링
이 두 가지 크롤링에 대한 내용을 이어지는 포스팅에서 이야기 해보겠습니다.
'Python' 카테고리의 다른 글
업비트 API key 받아 pyupbit 사용해보기 [암호화폐 알고리즘 매매를 위한 디딤돌 쌓기 #1] (0) | 2023.06.04 |
---|---|
[네이버 부동산 매물 크롤링 #4] 매물 정보 크롤링 (1) | 2023.06.02 |
[네이버 부동산 매물 크롤링 #3] 매물 번호 크롤링 (1) | 2023.05.10 |
[네이버 부동산 매물 크롤링 #1] Selenium 사용을 위한 크롬 드라이버 설치 (0) | 2023.04.19 |
댓글