파이썬(Python)

[ 크롤링-Selenium ] 파이썬 다음 블로그 크롤링(Python Selenium)(4)-엑셀 저장

카루루1007 2022. 11. 24. 22:20
728x90
반응형
SMALL

파이썬 다음 블로그 크롤링(1)

파이썬 다음 블로그 크롤링(2)

파이썬 다음 블로그 크롤링(3)

위 포스팅과 연결되는 글입니다.

검색어를 입력 받고, 엑셀파일로 검색 결과를 저장하는 방법입니다.

먼저 검색어를 입력받아 search_word 라는 변수에 넣어줍니다.

search_word = input("YouTube 검색어를 입력하세요 : ")

 

아래쪽 큰 빨간색 네모박스에 부분입니다.

저는 위 경로에 DaumScrap.xlsx 파일로 저장을 할 것인데,

해당 경로에 파일이 있다면 불러옵니다.

그리고 check_new_file 변수에 0을 넣습니다.

 

해당 파일이 없다면 에러가 발생하므로 except 아래 구문이 실행됩니다.

해당 파일이 없다면 엑셀파일을 하나 만들고

check_new_file 변수에 1을 넣습니다.

 

만약 파일이 없어 새로운 파일을 만들어야 한다면

시트를 하나만 남기고 모두 지운 후

시트 이름을 [ 검색어(날짜) ] 형식으로 만듭니다.

만약 파일이 있다면

맨 마지막 시트 다음에 시트를 하나 추가하고

시트 이름을  [ 검색어(날짜) ] 형식으로 만듭니다.

 

다음으로 제목 셀을 만듭니다.

제목 셀에는 [ 연번, 제목, 링크, 게시일 ]이 들어갑니다.

※ 작성하고 보니 코드가 잘못되었습니다. [ 연번, 제목, 링크, 게시일 ]이 맞습니다~!

 

그리고 첫번째 row의 column 1 ~ 4까지 가운데 정렬을 해줍니다.

 

 

count와 count_date 변수는 row를 증가시키기 위한 변수입니다.

url은 검색어와 페이지를 변경시킬 수 있게 넣어줍니다.

 

 

row 값을 하나씩 증가시키면서 연번을 넣어줍니다.

그리고 가운데 정렬을 해줍니다.

 

그 다음으로 역시 row 값을 증가시키며 제목을 넣어줍니다.

제목은 좌측정렬을 해줍니다.

다음으로 동일한 방법으로 URL을 넣어줍니다.

URL역시 좌측정렬을 해줍니다.

 

날짜 데이터 또한 같은 방식을 취해줍니다.

 

while 문 안에 for 문이 두개가 있어

변수를 두개를 설정해서 각각 증가시키는 방법으로 했습니다.

 

마지막으로 저장한 후 파일을 닫아줍니다.

 

이제 실행하면 검색어로 입력한 결과를 엑셀파일로 저장이 가능합니다.

728x90
반응형
LIST