지난번 포스팅에서 YouTube 제목과 URL을 크롤링해서
엑셀파일로 저장하는 것까지 해봤습니다.
저장한 엑셀파일의 내용을 불러오는 방법을 알아보겠습니다.
저장한 엑셀파일의 내용 중에 URL을 불러오는 방법입니다.
◆ 준비사항
from openpyxl import load_workbook
아직 openpyxl을 설치하지 않으셨다면 다음과 같이 설치하시면 됩니다.
pip install openpyxl
◆ 파일 불러오기
from openpyxl import load_workbook
file_name = "X:\블로그\python\YouTube.xlsx"
wb = load_workbook(filename=file_name)
위 코드를 작성하면 wb 객체를 통해 엑셀 파일에 접근할 수 있습니다.
file_name에는 파일의 경로와 이름을 넣어줍니다.
만약 파이썬 파일이 있는 폴더와 같은 폴더에 엑셀파일이 있다면, 파일명만 작성해도 됩니다.
다음은 시트를 선택해 줍니다.
Select_Sheet = wb['YouTube']
지난번에 만들었던 엑셀파일에는 시트가 하나밖에 없기 때문에
다음과 같이 작성해도 문제가 없습니다.
Select_Sheet = wb.active
우리가 만든 엑셀파일은 시트가 하나밖에 없지만,
불러온 파일에 어떤 시트명을 가진 시트들이 있는지 알고 싶다면,
print(wb.sheetnames)
위와 같이 작성하여 실행하시면, 시트의 이름이 나열이 됩니다.
◆ 셀 값 불러오기
지난번 만들었던 엑셀파일의 내용을 살펴보겠습니다.
제목에 title과 link가 있고 두번째 열부터 데이터값이 들어가 있습니다.
[ 2행의 2열 ]부터 시작해서 [ 2행의 끝열 ]까지 저장되어있는 URL을 출력해보겠습니다.
저장된 파일을 보니 184열까지 있습니다.
이렇게 눈으로 확인하는 방법이 있지만,
openpyxl에서 마지막 열을 확인하기 위해서는 max_row를 사용합니다.
maxrow = Select_Sheet.max_row
print(maxrow)를 해보면 정상적으로 184가 출력이됩니다.
그럼 이제 [ 2행의 2열 ]부터 [ 2행의 184열 ]까지 출력만 하면 됩니다.
for i in range(2, maxrow+1):
print(Select_Sheet.cell(row=i, column=2).value)
앞에서 설명했던 range()함수를 사용했습니다.
maxrow에 [ + 1 ]을 한 이유는 앞서 포스팅 했던 글을 읽어보시면 도움이 되실겁니다.
이제 실행을 하면 URL이 정상적으로 출력되는 것을 확인하실 수 있습니다.
여기를 방문하시면 더 많은 파이썬 관련 자료를 확인할 수 있습니다.
'파이썬(Python)' 카테고리의 다른 글
[ 크롤링-pytube ] 파이썬 유튜브 동영상 다운로드(pytube YouTube videos Download) (0) | 2022.10.23 |
---|---|
[ 크롤링-Beautifulsoup ] Python Beautifulsoup select() [ (li, a), (li a), (li > a) ] (0) | 2022.10.23 |
[ Basic ] Python Range() (0) | 2022.10.22 |
[ 크롤링-Selenium, BeautifulSoup ] 파이썬 Selenium과 BeautifulSoup 함께 사용하기 (0) | 2022.10.21 |
[ 크롤링-Selenium ] 파이썬 유튜브 크롤링 결과 엑셀파일 저장하기 (0) | 2022.10.20 |