728x90
반응형

파이썬(Python) 120

[ Basic ] 파이썬 패키지 관리 pip

◆ 파이썬 패키지공부하는 입장에서 아직 패키지와 라이브러리 등 정확히 용어 정립이 되지 않은 상태입니다.우선 패키지로 용어를 사용하겠습니다. 파이썬을 설치하면 기본적으로 지원되는 패키지가 있고,별도로 설치해서 사용해야하는 패키지가 있습니다.기본적으로 지원되는 패키지에는 io, math, random 등이 있고앞선 포스팅에서 사용했던 beautifulsoup, selenium 등은 별도로 설치해서사용해야 하는 패키지입니다.패키지를 별도로 설치할 때에는 pip 명령어를 사용합니다.이 pip 명령어에 대해 이야기 해보겠습니다.  ◆ pip 업그레이드먼저 pip를 업그레이드 하는 방법입니다.python -m pip install --upgrade pipcommand 입력창에 위와 같이 입력하시면 pip를 최신버..

파이썬(Python) 2022.10.24

[ 크롤링-pytube ] 파이썬 유튜브 동영상 다운로드(pytube YouTube videos Download)

◆ 준비사항pip install pytube 유튜브의 동영상을 간단하게 다운받는 코드입니다.먼저 pytube 모듈을 설치해 줍니다.pytube 모듈을 사용하면 유튜브의 많은 것들을 컨트롤 할 수 있습니다.여기서는 간단하게 동영상을 다운 받는 방법에 대해 알아보겠습니다.  ◆ 소스코드from pytube import YouTubeDownLoad_Dir = "X:\블로그\python\YouTube"def get_url():    url = input("유튜브 URL을 입력하세요 : ")    return urldef download_tube(url):    tube = YouTube(url)    title = tube.title    print("다운로드 중입니다...... : " + title)    t..

파이썬(Python) 2022.10.23

[ 크롤링-Beautifulsoup ] Python Beautifulsoup select() [ (li, a), (li a), (li > a) ]

◆ select(element, element) / select(element element) / select(element > element)BeautifulSoup의 select() 함수 사용시select(element, element) / select(element element) / select(element > element) 의 차이점을알아보도록 하겠습니다.예시는 나무위키 메인페이지를 참고하여[ select(li, a) / select(li a) / select(li > a) ]를 통해 알아보겠습니다.  ◆ select(element, element)select(li, a)는 해당 페이지의 모든 태그와 태그의 내용을 모두 선택합니다.i = 1tests0 = soup.select('li, a'..

파이썬(Python) 2022.10.23

[ openpyxl ] 파이썬에서 엑셀 셀 값 불러오기

지난번 포스팅에서 YouTube 제목과 URL을 크롤링해서엑셀파일로 저장하는 것까지 해봤습니다.※ 파이썬 유튜브 크롤링 결과 엑셀파일 저장하기 파이썬 유튜브 크롤링 결과 엑셀파일 저장하기◆ 준비사항 : openpyxl 파이썬으로 엑셀을 다루기위해 openpyxl을 설치해 줍니다. 콘솔창에 pip install openpyxl 을 입력하고 설치합니다. 그리고 openpyxl을 import 해줍니다. from openpyxl import Workbook..karuru1007.tistory.com저장한 엑셀파일의 내용을 불러오는 방법을 알아보겠습니다.저장한 엑셀파일의 내용 중에 URL을 불러오는 방법입니다.◆ 준비사항from openpyxl import load_workbook아직 openpyxl을 설치하지 ..

파이썬(Python) 2022.10.22

[ Basic ] Python Range()

◆ Range() 함수 소개Range() 함수는 파이썬의 내장함수로 특별히 무언가를 import 하지 않아도 사용할 수 있습니다.파이썬의 내장함수는 아래에서 확인할 수 있습니다.※ 내장함수 목록앞서 사용했던 len(), type()도 보이네요어쨌든 range() 함수는 숫자 범위를 생성합니다.range() 함수의 구조는 다음과 같습니다.range(시작값, 끝값, 단계값)시작값은 처음 시작할 숫자입니다. 생략이 가능하며 생략시 [ 0 ]입니다.끝값은 말그대로 마지막 값입니다.단계값은 시작값과 끝값을 몇단계씩 건너뛸 것인가 입니다. 생략시 [ 1 ]입니다.◆ range() 함수 사용 예시range()함수는 주로 for 문과 함께 사용됩니다.range(3)을 사용할 경우의 결과를 살펴보겠습니다.for i in..

파이썬(Python) 2022.10.22

[ 크롤링-Selenium, BeautifulSoup ] 파이썬 Selenium과 BeautifulSoup 함께 사용하기

◆ Selenium과 BeautifulSoup 함께 사용하기Selenium과 BeautifulSoup를 함께 사용하는 방법입니다.먼저 기존과 동일하게 Selenium으로 웹브라우저를 호출합니다.from selenium import webdriverfrom webdriver_manager.chrome import ChromeDriverManagerfrom selenium.webdriver.chrome.service import Servicefrom bs4 import BeautifulSoupservice = Service(ChromeDriverManager().install())driver = webdriver.Chrome(service=service)url = "https://www.daum.net/"d..

파이썬(Python) 2022.10.21

[ 크롤링-Selenium ] 파이썬 유튜브 크롤링 결과 엑셀파일 저장하기

◆ 준비사항 : openpyxl파이썬으로 엑셀을 다루기위해 openpyxl을 설치해 줍니다.콘솔창에pip install openpyxl을 입력하고 설치합니다. 그리고 openpyxl을 import 해줍니다.from openpyxl import Workbook  ◆ 엑셀파일 만들고 크롤링 결과 저장하기먼저 Workbook() 객체를 생성합니다.wb = WorkBook()그리고 현재 워크북에서 활성화 된 시트를 선택합니다.엑셀파일이 처음 만들어 졌으니 첫번째 시트가 선택될겁니다.ws = wb.active선택된 시트의 이름을 YouTube로 바꾸어 보겠습니다.굳이 바꾸지 않더라도 실행하는 데에는 문제가 없습니다.ws.title = "YouTube"그리고 맨 위에 구분하기 제목을 써줍니다.ws.append(['..

파이썬(Python) 2022.10.20

[ 크롤링-Selenium ] 파이썬 유튜브 제목과 URL 크롤링

◆ 웹 페이지 소스코드 확인하기먼저 유튜브에 파이썬으로 검색한 후 [ F12 ]를 누르면 위와 같은 화면이 나타납니다.위쪽 중간의 빨간색 네모 안의 아이콘을 누른 후왼쪽 화면의 파란색 화면 부분을 눌러보시면 오른쪽 화면의 파란색 부분에 표시가 됩니다.우선 오른쪽 화면의 표시된 부분이 왼쪽 화면의 제목에 해당하는 부분으로 보입니다.  다음으로 검색된 결과를 보니동영상[파란색 네모 부문]도 있고 플레이리스트[보라색 네모 부문]도 있습니다. 우선은 플레이리스트를 제외하고 동영상의 제목과 URL을 가지고 올 생각이므로두개의 차이점을 찾아보겠습니다.왼쪽은 동영상에 해당하는 부분의 소스코드이고오른쪽은 플레이리스트에 해당하는 부분의 소스코드입니다.동영상은 로 감싸져 있고플레이리스트는 로 감싸져 있습니다.또한동영상에 ..

파이썬(Python) 2022.10.19

[ 크롤링-Selenium ] 파이썬 셀레니움 웹페이지 자동 스크롤 하기(Python Selenium scroll webpage)

◆ 웹 페이지 자동 스크롤 하기웹페이지를 방문하다 보면 보통은 페이지를 클릭해서 다음 페이지로 넘어가게 되어 있는 곳들이 많습니다.아래 그림과 같이요.하지만 네이버 이미지나 구글 이미지 검색 또는 유튜브를 보면마우스를 스크롤하여 다음 페이지로 넘어갑니다.이럴경우 충분히 스크롤하여야만 원하는 정보를 최대한 많이 가지고 올 수 있습니다.  웹 페이지를 스크롤 하는 코드는 다음과 같습니다.driver.execute_script("window.scrollTo(0, document.documentElement.scrollHeight);")또는driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")위 코드를 작성하고 실행하면현재 웹페이지의 높..

파이썬(Python) 2022.10.18

[ 크롤링-Selenium ] 웹 크롤링 파이썬 네이버 페이지 클릭하기, 검색어 입력하기

◆ 네이버에 접속하기웹페이지에 있는 정보를 가지고 오기 위해서는먼저 웹페이지에 접속을 해야 합니다.selenium을 사용할 것입니다.먼저 지난번에 포스팅 했던 글을 참고하여 기본 코드를 작성하겠습니다.from selenium import webdriverfrom webdriver_manager.chrome import ChromeDriverManagerfrom selenium.webdriver.chrome.service import Servicedriver = webdriver.Chrome(service=Service(ChromeDriverManager().install()))  먼저 우리가 자주  사용하는 네이버의 주소를 알아보겠습니다.위 그림의 빨간색 네모 부분이 네이버의 주소입니다.위 코드에 아래 ..

파이썬(Python) 2022.10.14
728x90
반응형