728x90
반응형
SMALL

파이썬(Python) 75

[ Basic ] 파이썬 파일 읽기, 쓰기[ open(), write() ]

파이썬에서 파일을 읽을 때 open() 함수를 사용합니다. open() 함수는 파이썬의 내장함수로 별도의 모듈을 설치하지 않아도 사용할 수 있습니다. 파일을 읽는데 사용한다고 표현하였지만, 파일을 읽거나, 새로 만들 수 있습니다. open() 함수를 사용할 때는 두개의 파라미터를 사용합니다. open(파일이름, 모드) 파일이름은 [ "파일이름" ] 또는 [ '파일이름' ]의 형태로 사용합니다. 모드는 크게 4가지가 있습니다. 첫째. [ "r" ] (읽기모드 : read) : 파일을 읽기위해서만 불러옵니다. 파일이 없으면 오류가 발생합니다. 둘째. [ "a" ] (추가모드 : append) : 파일에 내용을 추가하기 위해 불러옵니다.. 파일이 없으면 파일을 만듭니다. 셋째. [ "w" ] (쓰기모드 : w..

파이썬(Python) 2022.11.01

[ 크롤링-Selenium ] 파이썬 네이버 블로그 검색 결과 크롤링(엑셀파일 정리)

기본적인 내용은 유튜브 검색결과를 크롤링하여 엑셀파일로 정리하는 것과 유사합니다. 유튜브 크롤링에 대한 전체적인 흐름과 소스는 여기서 확인이 가능합니다. 파이썬 유튜브 크롤링(제목, URL, 조회수, 업데이트 날짜, 길이) 퇴근하고 조금씩 공부하면서 작성하다보니 먼가 어지러워보입니다. 1. 파이썬 유튜브 제목과 URL 크롤링 2. 파이썬 유튜브 크롤링 결과 엑셀파일 저장하기 3. 파이썬에서 엑셀 셀값 불러오기 4. 파 karuru1007.tistory.com 먼저 네이버에 접속하여 [ 파이썬 ]을 검색합니다. [ VIEW ] → [ 블로그 ]를 선택하시면 블로그에서 [ 파이썬 ]에 대한 검색결과만 확인이 가능합니다. 해당 부분의 URL을 살펴보겠습니다. 빨간색 네모부분이 검색어에 해당하는 것으로 보입니다..

파이썬(Python) 2022.10.30

[ OS ] python os.walk(), 폴더 경로, 파일 경로 확인하기

os.walk() 함수는 os 모듈에 포함되어 있습니다. 사용하시기 전에 os 모듈을 import 해주어야 합니다. import os 먼저 테스트할 폴더의 내용을 살펴보겠습니다. 제가 테스트할 폴더의 내용을 그림으로 도식화 한것입니다. 아래 코드를 살펴보시고 다시 폴더모양을 보시면 이해가 쉬울 수도 있습니다. test_walk 라는 폴더에는 text_excel, text_hwp, text_text 파일이 있습니다. 또한 text_walk 라는 폴더 아래에는 test1, text1-1, text1-2 라는 폴더가 있습니다. test1, text1-1, text1-2 폴더에는 별도의 파일은 없습니다. text1 폴더의 아래에는 test2라는 폴더가 있고 test2 폴더안에는 별도의 파일은 없습니다. os.w..

파이썬(Python) 2022.10.28

[ 크롤링-selenium ] 파이썬 유튜브 크롤링(제목, URL, 조회수, 업데이트 날짜, 길이)

퇴근하고 조금씩 공부하면서 작성하다보니 먼가 어지러워보입니다. 1. 파이썬 유튜브 제목과 URL 크롤링 2. 파이썬 유튜브 크롤링 결과 엑셀파일 저장하기 3. 파이썬에서 엑셀 셀값 불러오기 4. 파이썬 유튜브 크롤링 결과 엑셀 시트별로 저장하기(Selenium, openpyxl) 먼저 포스트 했던 글들을 먼저 읽으신다면 도움이 되실 것입니다. 유튜브에 검색어를 입력하고 해당 검색어로 조회되는 모든 동영상(플레이리스트 제외)의 제목과 URL, 조회수, 업데이트날짜, 동영상의 길이를 엑셀로 정리하는 코드입니다. 엑셀로 정리된 결과는 다음과 같습니다.파일을 정리를 하던 중이어서 정렬이 조금 되어 있으나,처음 파일이 만들어졌을 때는 보기가 좋지는 않습니다. # import 해주어야 할 모듈입니다. from se..

파이썬(Python) 2022.10.27

[ 크롤링-selenium ] 파이썬 유튜브 크롤링 결과 엑셀 시트별로 저장하기(Selenium, openpyxl)

오늘 작성해볼 내용은 유튜브의 제목과 URL을 크롤링하고 그 결과를 엑셀파일로 저장합니다. 다시한번 실행했을 때는 기존의 엑셀파일에 시트를 만들고 그 결과를 저장합니다. 그런 식으로 검색 결과를 하나의 엑셀파일에 저장하는 내용입니다. 먼저 지난번에 포스팅 했던 글을 읽고 오시는 것을 추천드립니다. 1. 파이썬 셀레니움 웹페이지 자동 스크롤 하기(Python Selenium scroll webpage) 파이썬 셀레니움 웹페이지 자동 스크롤 하기(Python Selenium scroll webpage) ◆ 웹 페이지 자동 스크롤 하기 웹페이지를 방문하다 보면 보통은 페이지를 클릭해서 다음 페이지로 넘어가게 되어 있는 곳들이 많습니다. 아래 그림과 같이요. 하지만 네이버 이미지나 구글 이 karuru1007...

파이썬(Python) 2022.10.26

[ Basic ] 파이썬 패키지 관리 pip

◆ 파이썬 패키지 공부하는 입장에서 아직 패키지와 라이브러리 등 정확히 용어 정립이 되지 않은 상태입니다. 우선 패키지로 용어를 사용하겠습니다. 파이썬을 설치하면 기본적으로 지원되는 패키지가 있고, 별도로 설치해서 사용해야하는 패키지가 있습니다. 기본적으로 지원되는 패키지에는 io, math, random 등이 있고 앞선 포스팅에서 사용했던 beautifulsoup, selenium 등은 별도로 설치해서 사용해야 하는 패키지입니다. 패키지를 별도로 설치할 때에는 pip 명령어를 사용합니다. 이 pip 명령어에 대해 이야기 해보겠습니다. ◆ pip 업그레이드 먼저 pip를 업그레이드 하는 방법입니다. python -m pip install --upgrade pip command 입력창에 위와 같이 입력하시..

파이썬(Python) 2022.10.24

[ 크롤링-pytube ] 파이썬 유튜브 동영상 다운로드(pytube YouTube videos Download)

◆ 준비사항 pip install pytube 유튜브의 동영상을 간단하게 다운받는 코드입니다. 먼저 pytube 모듈을 설치해 줍니다. pytube 모듈을 사용하면 유튜브의 많은 것들을 컨트롤 할 수 있습니다. 여기서는 간단하게 동영상을 다운 받는 방법에 대해 알아보겠습니다. ◆ 소스코드 from pytube import YouTube DownLoad_Dir = "X:\블로그\python\YouTube" def get_url(): url = input("유튜브 URL을 입력하세요 : ") return url def download_tube(url): tube = YouTube(url) title = tube.title print("다운로드 중입니다...... : " + title) tube.streams..

파이썬(Python) 2022.10.23

[ 크롤링-Beautifulsoup ] Python Beautifulsoup select() [ (li, a), (li a), (li > a) ]

◆ select(element, element) / select(element element) / select(element > element) BeautifulSoup의 select() 함수 사용시 select(element, element) / select(element element) / select(element > element) 의 차이점을 알아보도록 하겠습니다. 예시는 나무위키 메인페이지를 참고하여 [ select(li, a) / select(li a) / select(li > a) ] 를 통해 알아보겠습니다. ◆ select(element, element) select(li, a)는 해당 페이지의 모든 태그와 태그의 내용을 모두 선택합니다. i = 1 tests0 = soup.select(..

파이썬(Python) 2022.10.23

[ openpyxl ] 파이썬에서 엑셀 셀 값 불러오기

지난번 포스팅에서 YouTube 제목과 URL을 크롤링해서 엑셀파일로 저장하는 것까지 해봤습니다. ※ 파이썬 유튜브 크롤링 결과 엑셀파일 저장하기 파이썬 유튜브 크롤링 결과 엑셀파일 저장하기 ◆ 준비사항 : openpyxl 파이썬으로 엑셀을 다루기위해 openpyxl을 설치해 줍니다. 콘솔창에 pip install openpyxl 을 입력하고 설치합니다. 그리고 openpyxl을 import 해줍니다. from openpyxl import Workbook.. karuru1007.tistory.com 저장한 엑셀파일의 내용을 불러오는 방법을 알아보겠습니다. 저장한 엑셀파일의 내용 중에 URL을 불러오는 방법입니다. ◆ 준비사항 from openpyxl import load_workbook 아직 openpy..

파이썬(Python) 2022.10.22

[ Basic ] Python Range()

◆ Range() 함수 소개 Range() 함수는 파이썬의 내장함수로 특별히 무언가를 import 하지 않아도 사용할 수 있습니다. 파이썬의 내장함수는 아래에서 확인할 수 있습니다. ※ 내장함수 목록 앞서 사용했던 len(), type()도 보이네요 어쨌든 range() 함수는 숫자 범위를 생성합니다. range() 함수의 구조는 다음과 같습니다. range(시작값, 끝값, 단계값) 시작값은 처음 시작할 숫자입니다. 생략이 가능하며 생략시 [ 0 ]입니다. 끝값은 말그대로 마지막 값입니다. 단계값은 시작값과 끝값을 몇단계씩 건너뛸 것인가 입니다. 생략시 [ 1 ]입니다. ◆ range() 함수 사용 예시 range()함수는 주로 for 문과 함께 사용됩니다. range(3)을 사용할 경우의 결과를 살펴보..

파이썬(Python) 2022.10.22
728x90
반응형
LIST