회원 로그인
|
DC 이효리 겔러리에서 사진 추출하기
url 변경 및 라이브러리(모듈) 업데이트로 인해 적용 안됨 |
- urllib를 이용한 웹 파싱
# -*- coding = utf-8 -*- import re import urllib.request import os import stat import shutil startpagenumber_ = input('start page number : ') endpagenumber_ = input('end page number : ') fileNo_ = 0 imageUrlList_ = [] hyoleeUrl_ = 'http://gall.dcinside.com/list.php?id=leehyolee&no=' if os.path.exists('D:/hyolee_images') == True: pass else: os.mkdir('D:/hyolee_images') for i in range(int(startpagenumber_), int(endpagenumber_)): url_ = hyoleeUrl_ + str(i) f_ = urllib.request.urlopen(url_) print(f_) html_ = f_.read() print(html_) imageUrlList_ = re.findall("https://dcimg4.dcinside.co.kr/viewimage.php[^']+", html_) for x in imageUrlList_: print(fileNo_) fileName_ = str(i) + '_' + str(fileNo_) tmpFile_ = urllib.request.urlretrieve(x) if os.stat(tmpFile_[0])[stat.ST_SIZE] < 1: print('NO DATA') pass else: shutil.copyfile(tmpFile_[0], 'c:/temp/hyolee_images/%s.jpg'%fileName_) os.remove(tmpFile_[0]) fileNo_ = fileNo_ + 1
댓글 0개
| 엮인글 0개
285개(1/15페이지)
번호 | 제목 | 글쓴이 | 조회 | 날짜 |
---|---|---|---|---|
285 | [Python] 동적 import - 모듈을 변수로 받아오기 | 푸딩뱃살 | 427 | 2022.10.27 10:45 |
284 | [Python] 파이썬 3.7.7과 3.9.7의 os.path.expanduser() 차이 | 푸딩뱃살 | 469 | 2022.08.18 12:22 |
283 | [Python] error: Microsoft Visual C++ 9.0 is required. | 푸딩뱃살 | 708 | 2022.08.03 13:35 |
282 | [Python] pyscript | 푸딩뱃살 | 477 | 2022.06.09 11:21 |
281 | [Python] float is / float not is | 푸딩뱃살 | 607 | 2022.03.02 15:03 |
280 | [Python] 이터널 문자열 f | 푸딩뱃살 | 855 | 2022.01.27 16:35 |
279 | [Python] is와 ==의 차이 | 푸딩뱃살 | 489 | 2021.11.25 15:54 |
278 |
[Python] Error: ImportError: file |
푸딩뱃살 | 950 | 2021.11.16 11:24 |
277 | [Python] 파이썬 디컴파일 - uncompyle6 | 푸딩뱃살 | 790 | 2021.11.10 14:46 |
276 | [Python] 파이썬 확장자 설명 | 푸딩뱃살 | 563 | 2021.11.03 14:38 |
275 | [참고] 웹 fbx 뷰어 | 푸딩뱃살 | 483 | 2021.10.19 15:46 |
274 | [Python] enumerate() | 푸딩뱃살 | 510 | 2021.10.13 14:44 |
273 | [Python] 아나콘다에서 가상 환경 | 푸딩뱃살 | 748 | 2020.11.21 00:26 |
272 | [Python] pip로 설치 때 퍼미션 에러 | 푸딩뱃살 | 1281 | 2020.06.06 17:13 |
271 | [Python] OpenCV 10-3. 이미지 Thresholding - Otsu's Binarizatio | 푸딩뱃살 | 681 | 2020.06.05 14:01 |
270 | [Python] OpenCV 10-2. 이미지 Thresholding - Adaptive Threshold | 푸딩뱃살 | 705 | 2020.06.05 13:58 |
269 | [Python] OpenCV 10-1. 이미지 Thresholding | 푸딩뱃살 | 585 | 2020.06.05 13:56 |
268 | [Python] OpenCV 9-2. 색 추적 | 푸딩뱃살 | 797 | 2020.06.02 23:29 |
267 | [Python] OpenCV 9-1. 색공간 바꾸기 | 푸딩뱃살 | 648 | 2020.06.02 23:27 |
266 | [Python] OpenCV 8-3. 이미지 비트 연산 | 푸딩뱃살 | 537 | 2020.06.02 23:21 |