在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/Python/ python 爬圖片變成404

python 爬圖片變成404

import os.path

from re import findall
from urllib.request import urlopen
from urllib.request import Request




path='D:/python/'
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}
if not os.path.exists(path):
    os.mkdir(path)

url = 'http://www.27270.com/tag/234.html'

req = Request(url=url, headers=headers)
with urlopen(req) as fp:
    content = fp.read().decode('gbk')

pattern = 'src="(.+?)" width'
result = findall(pattern, content)

for index, item in enumerate(result):
    itemreq = Request(url=str(item), headers=headers)
    with urlopen(itemreq) as fp:
        with open(path+str(index)+'.jpg','wb') as f:
            f.write(fp.read())

print('完成')

圖片描述

回答
編輯回答
離殤

header里加上referer就可以了

2017年6月10日 05:10
編輯回答
喵小咪

兩種可能,1是那圖片真的是不存在。更大的可能是反爬蟲,比如說referer的http頭的判斷,來攔截。解決的方式,用chrome或firefox,把實際請求的http頭弄下來,然后再去請求。另外,做爬蟲,可以用requests這個庫,簡單好用。

2018年4月21日 17:46