在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/數(shù)據(jù)分析&挖掘  Python/ 爬蟲實現(xiàn)下載網(wǎng)頁源碼,css,js

爬蟲實現(xiàn)下載網(wǎng)頁源碼,css,js

怎么用python實現(xiàn)爬蟲實現(xiàn)下載網(wǎng)頁源碼,css,js文件,
就是把一些頁面或者整個網(wǎng)站扒下來,自己斷網(wǎng)都可以訪問
用python實現(xiàn)

回答
編輯回答
短嘆

你如果要斷網(wǎng)都可以訪問,對于動態(tài)網(wǎng)站來說,那是不可能的。

2017年2月11日 03:05
編輯回答
祉小皓

首先,希望你要爬取的網(wǎng)站的反爬蟲技術(shù)比較落后,那么建議你看看這篇文章——使用 beautifulsoup 4 抓取網(wǎng)頁內(nèi)容實例
其次,如果爬取的網(wǎng)站用的js技術(shù)比較多,那么建議你用 selenium2 + phantomjs。
.....
如果你想爬取淘寶之類的網(wǎng)站,我也不會,我曾經(jīng)爬取過,用了第二種方法,就高興了一分鐘,然后就爬取不到了。如果你有結(jié)果,記得告訴我一聲。

2018年6月13日 15:57