在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/Python/ pyspider根本處理不了天貓國際

pyspider根本處理不了天貓國際

提供同樣的header訪問,使用requests就可以很簡單的把頁面下載下來,但是pyspider就不行,哪怕是開了fetch_type="js"也不可以,會報錯(URL>1024)。
雖然我明白哪怕開了,其實最后結(jié)果還是爬不下來的。因為phantomjs現(xiàn)在一點也靠不住。哪怕三分鐘restart一次,該fetch_error還是fetch_error。
有點難過。
這個工具給我的使用感覺,爬取效率高,規(guī)則設(shè)定方便,靈活多變。但是可能更適合爬取靜態(tài)的新聞頁面。
根本沒法打架。
回答
編輯回答
遺莣

url > 1024 這個問題怎么說呢,確實有點保守了,我已經(jīng)把源代碼hack 了,所以不存在這個問題,一般瀏覽器都是支持到2048長度

2017年1月18日 03:53