在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/HTML/ NodeJs如何爬取動(dòng)態(tài)網(wǎng)頁(yè)?

NodeJs如何爬取動(dòng)態(tài)網(wǎng)頁(yè)?

我想去爬一些電商網(wǎng)站,里面有很多圖片的?,F(xiàn)在用的是cheerio,我發(fā)現(xiàn)它不能獲得頁(yè)面中通過(guò)懶加載的圖片,也就是通過(guò)js處理生成的圖片。有什么辦法或者別的庫(kù)可以實(shí)現(xiàn)這種功能?

回答
編輯回答
無(wú)標(biāo)題

一般懶加載圖片的url應(yīng)該是保存在img標(biāo)簽中的,比如data-src之類的,你查看一下那些圖片的屬性。
如果不行的話,就用 phantomjs 。

2017年5月6日 06:46
編輯回答
故林

只能自己分析網(wǎng)頁(yè)的js來(lái)獲取,或者用chrome的無(wú)頭模式,運(yùn)行一個(gè)真正的瀏覽器來(lái)爬

2017年5月15日 02:31
編輯回答
陪妳哭

推薦谷歌團(tuán)隊(duì)自己研發(fā)的操控chrome無(wú)頭瀏覽器的接口puppeteer

2018年9月14日 06:10
編輯回答
有你在

爬頁(yè)面最好的方式還是爬接口,分析接口調(diào)用方式,入?yún)?,cookie。

2018年7月1日 16:05