在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/Python/ python爬蟲爬取中文問題

python爬蟲爬取中文問題

在網頁中是這樣的
clipboard.png

clipboard.png

網頁源碼是這樣的
clipboard.png

clipboard.png

爬取出來是這樣的
請教一下這是什么情況
clipboard.png

clipboard.png

回答
編輯回答
焚音

可能是一種反爬蟲技術,你可以看看這個地方引入的字體(就是 font-family 之類的),你會發(fā)現它引入了一個自定義的字體文件,這里面做了映射,導致代碼里的 亂碼 字符在頁面卻顯示正常。

像貓眼電影之類的比較變態(tài)的,是幾個字體文件輪流用(不知道現在的情況,一年前是這樣),你這個就不清楚了。

如果是靜態(tài)的字體文件,那可以手動做一下映射。
如果是動態(tài)的,那我也不知道怎么辦了哈哈哈,當時只是為了做 Demo 所以換了個站爬。

2017年1月24日 01:51