在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/Python/ Python字符轉(zhuǎn)化問題

Python字符轉(zhuǎn)化問題

https://www.noscodespromo.com...
爬取這個頁面的時候,已經(jīng)字符轉(zhuǎn)義
(頭部
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
也對源碼進行decode("windows-1252").encode("utf-8")
)
但就是正則匹配的時候相關(guān)字符還是被轉(zhuǎn)了
求高手指教
clipboard.png

回答
編輯回答
瘋子范

原文不就是這個字符嗎?

2018年4月26日 09:43
編輯回答
糖果果

您好,您下載的源碼也是亂碼的嗎?
你可以試試去掉encode('utf-8')看好不好用。

# -*- coding:utf-8 -*-

from urllib import request

html = request.urlopen('https://www.noscodespromo.com/store/videdressing.com')
print(html.read().decode('windows-1252'))

我在python3.x試了一下,源碼沒什么問題,如下:
clipboard.png
源碼沒問題的話,正則應(yīng)該不會出錯吧。

2018年6月21日 13:42
編輯回答
詆毀你

這應(yīng)該不是亂碼,用google翻譯猜了一下,是法語,比如下面這段:

clipboard.png

如果你想對法語進行正則匹配,建議把字符串轉(zhuǎn)成unicode,然后網(wǎng)上找一下法語的unicode值,然后正則匹配。

所以,最好對你要爬取的網(wǎng)站做個比較好的了解,再爬,不然容易掉坑里。

2018年7月19日 01:25