在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問(wèn)答/Python/ 關(guān)于PYTHON抓取網(wǎng)頁(yè)內(nèi)容的問(wèn)題

關(guān)于PYTHON抓取網(wǎng)頁(yè)內(nèi)容的問(wèn)題

我想抓取這個(gè)網(wǎng)頁(yè)http://blog.sina.com.cn/s/blo... 中文章末尾的閱讀數(shù)量

閱讀(332)┊ 評(píng)論 (0)┊ 收藏(0)

網(wǎng)頁(yè)源碼:

閱讀<span id="r_6f72ff900102xqgi" class="SG_txtb"></span>

源碼里沒(méi)有值。

我用的pyquery這個(gè)庫(kù),代碼如下:

url = 'http://blog.sina.com.cn/s/blog_6f72ff900102xqgi.html'

doc = pq(url=url, encoding='utf-8')

print(doc('#r_6f72ff900102xqgi') )

代碼輸出的結(jié)果:

<span id="r_6f72ff900102xqgi" class="SG_txtb"></span>

需要怎么做才能得到頁(yè)面里的閱讀量數(shù)字呢?

回答
編輯回答
使勁操

應(yīng)該是js獲取的動(dòng)態(tài)數(shù)據(jù)

請(qǐng)求類似如下地址:
http://comet.blog.sina.com.cn...

獲取結(jié)果

requestId_57944281={"pv":773757,"av":362}

閱讀數(shù)和這個(gè)av的值一樣。

2018年4月8日 02:36
編輯回答
忠妾

閱讀量數(shù)字我以前看過(guò)一些視頻,有可能是在返回的json中存放的,可以打開F12看一下有沒(méi)有返回json數(shù)據(jù)。

2018年6月26日 11:17
編輯回答
悶油瓶

首先得確認(rèn)閱讀數(shù)量是動(dòng)態(tài)數(shù)據(jù)(異步發(fā)送請(qǐng)求獲取,例如ajax)還是靜態(tài)數(shù)據(jù)(同步加載渲染)

  • 如果是動(dòng)態(tài)數(shù)據(jù),可以嘗試模擬發(fā)送請(qǐng)求來(lái)獲取后端數(shù)據(jù)。F12,看下所有發(fā)送的請(qǐng)求和返回的數(shù)據(jù)
  • 如果是靜態(tài)數(shù)據(jù),html抓下來(lái)以后可以通過(guò)正則來(lái)匹配獲取
2017年1月7日 11:58