# -*- coding:utf-8 -*-
import requests,re,time
url = 'https://www.toutiao.com/c/user/article/?page_type=1&user_id=67287555792&max_behot_time=0&count=20&as=A1E5AAE6A908C3F&cp=5A69784C438F5E1&_signature=OnHSARAdYB7GCDh9vrFywDpx0h'
q_url = 'https://www.toutiao.com/'
header = {
'referer':'https://www.toutiao.com/c/user/67287555792/',
'user-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.119 Safari/537.36',
'x-requested-with':'MLHttpRequest'
}
content = requests.get(url , headers = header).text
con = content.encode('utf-8').decode('unicode_escape')
def msg():
title = re.findall('"title": "(.*?)",',con,re.S)
times = re.findall('"behot_time": (.*?),',con,re.S)
read = re.findall('"go_detail_count": (.*?),',con,re.S)
con_url = re.findall('"source_url": "(.*?)"',con,re.S)
source_url = re.findall('"display_url": "http://(.*?)"',con,re.S)
for i in range(1,21):
for t in title:
print(t)
for m in times:
print(m)
for r in read:
print(r)
for c in con_url:
cc = q_url + c
print(cc)
for s in source_url:
print(s)
con_print = '標(biāo)題:' + t + '\n' + '時間:' + m + '\n' + '閱讀量:' + r + '\n' + '鏈接:' + cc + '\n' '原文鏈接:' + s
print(con_print)
#print('標(biāo)題:' + t + '\n' + '發(fā)布時間:' + m + '\n' '閱讀量:' + r + '\n' '鏈接:' + c + '\n' + '原文鏈接:' + s)
#rint(con)
msg()
想實現(xiàn)的效果是這樣的:
標(biāo)題:年關(guān)難過,“被催族”的“悲催”何人能懂?
時間:1516864032
閱讀量:8
鏈接:https://www.toutiao.com//item/6514899406209155591/
原文鏈接:www.123.com.cn/ydzx/128-536175.html
可是實際print(con_print)的時候是先把每一條都打印出來,然后用最后一條組合成。
怎么樣讓輸出的結(jié)果是這種呢,就是標(biāo)題、時間、閱讀等都循環(huán)一遍,然后組合好,再進(jìn)行下一次循環(huán),在組合再循環(huán)...
標(biāo)題:年關(guān)難過,“被催族”的“悲催”何人能懂?
時間:1516864032
閱讀量:8
鏈接:https://www.toutiao.com//item/6514899406209155591/
原文鏈接:www.123.com.cn/ydzx/128-536175.html別用response.text,換成response.json(),你就可以操作dict形式的結(jié)果了。
就像下面這樣的:
{
"login_status": false,
"has_more": true,
"next": {
"max_behot_time": 1516455912
},
"page_type": 1,
"message": "success",
"data": [{
"image_url": "http://p1.pstatp.com/list/190x124/5b4b0005fed9c63a1454",
"abstract": "太陽能發(fā)電站雜草叢生很難清理,中國工程師:放10000只羊就行",
"tag": "news",
"tag_url": "video",
"title": "太陽能發(fā)電站雜草叢生很難清理,中國工程師:放10000只羊就行",
"has_video": true,
"chinese_tag": "視頻",
"source": "超級工程",
"comments_count": 3745,
"media_url": "/m1570427113937921/",
"go_detail_count": 532127,
"detail_play_effective_count": 761650,
"source_url": "/item/6514979850942415364/",
"item_id": "6514979850942415364",
"article_genre": "video",
"display_url": "http://toutiao.com/group/6514979850942415364/",
"behot_time": 1516886952,
"group_id": "6514979850942415364",
...
}, ... ],
"is_self": false
}北大青鳥APTECH成立于1999年。依托北京大學(xué)優(yōu)質(zhì)雄厚的教育資源和背景,秉承“教育改變生活”的發(fā)展理念,致力于培養(yǎng)中國IT技能型緊缺人才,是大數(shù)據(jù)專業(yè)的國家
達(dá)內(nèi)教育集團(tuán)成立于2002年,是一家由留學(xué)海歸創(chuàng)辦的高端職業(yè)教育培訓(xùn)機(jī)構(gòu),是中國一站式人才培養(yǎng)平臺、一站式人才輸送平臺。2014年4月3日在美國成功上市,融資1
北大課工場是北京大學(xué)校辦產(chǎn)業(yè)為響應(yīng)國家深化產(chǎn)教融合/校企合作的政策,積極推進(jìn)“中國制造2025”,實現(xiàn)中華民族偉大復(fù)興的升級產(chǎn)業(yè)鏈。利用北京大學(xué)優(yōu)質(zhì)教育資源及背
博為峰,中國職業(yè)人才培訓(xùn)領(lǐng)域的先行者
曾工作于聯(lián)想擔(dān)任系統(tǒng)開發(fā)工程師,曾在博彥科技股份有限公司擔(dān)任項目經(jīng)理從事移動互聯(lián)網(wǎng)管理及研發(fā)工作,曾創(chuàng)辦藍(lán)懿科技有限責(zé)任公司從事總經(jīng)理職務(wù)負(fù)責(zé)iOS教學(xué)及管理工作。
浪潮集團(tuán)項目經(jīng)理。精通Java與.NET 技術(shù), 熟練的跨平臺面向?qū)ο箝_發(fā)經(jīng)驗,技術(shù)功底深厚。 授課風(fēng)格 授課風(fēng)格清新自然、條理清晰、主次分明、重點難點突出、引人入勝。
精通HTML5和CSS3;Javascript及主流js庫,具有快速界面開發(fā)的能力,對瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網(wǎng)頁制作和網(wǎng)頁游戲開發(fā)。
具有10 年的Java 企業(yè)應(yīng)用開發(fā)經(jīng)驗。曾經(jīng)歷任德國Software AG 技術(shù)顧問,美國Dachieve 系統(tǒng)架構(gòu)師,美國AngelEngineers Inc. 系統(tǒng)架構(gòu)師。