在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/Python/ django 如何獲取蜘蛛來訪日志記錄?

django 如何獲取蜘蛛來訪日志記錄?

自己用django 開發(fā)了個(gè)簡單的網(wǎng)頁,

想知道每天被搜索引擎抓取記錄,特請(qǐng)教django 如何查看被搜索引擎爬取的記錄和次數(shù)呢

回答
編輯回答
舊顏

一般是根據(jù)請(qǐng)求header的UserAgent來判斷是不是搜索引擎爬蟲。
比如:"Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/s...)" 這個(gè)是百度的。
"Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)" 這個(gè)是必應(yīng)的。

你搜一下:搜索引擎爬蟲UserAgent,有一大堆別人整理的。

2018年2月22日 13:28
編輯回答
萌小萌

各家搜索引擎爬蟲都有自己的IP段,利用IP來判斷更可靠一些

2017年6月3日 17:13
編輯回答
傲嬌范

這種應(yīng)該要自己去實(shí)現(xiàn)中間件,分析每個(gè)request的特點(diǎn),如果是被搜索引擎請(qǐng)求,這個(gè)request應(yīng)該會(huì)和一般用戶的request有所區(qū)別,記錄幾個(gè)關(guān)鍵的搜索引擎就可以了吧 。

2018年3月10日 16:20