Beautiful Soup取值問題

<span data-original-name="杜克大學(xué)藍魔鬼男子籃球隊">杜克大學(xué)藍魔鬼男子籃球隊</span>
<span data-original-name="未知">未知</span>

用Beautiful Soup庫怎么把杜克大學(xué)藍魔鬼男子籃球隊給取出來呢

現(xiàn)在想通過谷歌搜索英文關(guān)鍵字，取結(jié)果頁右面推薦翻譯。
如下圖：圖片描述

代碼如下：

# -*- coding:utf-8 -*-

import requests,sys
from bs4 import BeautifulSoup

reload(sys)
sys.setdefaultencoding('utf8')

#<span data-original-name="杜克大學(xué)藍魔鬼男子籃球隊">杜克大學(xué)藍魔鬼男子籃球隊</span>

url = "https://www.google.com.hk/search?safe=strict&hl=zh-CN&ei=l_7rWrznFMPEjAP05IUI&q=Duke Blue Devils"

header ={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'}


def res():
    # 請求數(shù)據(jù)
    r = requests.get(url,headers =header)
    # 解析
    soup = BeautifulSoup(r.content, "lxml")
    
    #通過輸出發(fā)現(xiàn) ，杜克大學(xué)藍魔鬼男子籃球隊這個結(jié)果在下面列表里，但是每次順序不固定
    a = soup.find_all('span')
    for i ,v in enumerate(a):
        print i,a[i]
        
    # 通過這個倒是可以取出來，但是 事先并不知道中文翻譯 ，就是要取這個中文翻譯
    print soup.find_all('span',attrs={"data-original-name": "杜克大學(xué)藍魔鬼男子籃球隊"})


if __name__ == '__main__':
    res()

圖片描述

回答

編輯回答

安于心

學(xué)習(xí)這類框架，要去詳細(xì)研究官方api,不要過于依賴第三方工具。這樣可以增加效率。你的問題，可以這樣解決，例如：

head_tag = soup.head
head_tag
# <head><title>The Dormouse's story</title></head>

head_tag.contents
[<title>The Dormouse's story</title>]

title_tag = head_tag.contents[0]
title_tag
# <title>The Dormouse's story</title>
title_tag.contents
# [u'The Dormouse's story']

我之前學(xué)習(xí)使用的文檔：Beautiful Soup 4.2.0 文檔

2017年1月16日 22:34

編輯回答

大濕胸

 用正則解決了，bs4還是不熟悉

# 請求數(shù)據(jù)
r = requests.get(url + list1[i],headers =header)
# 正則取值
reObj = re.findall('<span data-original-name="(.*?)">',r.content)

2017年1月26日 00:52

相關(guān)信息

熱門機構(gòu)

北大青鳥昌平校區(qū)

北大青鳥APTECH成立于1999年。依托北京大學(xué)優(yōu)質(zhì)雄厚的教育資源和背景，秉承“教育改變生活”的發(fā)展理念，致力于培養(yǎng)中國IT技能型緊缺人才，是大數(shù)據(jù)專業(yè)的國家
達內(nèi)教育

達內(nèi)教育集團成立于2002年，是一家由留學(xué)海歸創(chuàng)辦的高端職業(yè)教育培訓(xùn)機構(gòu)，是中國一站式人才培養(yǎng)平臺、一站式人才輸送平臺。2014年4月3日在美國成功上市，融資1
北大課工場

北大課工場是北京大學(xué)校辦產(chǎn)業(yè)為響應(yīng)國家深化產(chǎn)教融合／校企合作的政策，積極推進“中國制造2025”，實現(xiàn)中華民族偉大復(fù)興的升級產(chǎn)業(yè)鏈。利用北京大學(xué)優(yōu)質(zhì)教育資源及背
博為峰

博為峰，中國職業(yè)人才培訓(xùn)領(lǐng)域的先行者

熱門課程

北大青鳥android課程

適合人群：大專以上學(xué)歷

開班時間：每月1號
北大青鳥java軟件工程師

適合人群：大學(xué)畢業(yè)生

開班時間：每月1號
北大青鳥ACCP初中課程

適合人群：初中以上學(xué)歷

開班時間：每月1號
北大青鳥大數(shù)據(jù)課程

適合人群：18歲以上人群

開班時間：每月1號

熱門教師

劉國斌Java講師

曾工作于聯(lián)想擔(dān)任系統(tǒng)開發(fā)工程師，曾在博彥科技股份有限公司擔(dān)任項目經(jīng)理從事移動互聯(lián)網(wǎng)管理及研發(fā)工作，曾創(chuàng)辦藍懿科技有限責(zé)任公司從事總經(jīng)理職務(wù)負(fù)責(zé)iOS教學(xué)及管理工作。
王克晶Java講師

浪潮集團項目經(jīng)理。精通Java與.NET 技術(shù)，熟練的跨平臺面向?qū)ο箝_發(fā)經(jīng)驗，技術(shù)功底深厚。授課風(fēng)格授課風(fēng)格清新自然、條理清晰、主次分明、重點難點突出、引人入勝。
張老師web前端講師

精通HTML5和CSS3；Javascript及主流js庫，具有快速界面開發(fā)的能力，對瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網(wǎng)頁制作和網(wǎng)頁游戲開發(fā)。
劉蒼松Java教研總監(jiān)

具有10 年的Java 企業(yè)應(yīng)用開發(fā)經(jīng)驗。曾經(jīng)歷任德國Software AG 技術(shù)顧問，美國Dachieve 系統(tǒng)架構(gòu)師，美國AngelEngineers Inc. 系統(tǒng)架構(gòu)師。

熱門城市

Beautiful Soup取值問題

相關(guān)信息

劉國斌Java講師

王克晶Java講師

張老師web前端講師

劉蒼松Java教研總監(jiān)