在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問(wèn)答/Python/ 用bs4如何把這段html代碼中的各個(gè)項(xiàng)點(diǎn)提取出來(lái)呢?

用bs4如何把這段html代碼中的各個(gè)項(xiàng)點(diǎn)提取出來(lái)呢?

<ul class="sheshi_zb">
                                            <li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車(chē);公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車(chē)</li>                                                        <li><span>幼兒園</span>楊頭幼兒園</li>                            <li><span>中小學(xué)</span>即墨市實(shí)驗(yàn)高級(jí)中學(xué)</li>                            <li><span>大學(xué)</span>即墨廣播電視大學(xué)</li>                                                    <li><span>綜合商場(chǎng)</span>利群、佳樂(lè)家</li>                        <li><span>醫(yī)院</span>醫(yī)療中心</li>                        <li><span>銀行</span>工商銀行、建設(shè)銀行</li>                        <li><span>郵政</span>郵政儲(chǔ)蓄</li>                        <li><span>其他</span>龍泉湖公園,盟旺山公園</li>                        <li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li>                                                            </ul>

周邊設(shè)施
交通:公交10路在埠惜路北楊頭站下車(chē);公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車(chē)
幼兒園:楊頭幼兒園
中小學(xué):即墨市實(shí)驗(yàn)高級(jí)中學(xué)
大學(xué):即墨廣播電視大學(xué)
綜合商場(chǎng):利群、佳樂(lè)家
醫(yī)院:醫(yī)療中心
銀行:工商銀行、建設(shè)銀行
郵政:郵政儲(chǔ)蓄
其他:龍泉湖公園,盟旺山公園
小區(qū)內(nèi)部配套:快遞柜、超市、老年文化中心

這段Html的代碼是一個(gè)ul class="sheshi_zb"中的內(nèi)容 但是分了不同li標(biāo)簽,想把對(duì)應(yīng)的內(nèi)容提取出來(lái)應(yīng)該怎么做呢?

回答
編輯回答
離夢(mèng)
from bs4 import BeautifulSoup

html = '''
<ul class="sheshi_zb">
    <li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車(chē);公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車(chē)</li>
    <li><span>幼兒園</span>楊頭幼兒園</li>
    <li><span>中小學(xué)</span>即墨市實(shí)驗(yàn)高級(jí)中學(xué)</li>
    <li><span>大學(xué)</span>即墨廣播電視大學(xué)</li>
    <li><span>綜合商場(chǎng)</span>利群、佳樂(lè)家</li>
    <li><span>醫(yī)院</span>醫(yī)療中心</li>
    <li><span>銀行</span>工商銀行、建設(shè)銀行</li>
    <li><span>郵政</span>郵政儲(chǔ)蓄</li>
    <li><span>其他</span>龍泉湖公園,盟旺山公園</li>
    <li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li>
</ul>'''

html_text = BeautifulSoup(html, 'lxml')

html2 = html_text.findAll('li')

title = [i.span.get_text() for i in html2]

# text = [i.get_text().lstrip('\n').split('\n') for i in html_text]
text = [i.get_text().lstrip('\n').rstrip('\n').split('\n') for i in html_text]

mydict = dict(zip(title, text[0]))

for i, k in mydict.items():
    print('{0}: {1}'.format(i, k))
  • 這一段就是把你需要的結(jié)果生成一個(gè)字典。
2017年6月26日 03:28
編輯回答
舊城人
from bs4 import BeautifulSoup
html='你的html代碼'
soup = BeautifulSoup(html,'lxml')
list_span=[]
list_li=[]
#取出所有span標(biāo)簽的內(nèi)容,即交通,幼兒園等等
for each_span in soup.select('span'):
    list_span.append(each_span.text)
#取出所有l(wèi)i標(biāo)簽的內(nèi)容
for each_li in soup.select('li'):
    list_li.append(each_li.text)
#將取出的內(nèi)容放入list,按你需要的方式打印
for i in range(len(list_span)):
    print(list_span[i]+':'+list_li[i])
    

不知道這樣是否能解決你的問(wèn)題,有問(wèn)題的話(huà),歡迎提問(wèn)。

2017年9月28日 20:26