用bs4如何把這段html代碼中的各個(gè)項(xiàng)點(diǎn)提取出來(lái)呢？

<ul class="sheshi_zb">
                                            <li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車(chē)；公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車(chē)</li>                                                        <li><span>幼兒園</span>楊頭幼兒園</li>                            <li><span>中小學(xué)</span>即墨市實(shí)驗(yàn)高級(jí)中學(xué)</li>                            <li><span>大學(xué)</span>即墨廣播電視大學(xué)</li>                                                    <li><span>綜合商場(chǎng)</span>利群、佳樂(lè)家</li>                        <li><span>醫(yī)院</span>醫(yī)療中心</li>                        <li><span>銀行</span>工商銀行、建設(shè)銀行</li>                        <li><span>郵政</span>郵政儲(chǔ)蓄</li>                        <li><span>其他</span>龍泉湖公園，盟旺山公園</li>                        <li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li>                                                            </ul>

周邊設(shè)施
交通：公交10路在埠惜路北楊頭站下車(chē)；公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車(chē)
幼兒園：楊頭幼兒園
中小學(xué)：即墨市實(shí)驗(yàn)高級(jí)中學(xué)
大學(xué)：即墨廣播電視大學(xué)
綜合商場(chǎng)：利群、佳樂(lè)家
醫(yī)院：醫(yī)療中心
銀行：工商銀行、建設(shè)銀行
郵政：郵政儲(chǔ)蓄
其他：龍泉湖公園，盟旺山公園
小區(qū)內(nèi)部配套：快遞柜、超市、老年文化中心

這段Html的代碼是一個(gè)ul class="sheshi_zb"中的內(nèi)容但是分了不同li標(biāo)簽，想把對(duì)應(yīng)的內(nèi)容提取出來(lái)應(yīng)該怎么做呢？

回答

編輯回答

離夢(mèng)

from bs4 import BeautifulSoup

html = '''
<ul class="sheshi_zb">
    <li class="jiaotong_color"><span>交通</span>公交10路在埠惜路北楊頭站下車(chē)；公交106路、120路在遼河一路實(shí)驗(yàn)中學(xué)站下車(chē)</li>
    <li><span>幼兒園</span>楊頭幼兒園</li>
    <li><span>中小學(xué)</span>即墨市實(shí)驗(yàn)高級(jí)中學(xué)</li>
    <li><span>大學(xué)</span>即墨廣播電視大學(xué)</li>
    <li><span>綜合商場(chǎng)</span>利群、佳樂(lè)家</li>
    <li><span>醫(yī)院</span>醫(yī)療中心</li>
    <li><span>銀行</span>工商銀行、建設(shè)銀行</li>
    <li><span>郵政</span>郵政儲(chǔ)蓄</li>
    <li><span>其他</span>龍泉湖公園，盟旺山公園</li>
    <li><span>小區(qū)內(nèi)部配套</span>快遞柜、超市、老年文化中心</li>
</ul>'''

html_text = BeautifulSoup(html, 'lxml')

html2 = html_text.findAll('li')

title = [i.span.get_text() for i in html2]

# text = [i.get_text().lstrip('\n').split('\n') for i in html_text]
text = [i.get_text().lstrip('\n').rstrip('\n').split('\n') for i in html_text]

mydict = dict(zip(title, text[0]))

for i, k in mydict.items():
    print('{0}: {1}'.format(i, k))

這一段就是把你需要的結(jié)果生成一個(gè)字典。

2017年6月26日 03:28

編輯回答

舊城人

from bs4 import BeautifulSoup
html='你的html代碼'
soup = BeautifulSoup(html,'lxml')
list_span=[]
list_li=[]
#取出所有span標(biāo)簽的內(nèi)容，即交通，幼兒園等等
for each_span in soup.select('span')：
    list_span.append(each_span.text)
#取出所有l(wèi)i標(biāo)簽的內(nèi)容
for each_li in soup.select('li'):
    list_li.append(each_li.text)
#將取出的內(nèi)容放入list,按你需要的方式打印
for i in range(len(list_span)):
    print(list_span[i]+':'+list_li[i])

不知道這樣是否能解決你的問(wèn)題，有問(wèn)題的話(huà)，歡迎提問(wèn)。

2017年9月28日 20:26