在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/HTML5  Java  PHP  HTML/ 抓取其他網(wǎng)站的詳情頁,怎么放到我們的項目中

抓取其他網(wǎng)站的詳情頁,怎么放到我們的項目中

背景:
后臺抓取其他網(wǎng)站的詳情頁,要放到我們手機app中,還要保持風格統(tǒng)一,就不能使用iframe了,但是這個詳情頁的復雜程度我們不確定,有可能有table,圖片,也可能是抓取的web端頁面,web端頁面的table定寬了怎么辦?有沒有做過類似需求的?
問題:
現(xiàn)在應該從哪里下手,是先要確定輸入嗎?如果是的話

  1. 后臺返給前端帶內聯(lián)樣式的html文本,還是
  2. 返給前端純文本,但是有table或者有img的地方需要連帶標簽返回?還是有其他更好的方法或者腳本??
回答
編輯回答
夏木

有兩種想法

  1. 后臺抓取之后,解析html把 數(shù)據(jù) 圖片 表格 分類 , 只把數(shù)據(jù)返回給前端,前端再用統(tǒng)一的布局,決定各個的位置.
  2. 抓取之后 把html中的樣式去掉,把html傳給前端 , 前端用css給表格 文字 寫一個同一的樣式

都能達到統(tǒng)一風格的目的

2017年9月19日 10:05
編輯回答
孤島

通常我的做法是,由于目標網(wǎng)站的頁面結構都是不一樣的,所以采集之后還是需要數(shù)據(jù)清洗的,把數(shù)據(jù)整理成結構化的,這樣給前端就是固定的格式,前端方便處理,用戶使用的話也是看的一樣的格式。

然后麻煩的地方在于目標站點的頁面結構不一樣的,每個都需要單獨的采集程序和分析程序,如果站點數(shù)目不多其實沒關系,但是站點多了之后,就需要把采集和分析的程序開發(fā)成可配置化的,這樣開發(fā)難度可能會大一點。

2017年1月8日 11:12