在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問(wèn)答/人工智能  Python  網(wǎng)絡(luò)安全/ TensorFlow GPU比CPU更慢

TensorFlow GPU比CPU更慢

CPU: i7-4710HQ
顯卡:GTX850m
內(nèi)存:8G
操作系統(tǒng):Win10
裝了 CUDA8.0,cuDNN6.0,tensorflow-gpu-1.4.0

配置了必要的PATH環(huán)境變量之外沒(méi)做其它配置了。

用同樣的TensorFlow代碼跑同一個(gè)BPNN,用CPU只花了32秒完成,用GPU卻執(zhí)行了140+秒。
為什么我的TensorFlow加了GPU優(yōu)化之后反而更慢了?
是不是我參數(shù)沒(méi)配置好?

回答
編輯回答
陌顏

第二天上網(wǎng)Google了一番,有的說(shuō)是可能網(wǎng)絡(luò)太小,效率瓶頸卡在了CPU與GPU數(shù)據(jù)傳輸上。

對(duì)此我做了一波實(shí)驗(yàn),原來(lái)的BPNN只有雙隱層,節(jié)點(diǎn)數(shù)分別是15,5,我把改成了4隱層,每層節(jié)點(diǎn)數(shù)都是2000之后,對(duì)單次訓(xùn)練進(jìn)行了時(shí)間統(tǒng)計(jì)。

實(shí)驗(yàn)出來(lái)這時(shí)GPU單次訓(xùn)練只花了30~50 ms左右,而CPU的平均耗時(shí)是500ms,由此可以斷定一個(gè)結(jié)論:
網(wǎng)絡(luò)結(jié)構(gòu)比較小的時(shí)候,效率瓶頸在CPU與GPU數(shù)據(jù)傳輸,這個(gè)時(shí)候只用cpu會(huì)更快。
網(wǎng)絡(luò)結(jié)構(gòu)比較龐大的時(shí)候,gpu的提速就比較明顯了。

2017年11月23日 23:10