從若干多個無序的漢字中選擇出其中的成語，有什么高效地方法嗎？

用python玩微信的成語猜猜看，要從24個漢字中選擇出其中的成語。

先說一下我的方案：將24個漢字的所有4字組合，暴力窮舉，分詞（jieba），結果中存在4個字的，push到結果中，再一個一個試。

但是暴力窮舉復雜度呈指數(shù)上升，另一個游戲叫成語連連看還是什么的，五十多個漢字，窮舉不了了。。。

所以大家有什么好辦法嗎？

ps：jieba分詞有時（比較頻繁）會出現(xiàn)分不出來成語的情況，爬了個成語詞典作為自定義詞典，效果立竿見影，但仍然偶爾會出現(xiàn) 明明詞典中有、但就是分不出來的情況，諸位能告訴我是什么原因嗎？（我的自定義詞典沒有詞頻和詞性）

回答

編輯回答

舊螢火

基本思路：
假設你已經有了一個成語詞典。
對于24個漢字，從第一個開始
{
找出該漢字開頭的所有成語，對符合條件的所有成語，
判斷第二個漢字是否包含在24個漢字中，對符合條件的依次判斷第三個第四個，
找到則跳出循環(huán)。
}
這個最壞需要遍歷24遍詞典。
優(yōu)化：
對于成語詞典，假設是按拼音順序排列的。
首先對于你的24個漢字，按拼音順序排列一遍
從第一個開始，查找該漢字開頭對應的成語，依次判斷成語的第二三四個漢字。
如果找到則跳出，否則到下一個漢字，繼續(xù)向下查找詞典。
這個最壞只需要1遍。
其中有個問題，假如有一個漢字沒有對應的成語怎么辦，所以詞典可能也要包含該漢字來做標記（低效率），或者對拼音比大小來判斷該漢字是否已經掠過了。

2017年1月12日 04:23

編輯回答

尐潴豬

本問題已解決，解決方法是找了一個比較大的詞庫，取代之前的基于jieba分詞的成語搜索。感謝大家的幫助。

2017年12月7日 11:26

相關信息

熱門機構

北大青鳥昌平校區(qū)

北大青鳥APTECH成立于1999年。依托北京大學優(yōu)質雄厚的教育資源和背景，秉承“教育改變生活”的發(fā)展理念，致力于培養(yǎng)中國IT技能型緊缺人才，是大數(shù)據(jù)專業(yè)的國家
達內教育

達內教育集團成立于2002年，是一家由留學海歸創(chuàng)辦的高端職業(yè)教育培訓機構，是中國一站式人才培養(yǎng)平臺、一站式人才輸送平臺。2014年4月3日在美國成功上市，融資1
北大課工場

北大課工場是北京大學校辦產業(yè)為響應國家深化產教融合／校企合作的政策，積極推進“中國制造2025”，實現(xiàn)中華民族偉大復興的升級產業(yè)鏈。利用北京大學優(yōu)質教育資源及背
博為峰

博為峰，中國職業(yè)人才培訓領域的先行者

熱門課程

北大青鳥android課程

適合人群：大專以上學歷

開班時間：每月1號
北大青鳥java軟件工程師

適合人群：大學畢業(yè)生

開班時間：每月1號
北大青鳥ACCP初中課程

適合人群：初中以上學歷

開班時間：每月1號
北大青鳥大數(shù)據(jù)課程

適合人群：18歲以上人群

開班時間：每月1號

熱門教師

劉國斌Java講師

曾工作于聯(lián)想擔任系統(tǒng)開發(fā)工程師，曾在博彥科技股份有限公司擔任項目經理從事移動互聯(lián)網管理及研發(fā)工作，曾創(chuàng)辦藍懿科技有限責任公司從事總經理職務負責iOS教學及管理工作。
王克晶Java講師

浪潮集團項目經理。精通Java與.NET 技術，熟練的跨平臺面向對象開發(fā)經驗，技術功底深厚。授課風格授課風格清新自然、條理清晰、主次分明、重點難點突出、引人入勝。
張老師web前端講師

精通HTML5和CSS3；Javascript及主流js庫，具有快速界面開發(fā)的能力，對瀏覽器兼容性、前端性能優(yōu)化等有深入理解。精通網頁制作和網頁游戲開發(fā)。
劉蒼松Java教研總監(jiān)

具有10 年的Java 企業(yè)應用開發(fā)經驗。曾經歷任德國Software AG 技術顧問，美國Dachieve 系統(tǒng)架構師，美國AngelEngineers Inc. 系統(tǒng)架構師。

熱門城市

_{<abbr id="zoesb"></abbr>}

從若干多個 無序 的漢字中選擇出其中的 成語 ，有什么高效地方法嗎？

相關信息

劉國斌Java講師

王克晶Java講師

張老師web前端講師

劉蒼松Java教研總監(jiān)

從若干多個無序的漢字中選擇出其中的成語，有什么高效地方法嗎？