在线观看不卡亚洲电影_亚洲妓女99综合网_91青青青亚洲娱乐在线观看_日韩无码高清综合久久

鍍金池/ 問答/人工智能  C  網(wǎng)絡(luò)安全/ 假如我有兩篇文章,如何計算他們的相似度呢?具體有哪些思路和成熟的方法呢?

假如我有兩篇文章,如何計算他們的相似度呢?具體有哪些思路和成熟的方法呢?

RT,假如我有兩篇文章,如何計算他們的相似度呢?具體有哪些思路和成熟的方法呢?

回答
編輯回答
賤人曾

比較廣的算法是計算兩遍文章的向量和,大致方式是每個詞或者字都是一個向量,然后所有向量相加,看兩篇文章結(jié)果向量是不是相差不大。
舉個例子,一個句子“我今天出去玩了”先分詞 “我”,“今天”,“出去”,“玩”。第二個句子“我明天不去動物園”分詞“我”,“明天”,“不去”,“動物園”。假設(shè)向量表示為長度和夾角:
我: (1,0)
今天: (1,10)
出去: (1, 20)
玩:(1, 30)
明天: (1, 15)
不去: (1, 200)
動物園: (1, 5)
最后把相關(guān)向量相加,計算兩個結(jié)果向量的和大不大。就這個思路,網(wǎng)上找找應(yīng)該有的。

2018年4月11日 20:00