关于 喝喷雾型迷幻香水亲身经历【V信;799.196.362】韵 的搜索结果,共701
l****m 2018-07-10
词向量(一)
虽然按照常理,我们知道这两个词之间是有联系的——母节通常应该送给母一束康乃馨;但是这两个词对应的one-hot vectors之间的距离度量,无论是欧氏距离还是余弦相似度(cosine similarity),由于其向量正交,都认为这两个词毫无相关性。 得出这种与我们相悖的结论的根本原因是:每个词本息量都太小。所以,仅仅给定两个词,不足以让我们准确判别它们是否相关。要想精确计算相关性,我们还需要更多的息——从大量数据里通过机器学习方法归纳出来的知识。 在机器学习领域里,各种“知识”被各种模表示,词向量模(word embedding model)就是其中的一类。通过词向量模可将一个 one-hot vector映射到一个维度更低的实数向量(embedding vector),如embedding(母节)=[0.3,4.2,−1.5,...],embedding(康乃馨)=[0.2,5.6,−2.3,...]embedding(母节)=[0.3,4.2,−1.5,...],embedding(康乃馨)=[0.2,5.6,−2.3,...]。
TOP