发布网友 发布时间:2024-10-06 13:17
共1个回答
热心网友 时间:2024-10-15 09:29
word2vec是一种强大的词向量模型,它旨在解决离散表示(one-hot Representation)的问题。这种传统的表示方式用一个全零向量表示每个词,其中只有一个维度为1,对应词在词典中的位置,但存在维数灾难和词语编码随机性的问题。Distributed representation(分布式表示)正是对这种问题的改进,它基于词语的语义是由上下文决定的这一概念,通过固定长度的稠密词向量来表示词语,如[0.792, -0.177, …],降低了维数并揭示了词与词之间的潜在联系。