摘要:为了让用户根据歌词内容快速精准地检索音乐,提出一种基于word2vec的中文歌词关键词提取算法.算法运用word2vec将歌词表征为词向量,根据词向量计算词语之间的相似度,其次通过K-means聚类算法得到歌词关键词.同时与基于TFIDF、LDA模型的歌词关键词提取结果进行比较,发现从该算法得出的10个关键词中抽取与人工标注相同的2-5个时,准确率明显增加.
关键词:word2vec 词向量 歌词关键词提取
单位:内蒙古师范大学计算机学院; 内蒙古呼和浩特010022
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社