Python实现word2Vec model过程解析 _阅读全文【IIS7站长之家】

爱站内页反链

爱站首页反链

神马是否收录

360网站安全检测

搜狗是否收录

360是否收录

百度是否收录

百度年收录

网站ICP备案批量查询

百度反链批量查询

搜狗PR批量查询

谷歌PR批量查询

神马权重批量查询

360移动权重批量查询

站长移动权重批量查询

爱站移动权重批量查询

360权重查询

站长PC权重批量查询

爱站PC权重批量查询

搜狗总收录批量查询

360日收录批量查询

360总收录批量查询

百度月收录批量查询

百度周收录批量查询

百度日收录批量查询

百度网站收录批量查询

获取网站描述

获取网站关键词

获取网站标题

神马总收录

百度预计流量

当前位置主页 > 网站技术 > 代码类 >

最大化缩小

Python实现word2Vec model过程解析

栏目：代码类时间：2019-12-16 15:06

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec，所以我们直接开始建立模型

这是建立模型的过程，最后会出现saving Word2vec的语句，代表已经成功建立了模型

这是输入了 gorvement和news关键词后所反馈的词语 --- administration，他们之间的相关性是0.508

当我在输入 women 和 man ，他们显示的相关性的0.638 ，已经是非常高的一个数字。

值得一提的是，我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话，可以自己建立该模型，通过传入不同的语料库，来calc 一些term的相关性噢

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持IIS7站长之家。

seo站群查询

企业级客服软件

上一篇：Python实现密码薄文件读写操作

下一篇：deepin linux 手动升级内核的方法

立即下载 - IIS7 站长工具包

最新 更多<<

推荐 更多<<