gensim word2vec simple usage

데이터분석/Machine Learning

늘근이 2018. 12. 16. 21:29

from gensim.models import word2vec

token = [['나는','너를', '사랑해'],['나도','너를','사랑해']]

embedding = word2vec.Word2Vec(token, size=5, window=1, negative=3, min_count=1)

embedding.save('model') #모델 저장

embedding.wv.save_word2vec_format('my.embedding', binary=False) #모델 저장

embedding.wv['너를']

embedding.most_similar('너를')

from gensim.models.keyedvectors import KeyedVectors

embedding.wv.save_word2vec_format('my.embedding', binary=False) #모델 저장

model = KeyedVectors.load_word2vec_format('my.embedding', binary=False, encoding='utf-8')

TPU 구글에서 사용 (0)	2019.06.22
모든이들을 위한 Facebook Prophet Paper 쉬운 요약정리 (4)	2018.06.05
xgboost screen shot (0)	2018.04.13
회귀 결정트리의 불순도 측정과 값 해석 (0)	2018.04.11
스택힝 (0)	2018.04.09

옛날 블로그

늘

지도학습, 머신러닝, 센차터치, 이미지변환, 2017 티스토리 결산, 트리구조, 비지도학습, 장식 패턴, 비용함수, 수식, 데이터마이닝, 자바, 스칼라, 디자인패턴, composite 패턴, decorator, 선형대수, 교사학습, 팩토리 디자인, 디자인 패턴,

옛날 블로그