基于word2vec和Elasticsearch实现个性化搜索

- - GinoBeFunny

在 word2vec学习小记一文中我们曾经学习了word2vec这个工具，它基于神经网络语言模型并在其基础上进行优化，最终能获取词向量和语言模型. 在我们的商品搜索系统里，采用了word2vec的方式来计算用户向量和商品向量，并通过Elasticsearch的function_score评分机制和自定义的脚本插件来实现个性化搜索.

Word2Vec

- - Yonglong.Zhou

Word2Vec核心包括四个组组件，Context Builder、Input Vectors、Output Vectors和Parameter Learner. Context Builder决定是了是采用CBOW模型还是Skip-Gram模型，一般采用Input Vectors作为最终的词向量输出结果，参数学习可以按照常规的反向传播算法，以及为了提升计算速度提出来的霍夫曼树softmax和负采样方法.

词向量工具word2vec的学习

- - 标点符

word2vec是Google在2013年开源的一款将词表征为实数值向量（word vector）的高效工具，采用的模型有CBOW（Continuous Bag-Of-Words，即连续的词袋模型）和Skip-Gram两种. word2vec通过训练，可以把对文本内容的处理简化为K维向量空间中的向量运算，而向量空间上的相似度可以用来表示文本语义上的相似度.

使用Word2Vec/Doc2Vec对IMDB情感分析

- - 标点符

情感分析是一种常见的自然语言处理（NLP）方法的应用，特别是在以提取文本的情感内容为目标的分类方法中. 通过这种方式，情感分析可以被视为利用一些情感得分指标来量化定性数据的方法. 尽管情绪在很大程度上是主观的，但是情感量化分析已经有很多有用的实践，比如企业分析消费者对产品的反馈信息，或者检测在线评论中的差评信息.

深度学习word2vec笔记之应用篇

- - 我爱机器学习

1）该博文是Google专家以及多位博主所无私奉献的论文资料整理的. 2）本文仅供学术交流，非商用. 所以每一部分具体的参考资料并没有详细对应，更有些部分本来就是直接从其他博客复制过来的. 如果某部分不小心侵犯了大家的利益，还望海涵，并联系老衲删除或修改，直到相关人士满意为止. 3）本人才疏学浅，整理总结的时候难免出错，还望各位前辈不吝指正，谢谢.

[译]elasticsearch mapping

- - an74520的专栏

es的mapping设置很关键，mapping设置不到位可能导致索引重建. 请看下面各个类型介绍^_^. 每一个JSON字段可以被映射到一个特定的核心类型. JSON本身已经为我们提供了一些输入,支持 string, integer/ long, float/ double, boolean, and null..

Elasticsearch as Database - taowen - SegmentFault

- -

【北京上地】滴滴出行基础平台部招聘 Elasticsearch 与 Mysql binlog databus 开发工程师. 内推简历投递给： [email protected]. 推销Elasticsearch. 时间序列数据库的秘密（1）—— 介绍. 时间序列数据库的秘密（2）——索引.

word2vec词向量训练及中文文本相似度计算 - CSDN博客

- -

本文是讲述如何使用word2vec的基础教程，文章比较基础，希望对你有所帮助. 参考：《Word2vec的核心架构及其应用 · 熊富林，邓怡豪，唐晓晟 · 北邮2015年》. 《Word2vec的工作原理及应用探究 · 周练 · 西安电子科技大学2014年》. 《Word2vec对中文词进行聚类的研究 · 郑文超，徐鹏 · 北京邮电大学2013年》.

ElasticSearch 2 的节点调优（ElasticSearch性能）

- - 行业应用 - ITeye博客

一个ElasticSearch集群需要多少个节点很难用一种明确的方式回答，但是，我们可以将问题细化成一下几个，以便帮助我们更好的了解，如何去设计ElasticSearch节点的数目：. 打算建立多少索引，支持多少应用. elasticsearch版本: elasticsearch-2.x. 需要回答的问题远不止以上这些，但是第五个问题往往是容易被我们忽视的，因为单个ElasticSearch集群有能力支持多索引，也就能支持多个不同应用的使用.

Elasticsearch：使用 Elasticsearch 进行语义搜索

- - 掘金后端

在数字时代，搜索引擎在通过浏览互联网上的大量可用信息来检索数据方面发挥着重要作用. 此方法涉及用户在搜索栏中输入特定术语或短语，期望搜索引擎返回与这些确切关键字匹配的结果. 虽然关键字搜索对于简化信息检索非常有价值，但它也有其局限性. 主要缺点之一在于它对词汇匹配的依赖. 关键字搜索将查询中的每个单词视为独立的实体，通常会导致结果可能与用户的意图不完全一致.

基于word2vec和Elasticsearch实现个性化搜索

背景介绍

设计思路

实现细节

商品向量的计算

用户向量的计算

搜索服务时增加个性化评分

elasticsearch-feature-vector-scoring插件

总结与后续改进

参考资料

相关 [word2vec elasticsearch 个性] 推荐：