更新于:06-21 18:04

有关[搜索]分类推荐

Google和必应都无法替代的10大深网引擎

于06-26 07:00 - secist - 资讯 安全资讯 深网
当我们想要搜索某些内容时,我们第一个想到的就是打开Google、百度或必应这类的搜索引擎. 但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐藏在深网的内容. 据不完全统计,深网的信息量为表层网络的500倍. 那么,深网主要都包含了些什么内容呢. 其实,深网主要包括的都是些,例如需要某些条件如注册、付费,才能访问的内容,如数据库和某些服务等.

通过Function Score Query优化Elasticsearch结果

于04-06 00:33 - -
在使用 Elasticsearch 进行全文搜索时,搜索结果默认会以文档的相关度进行排序,如果想要改变默认的排序规则,也可以通过 sort指定一个或多个排序字段. 但是使用 sort排序过于绝对,它会直接忽略掉文档本身的相关度(根本不会去计算). 在很多时候这样做的效果并不好,这时候就需要对多个字段进行综合评估,得出一个最终的排序.

基于Elasticsearch实现建议

于01-23 09:14 - - Elasticsearch Elasticsearch 搜索建议
搜索建议是搜索的一个重要组成部分,一个搜索建议的实现通常需要考虑建议词的来源、匹配、排序、聚合、关联的文档数和拼写纠错等,本文介绍一个基于Elasticsearch实现的搜索建议. 电商网站的搜索是最基础最重要的功能之一,搜索框上面的良好体验能为电商带来更高的收益,我们先来看看淘宝、京东、亚马逊网站的搜索建议.

基于Elasticsearch实现推荐

于03-21 09:18 - - Elasticsearch Elasticsearch 搜索 推荐 拼写纠错
在 基于Elasticsearch实现搜索建议一文中我们曾经介绍过如何基于Elasticsearch来实现搜索建议,而本文是在此基础上进一步优化搜索体验,在当搜索无结果或结果过少时提供推荐搜索词给用户. 在根据用户输入和筛选条件进行搜索后,有时返回的是无结果或者结果很少的情况,为了提升用户搜索体验,需要能够给用户推荐一些相关的搜索词,比如用户搜索【迪奥】时没有找到相关的商品,可以推荐搜索【香水】、【眼镜】等关键词.

基于word2vec和Elasticsearch实现个性化

于03-28 07:51 - - Elasticsearch Elasticsearch word2vec 个性化 搜索
在 word2vec学习小记一文中我们曾经学习了word2vec这个工具,它基于神经网络语言模型并在其基础上进行优化,最终能获取词向量和语言模型. 在我们的商品搜索系统里,采用了word2vec的方式来计算用户向量和商品向量,并通过Elasticsearch的function_score评分机制和自定义的脚本插件来实现个性化搜索.

知乎的站内还有救吗? - 知乎

于06-18 07:34 - -
第一次在知乎上得到这么多赞,有点担忧,生怕自己说的不好,误人子弟. 其实,我是一个从事互联网搜索引擎开发5年的码侬,当然也不是造轮子,就是Java方向的利用Solr来进行二次开发. 所以,从事的都是垂直领域特定搜索引擎开发:电子商务领域和招聘行业. 针对知乎搜索,我提出的几点可优化的方案,只是我在从业经历中碰到的变态需求中的一部分.

为什么知乎的功能如此之烂? - 知乎

于06-18 07:33 - -
(潜水员终于有可以专业回答的问题了). 利益相关:搜狗搜索工程师,对搜索技术「略懂」. 搜索是技术方向辐射相当广的一个复杂系统,其技术门槛之高,在众多的互联网产品中能与搜索比肩的是少之又少. 要想玩转这套系统,拥有一批最优秀且懂搜索的工程师和研究员是必不可少的. 我看到之前@熊辰炎同学也提到说想解决的话,知乎可能需要5个熟练工干大半年.

近实时SearcherManager和NRTManager的使用 - 学习笔记 - 博客频道 - CSDN.NET

于06-18 07:32 - -
lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索即在索引发生改变时,通. 过线程跟踪,在相对很短的时间反映给给用户程序的调用. NRTManager通过管理IndexWriter对象,并将IndexWriter的一些方法(增删改)例如. addDocument,deleteDocument等方法暴露给客户调用,它的操作全部在内存里面,所以如果.

美团点评旅游召回策略的演进

于06-16 16:54 - 美团点评技术团队 -
本文内容与6月22日第22期美团点评技术沙龙“美团点评AI实践”主题演讲一致,欢迎大家去 现场和作者交流. 关注“美团点评技术团队”微信公众号,第一时间获取沙龙最新信息,还可以查阅往期沙龙PPT/视频. 美团点评作为最大的生活服务平台,有丰富的品类可供用户选择,因此搜索这个入口对各业务的重要性不言而喻,除了平台搜索外,业务搜索系统的质量和效果对用户体验、商家曝光、平台交易也有着关键作用.

在线AI技术在与推荐场景的应用

于06-02 07:55 - pub@cyzone.cn(http://www.cyzone.cn创业邦) -
  12月6日-7日,由阿里巴巴集团、阿里巴巴技术发展部、阿里云云栖社区联合主办,以“2016双11技术创新”为主题的阿里巴巴技术论坛(Alibaba Technology Forum,ATF)成功在线举办. 在本次分享中,来自阿里巴巴集团的研究员徐盈辉带了题为《在线AI技术在搜索与推荐场景的应用》的精彩演讲,他结合本届双11搜索和推荐场景详细介绍了电商搜索推荐的技术演变、阿里搜索推荐的新技术体系以及未来的发展方向.

从0到1再到100 蘑菇街与推荐架构的探之路

于05-24 00:00 - - tuicool
【51CTO.com原创稿件】丁小明,花名小宝,蘑菇街搜索技术团队负责人. 2011年底加入蘑菇街,2013年开始负责搜索团队,见证了蘑菇街一路蓬勃发展的历程,也和团队一起从零起步摸爬滚打,打造了蘑菇街的搜索推荐体系,包括自主研发的C++主搜引擎和广告引擎、实时个性化推荐系统、基于开源Solr/ES深度定制的实时搜索平台等.

微信做:未来是「微信网」还是「万维网

于04-26 08:15 - PMCAFF - 投稿 搜索 微信
看到微信要做搜索的新闻其实并不惊讶,毕竟近几个月来微信一直「小动作」不断,3月份微信指数推出之后,广告主在微信平台投放广告时就会问「你们有没有基于微信热词的广告报价啊」,似乎预示着一些零碎的出招结束之后,微信还是会踏入移动搜索领域. 动作很快,4月24日,搜狗发布公布2017年Q1财报的同一天,腾讯的微信事业群内部架构作了一些调整,微信事业群下成立搜索应用部.

[原]自学大数据:Hive基于的用户日志行为分析

于08-29 14:58 - shifenglov -
”大数据时代“,“大数据/云计算”,“大数据平台”,每天听到太多的大数据相关的词语,好像现在说一句话不跟大数据沾边都不好意思说自己是做IT的. 可能这与整个IT圈子的炒作也有关联,某一个方面来看其实就是一营销术语. 很多朋友就想问,我想做大数据,但是没有这个条件,没有这个数据量,没有那么多业务场景,没有那多集群可以吗.

谷歌推出新机器学习 API,可识别、视频中物体

于03-08 23:52 - - 综合新闻
据国外媒体 TechCrunch 报道,谷歌今天在旧金山举行的 Cloud Next 大会上宣布推出新的机器学习 API,该 API 支持自动识别视频中的物体,使它们变得可以被搜索. 该名为视频智能(Video Intelligence)的 API 将可以让开发者开发能够自动识别视频中的物体的应用程序.

谷歌公布新竞争对手名单 不再局限于业务

于02-04 00:00 - - tuicool
腾讯科技讯谷歌(微博)母公司Alphabet正不断扩展其业务范畴,其主要业务也不再局限于搜索领域,为此面临的竞争也日益激烈. Alphabet日前公布了最新竞争对手名单,并向投资者发出警告. 在向美国证券交易委员会提交的最新年度报告中,Alphabet列出许多新竞争者名单,包括苹果、Netflix以及Hulu等,以此突出其新业务(比如消费硬件制造)面临的竞争风险.

配置高性能 ElasticSearch 引擎集群的9个小贴士

于01-05 08:09 - -
Loggly服务底层的很多核心功能都使用了ElasticSearch作为搜索引擎. 就像Jon Gifford(译者注:Loggly博客作者之一)在他近期关于“ElasticSearch vs Solr”的文章中所述,日志管理在搜索技术方面产生一些粗暴的需求,坚持下来以后,它必须能够:. 在超大规模数据集上可靠地进行准实时索引 – 在我们的案例中,每秒有超过100,000个日志事件与此同时,在该索引上可靠高效地处理超大量的搜索请求.

[原]基于Lucene多引进行引和

于12-13 13:17 - shirdrn -
Lucene支持创建多个索引目录,同时存储多个索引. 我们可能担心的问题是,在索引的过程中,分散地存储到多个索引目录中,是否在搜索时能够得到全局的相关度计算得分,其实Lucene的ParallelMultiSearcher和MultiSearcher支持全局得分的计算,也就是说,虽然索引分布在多个索引目录中,在搜索的时候还会将全部的索引数据聚合在一起进行查询匹配和得分计算.

AppsFlyer 的报告说,App Store 的广告效果还不错

于12-12 06:48 - 李墨天 - 新闻
在 App Store 搜索广告(Apple Search Ads)推出两个月后,来自移动应用跟踪与归因分析平台 AppsFlyer 的一份报告显示,在这项服务上线的一个月内,广告商们对投放结果十分满意. 在这个月,他们在 Apple 搜索广告上的支出增长显著. 今年 9 月 29 日,App Store 搜索广告正式上线,在此之前,这一搜索推广机制已经在美国试运行了三个多月.

手撕包菜磁力引擎的开源说明

于05-14 16:44 - Xiaoxia - Internet 我的代码 我的分享
已经一年半载没有写博客了,搞得上来不知道写些什么. 博客上的内容还时不时有人评论,大部分我还是会一一回复的. 有些人会关注我的博客用什么主机,我的博客现在是用Linode的主机,因为现在很便宜,而且配置不差. 另外比较多的是问手撕包菜的源代码能否提供,能否出售. 今天我写这个文章就是把手撕包菜的网站开源了,包括网站页面,DHT爬虫和搜索引擎相关部分.

开源磁力爬虫dhtspider原理解析

于12-02 16:00 - -
开源地址: https://github.com/callmelanmao/dhtspider. 开源的dht爬虫已经有很多了,有php版本的,python版本的和nodejs版本. 经过一些测试,发现还是nodejs版本的爬虫效率最高,测试使用的是github上面的已有开源项目, https://github.com/dontcontactme/p2pspider/.

京东亿级商品核心技术解密

于11-30 02:20 - 小码哥 - 运维经验 京东 搜索核心技术
作者:王春明,现任京东搜索平台部负责人,2011年加入京东搜索团队,期间一直负责京东搜索引擎研发工作,主导了多次搜索架构升级工作保障其满足京东发展需求,擅长搜索引擎、高性能服务开发、分布式系统架构. 招聘: 京东搜索平台部木有有高级/资深搜索引擎研发工程师(C/C++)  、高级/资深算法工程师(C/C++)、高级/资深数据系统工程师(java)等职位,期待您的加入,一起打造弹性搜索平台.

冯大辉正式宣布创业:做医疗,跟百度干一架

于10-11 14:07 - 蒋鸿昌 - 新闻 丁香园 互联网医疗 冯大辉 搜索引擎
7 月,从丁香园的内部邮件里,我们得知丁香园 CTO 冯大辉已经决定离职. 离职期间,冯大辉还与丁香园发生了期权纠纷. 作为知名的技术人员和医疗布道者,冯大辉离职后的去向一直备受关注,今天, 他通过微信公众号正式宣布,接下来将开始创业. 从 2010 年加入丁香园算起,冯大辉在医疗行业工作超过 6 年,在此期间,他也不遗余力地通过个人影响力普及医疗知识,向公众推广丁香园.

7个好用的BT种子引擎

于10-08 12:30 - xiajs -
7个好用的BT种子搜索引擎. 2015年12月16日  网文资讯  4条评论 阅读 39,550 views 次. BTSOSO是一个专业的基于DHT的磁力链接搜索引擎,专注于提供磁力搜索和BT种子文件搜索服务. 它用于解决常见搜索引擎磁力资源过度分散的问题,你可以在这里搜索到分享在DHT网络中的免费电影、剧集、音乐、图书、图片、综艺、软件、动漫、教程、游戏等BT资源链接和磁力链接.

【技术贴】9个基于Java的引擎框架

于09-21 11:18 - aoyouzi -
9个基于Java的搜索引擎框架. 1.Java全文搜索引擎框架Lucene. 毫 无疑问,Lucene是目前最受欢迎的Java全文搜索框架,准确地说,它是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引 擎. Lucene为开发人员提供了相当完整的工具包,可以非常方便地实现强大的全文检索功能.

提高排序效果,Twitter相关架构解析

于09-02 00:00 - - geek
每天,全世界几百万的用户都在Twitter上搜索着发生的新鲜事. 在重大事件期间,比如刚刚过去不久的 2016欧洲杯,我们观察到在用户前来Twitter查看最新战况时,搜索服务会出现流量的尖峰,并且整体流量随着此事件的推移而稳步上升. Twitter的搜索质量组就是负责给用户返回质量最好的结果.

百度Spider3.0升级对站点有什么好处

于06-30 03:00 - DinK - 行业资讯
近期百度搜索最大的动作应该就是百度Spider3.0升级了,简单的概括下升级的特点就是:抓取更实时,收录效率更快,对原创优质内容更青睐. 此次升级是把当前离线、全量计算为主的系统,改造成实时、增量计算的全实时调度系统,万亿规模的数据进行实时读写,可以收录90%的网页,速度提升80%. 『抓取、建库更快—提交的内容更容易被抓取』.

谷歌面向企业用户推出全新软件工具Springboard

于06-15 02:29 - - 新鲜
据外媒报道,日前,谷歌公司宣布,他们现正在测试一款全新的搜索工具,叫Springboard. 这是一款专门面向企业级用户推出的Google Apps生产力套件. 目前关于这套工具的消息并不多,仅知道它非常适用需要在大型共享文档和文件库里查找的企业. 谷歌称,Springboard可以快速、轻松地帮助用户在Gmail、Calendar、Docs、Drive、Contact等Google Apps中找到其所需的资料.

苹果应用商店在WWDC开幕前迎来巨变:加入广告

于06-09 03:50 - -
这可能是 2008 年 App Store 建立以来的一次最大变动. 新浪手机讯 6 月 9 日凌晨消息在中国的端午节前一天,苹果公司全球市场营销高级副总裁菲尔·席勒(Phil Schiller)电话连线新浪科技,在下周的全球开发者大会开幕前(WWDC)透露了一些应用商店方面的消息. 重点包括:1.更完善的应用审核;2.新的商业模式;3.应用商店搜索中加入广告.

商品引擎—推荐系统设计

于05-23 04:10 - liuchi1993 - 基础技术 推荐系统 搜索
结合目前已存在的商品推荐设计(如淘宝、京东等),推荐系统主要包含系统推荐和个性化推荐两个模块. 系统推荐: 根据大众行为的推荐引擎,对每个用户都给出同样的推荐,这些推荐可以是静态的由系统管理员人工设定的,或者基于系统所有用户的反馈统计计算出的当下比较流行的物品. 个性化推荐:对不同的用户,根据他们的口味和喜好给出更加精确的推荐,这时,系统需要了解需推荐内容和用户的特质,或者基于社会化网络,通过找到与当前用户相同喜好的用户,实现推荐.

工具everything的原理

于05-13 09:41 - becomeBetter -
一下内容转载自: http://bbs.51cto.com/thread-662776-1.html. 初接触Everything你一定会好奇为什么它能快得这么离谱. 根据Everything的官网所说,它1分钟可以索引100万个文件. 如果笔记本上320G的硬盘48万多个文件,建立索引需要的时间也只有几秒.