更新于:12-15 23:30

有关[搜索]分类推荐

45种网盘搜索引擎资料汇总(资源福利)

于12-17 03:56 - -
(非调用google、百度接口,有自己的爬虫,另外分享功能更是十分强大). 百度网盘搜索-网盘搜索下载. 这里已经有很多热门资源,分享达人,排行什么的. 很容易利用达人分享空间收集资源. 严格意义上这不属于网盘搜索引擎,但是宝贝实在太多,不放上可惜了. 页面很简洁,支持原本的百度搜索. 百度云搜索 - 百度云盘资源搜索下载.

如何用redis实现“搜索历史”和“自动补全”搜索框

于11-16 11:31 - -
在日常的web开发中,经常有搜索框功--在一批数据中检索自己需要的数据. 现在的百度以及各大电商的搜索框都做得很人性化,主要体现在两个方面:. 一、搜索框的“搜索历史”:为了方便用户下次搜索,搜索框通常会提供“搜索历史”功能 即:记录下用户的搜索历史,用户下次点击搜索框就会立即展示你最近的搜索记录列表.

一个完整推荐系统的设计实现-以百度关键词搜索推荐为例

于09-17 14:42 - admin - 产品 推荐系统 搜索引擎 数据挖掘 机器学习
在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门,热门关键词的问题. 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些区别. 正好最近正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计. 结论是: 没有某种算法能够完全解决问题, 多重算法+交互设计, 才能解决特定场景的需求.

Elasticsearch分布式搜索架构原理 | Elasticsearch权威指南(中文版)

于11-02 00:49 - -
在继续之前,我们将绕道讲一下搜索是如何在分布式环境中执行的. 它比我们之前讲的基础的增删改查(create-read-update-delete,CRUD)请求要复杂一些. 本章的信息只是出于兴趣阅读,使用Elasticsearch并不需要理解和记住这里的所有细节. 阅读这一章只是增加对系统如何工作的了解,并让你知道这些信息以备以后参考,所以别淹没在细节里.

ElasticSearch 2 (18) - 深入搜索系列之控制相关度 - Richaaaard - 博客园

于10-19 13:25 - -
ElasticSearch 2 (18) - 深入搜索系列之控制相关度. 处理结构化数据(比如:时间、数字、字符串、枚举)的数据库只需要检查一个文档(或行,在关系数据库)是否与查询匹配. 布尔是/非匹配是全文搜索的基础部分,但不止这些,我们也同样需要知道每个文档与查询的相关度,在全文搜索引擎中我们不仅需要找到匹配的文档,还需要根据他们相关度的高低,对他们进行排序.

[原]基于Spark的大数据精准营销中搜狗搜索引擎的用户画像挖掘

于12-19 16:17 - u011239443 -
转载请注明:转载 from. from CCF举办的“大数据精准营销中搜狗用户画像挖掘”竞赛. “用户画像”是近几年诞生的名词. 很多营销项目或很多广告主,在打算投放广告前,都要求媒体提供其用户画像. 在以前,大多媒体会针对自身用户做一个分类,但是有了大数据后,企业及消费者行为带来一系列改变与重塑,通过用户画像可以更加拟人化的描述用户特点.

Go 在百万亿级搜索引擎中的应用

于09-12 00:00 - - dev
Poseidon 系统是由 360 开源的日志搜索平台,目前已经用到了生产环节中,可以在数百万亿条、数百 PB 大小的日志数据中快速分析和检索特定字符串. 因为 Golang 得天独厚的支持并发编程,Poseidon 的核心搜索引擎、发报器、查询代理是用 Golang 开发的,在核心引擎查询、多天查询、多天数据异步下载中大量使用了 goroutine+channel.

如何为技术博客设计一个推荐系统(中):基于 Google 搜索的半自动推荐

于09-05 12:55 - Phodal Huang - 杂谈
与统计学相比,基于内容来向用户推荐相似的内容,往往更容易获得. 在技术领域,作者通常比大多数读者更专业,他们往往知道什么是读者需要的. 如,你看了一个 React 相关的文章,你可能会需要 Redux 相关的内容. 需要一些前提条件:融合现有系统的数据信息,获取一些用户的信息. 随后,再计算出相关的内容,最后返回给读者.

一半的付费学术论文可搜索到免费版本

于08-08 15:56 - pigsrollaroundinthem -
根据发表在《PeerJ Preprints》预印本网站上的一项研究,一半的付费学术论文可以搜索到合法的免费版本. 研究人员检查了浏览器扩展 Unpaywall 的用户数据,该扩展支持 Google Chrome 和 Mozilla Firefox, 通过查询 5300 多个论文库寻找付费论文的免费版本.

沪江搜索平台化之路

于06-29 13:27 - shendao - 极客互联
本文为原创文章,转载请注明作者及出处. 随着沪江业务的高速发展以及数据爆炸式的增长,当前公司各产线都有关于搜索方面的需求,但是目前的搜索服务系统由于架构与业务上的设计,不能很好的满足各个业务线的期望,主要体现下面三个问题:. 不能支持对语句级别的搜索,大量业务相关的属性根本无法实现. 没有任何搜索相关的指标评价体系.

Google和必应都无法替代的10大深网搜索引擎

于06-26 07:00 - secist - 资讯 安全资讯 深网
当我们想要搜索某些内容时,我们第一个想到的就是打开Google、百度或必应这类的搜索引擎. 但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐藏在深网的内容. 据不完全统计,深网的信息量为表层网络的500倍. 那么,深网主要都包含了些什么内容呢. 其实,深网主要包括的都是些,例如需要某些条件如注册、付费,才能访问的内容,如数据库和某些服务等.

通过Function Score Query优化Elasticsearch搜索结果

于04-06 00:33 - -
在使用 Elasticsearch 进行全文搜索时,搜索结果默认会以文档的相关度进行排序,如果想要改变默认的排序规则,也可以通过 sort指定一个或多个排序字段. 但是使用 sort排序过于绝对,它会直接忽略掉文档本身的相关度(根本不会去计算). 在很多时候这样做的效果并不好,这时候就需要对多个字段进行综合评估,得出一个最终的排序.

基于Elasticsearch实现搜索建议

于01-23 09:14 - - Elasticsearch Elasticsearch 搜索建议
搜索建议是搜索的一个重要组成部分,一个搜索建议的实现通常需要考虑建议词的来源、匹配、排序、聚合、关联的文档数和拼写纠错等,本文介绍一个基于Elasticsearch实现的搜索建议. 电商网站的搜索是最基础最重要的功能之一,搜索框上面的良好体验能为电商带来更高的收益,我们先来看看淘宝、京东、亚马逊网站的搜索建议.

基于Elasticsearch实现搜索推荐

于03-21 09:18 - - Elasticsearch Elasticsearch 搜索 推荐 拼写纠错
在 基于Elasticsearch实现搜索建议一文中我们曾经介绍过如何基于Elasticsearch来实现搜索建议,而本文是在此基础上进一步优化搜索体验,在当搜索无结果或结果过少时提供推荐搜索词给用户. 在根据用户输入和筛选条件进行搜索后,有时返回的是无结果或者结果很少的情况,为了提升用户搜索体验,需要能够给用户推荐一些相关的搜索词,比如用户搜索【迪奥】时没有找到相关的商品,可以推荐搜索【香水】、【眼镜】等关键词.

基于word2vec和Elasticsearch实现个性化搜索

于03-28 07:51 - - Elasticsearch Elasticsearch word2vec 个性化 搜索
在 word2vec学习小记一文中我们曾经学习了word2vec这个工具,它基于神经网络语言模型并在其基础上进行优化,最终能获取词向量和语言模型. 在我们的商品搜索系统里,采用了word2vec的方式来计算用户向量和商品向量,并通过Elasticsearch的function_score评分机制和自定义的脚本插件来实现个性化搜索.

知乎的站内搜索还有救吗? - 知乎

于06-18 07:34 - -
第一次在知乎上得到这么多赞,有点担忧,生怕自己说的不好,误人子弟. 其实,我是一个从事互联网搜索引擎开发5年的码侬,当然也不是造轮子,就是Java方向的利用Solr来进行二次开发. 所以,从事的都是垂直领域特定搜索引擎开发:电子商务领域和招聘行业. 针对知乎搜索,我提出的几点可优化的方案,只是我在从业经历中碰到的变态需求中的一部分.

为什么知乎的搜索功能如此之烂? - 知乎

于06-18 07:33 - -
(潜水员终于有可以专业回答的问题了). 利益相关:搜狗搜索工程师,对搜索技术「略懂」. 搜索是技术方向辐射相当广的一个复杂系统,其技术门槛之高,在众多的互联网产品中能与搜索比肩的是少之又少. 要想玩转这套系统,拥有一批最优秀且懂搜索的工程师和研究员是必不可少的. 我看到之前@熊辰炎同学也提到说想解决的话,知乎可能需要5个熟练工干大半年.

近实时搜索SearcherManager和NRTManager的使用 - 学习笔记 - 博客频道 - CSDN.NET

于06-18 07:32 - -
lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索即在索引发生改变时,通. 过线程跟踪,在相对很短的时间反映给给用户程序的调用. NRTManager通过管理IndexWriter对象,并将IndexWriter的一些方法(增删改)例如. addDocument,deleteDocument等方法暴露给客户调用,它的操作全部在内存里面,所以如果.

美团点评旅游搜索召回策略的演进

于06-16 16:54 - 美团点评技术团队 -
本文内容与6月22日第22期美团点评技术沙龙“美团点评AI实践”主题演讲一致,欢迎大家去 现场和作者交流. 关注“美团点评技术团队”微信公众号,第一时间获取沙龙最新信息,还可以查阅往期沙龙PPT/视频. 美团点评作为最大的生活服务平台,有丰富的品类可供用户选择,因此搜索这个入口对各业务的重要性不言而喻,除了平台搜索外,业务搜索系统的质量和效果对用户体验、商家曝光、平台交易也有着关键作用.

在线AI技术在搜索与推荐场景的应用

于06-02 07:55 - pub@cyzone.cn(http://www.cyzone.cn创业邦) -
  12月6日-7日,由阿里巴巴集团、阿里巴巴技术发展部、阿里云云栖社区联合主办,以“2016双11技术创新”为主题的阿里巴巴技术论坛(Alibaba Technology Forum,ATF)成功在线举办. 在本次分享中,来自阿里巴巴集团的研究员徐盈辉带了题为《在线AI技术在搜索与推荐场景的应用》的精彩演讲,他结合本届双11搜索和推荐场景详细介绍了电商搜索推荐的技术演变、阿里搜索推荐的新技术体系以及未来的发展方向.

从0到1再到100 蘑菇街搜索与推荐架构的探索之路

于05-24 00:00 - - tuicool
【51CTO.com原创稿件】丁小明,花名小宝,蘑菇街搜索技术团队负责人. 2011年底加入蘑菇街,2013年开始负责搜索团队,见证了蘑菇街一路蓬勃发展的历程,也和团队一起从零起步摸爬滚打,打造了蘑菇街的搜索推荐体系,包括自主研发的C++主搜引擎和广告引擎、实时个性化推荐系统、基于开源Solr/ES深度定制的实时搜索平台等.

谷歌公布新竞争对手名单 不再局限于搜索业务

于02-04 00:00 - - tuicool
腾讯科技讯谷歌(微博)母公司Alphabet正不断扩展其业务范畴,其主要业务也不再局限于搜索领域,为此面临的竞争也日益激烈. Alphabet日前公布了最新竞争对手名单,并向投资者发出警告. 在向美国证券交易委员会提交的最新年度报告中,Alphabet列出许多新竞争者名单,包括苹果、Netflix以及Hulu等,以此突出其新业务(比如消费硬件制造)面临的竞争风险.

京东亿级商品搜索核心技术解密

于11-30 02:20 - 小码哥 - 运维经验 京东 搜索核心技术
作者:王春明,现任京东搜索平台部负责人,2011年加入京东搜索团队,期间一直负责京东搜索引擎研发工作,主导了多次搜索架构升级工作保障其满足京东发展需求,擅长搜索引擎、高性能服务开发、分布式系统架构. 招聘: 京东搜索平台部木有有高级/资深搜索引擎研发工程师(C/C++)  、高级/资深算法工程师(C/C++)、高级/资深数据系统工程师(java)等职位,期待您的加入,一起打造弹性搜索平台.

[原]基于Lucene多索引进行索引和搜索

于12-13 13:17 - shirdrn -
Lucene支持创建多个索引目录,同时存储多个索引. 我们可能担心的问题是,在索引的过程中,分散地存储到多个索引目录中,是否在搜索时能够得到全局的相关度计算得分,其实Lucene的ParallelMultiSearcher和MultiSearcher支持全局得分的计算,也就是说,虽然索引分布在多个索引目录中,在搜索的时候还会将全部的索引数据聚合在一起进行查询匹配和得分计算.

谷歌推出新机器学习 API,可识别、搜索视频中物体

于03-08 23:52 - - 综合新闻
据国外媒体 TechCrunch 报道,谷歌今天在旧金山举行的 Cloud Next 大会上宣布推出新的机器学习 API,该 API 支持自动识别视频中的物体,使它们变得可以被搜索. 该名为视频智能(Video Intelligence)的 API 将可以让开发者开发能够自动识别视频中的物体的应用程序.

配置高性能 ElasticSearch 搜索引擎集群的9个小贴士

于01-05 08:09 - -
Loggly服务底层的很多核心功能都使用了ElasticSearch作为搜索引擎. 就像Jon Gifford(译者注:Loggly博客作者之一)在他近期关于“ElasticSearch vs Solr”的文章中所述,日志管理在搜索技术方面产生一些粗暴的需求,坚持下来以后,它必须能够:. 在超大规模数据集上可靠地进行准实时索引 – 在我们的案例中,每秒有超过100,000个日志事件与此同时,在该索引上可靠高效地处理超大量的搜索请求.

微信做搜索:未来是「微信网」还是「万维网」?

于04-26 08:15 - PMCAFF - 投稿 搜索 微信
看到微信要做搜索的新闻其实并不惊讶,毕竟近几个月来微信一直「小动作」不断,3月份微信指数推出之后,广告主在微信平台投放广告时就会问「你们有没有基于微信热词的广告报价啊」,似乎预示着一些零碎的出招结束之后,微信还是会踏入移动搜索领域. 动作很快,4月24日,搜狗发布公布2017年Q1财报的同一天,腾讯的微信事业群内部架构作了一些调整,微信事业群下成立搜索应用部.

[原]自学大数据:Hive基于搜狗搜索的用户日志行为分析

于08-29 14:58 - shifenglov -
”大数据时代“,“大数据/云计算”,“大数据平台”,每天听到太多的大数据相关的词语,好像现在说一句话不跟大数据沾边都不好意思说自己是做IT的. 可能这与整个IT圈子的炒作也有关联,某一个方面来看其实就是一营销术语. 很多朋友就想问,我想做大数据,但是没有这个条件,没有这个数据量,没有那么多业务场景,没有那多集群可以吗.

谷歌面向企业用户推出全新软件搜索工具Springboard

于06-15 02:29 - - 新鲜
据外媒报道,日前,谷歌公司宣布,他们现正在测试一款全新的搜索工具,叫Springboard. 这是一款专门面向企业级用户推出的Google Apps生产力套件. 目前关于这套工具的消息并不多,仅知道它非常适用需要在大型共享文档和文件库里查找的企业. 谷歌称,Springboard可以快速、轻松地帮助用户在Gmail、Calendar、Docs、Drive、Contact等Google Apps中找到其所需的资料.

苹果应用商店在WWDC开幕前迎来巨变:加入搜索广告

于06-09 03:50 - -
这可能是 2008 年 App Store 建立以来的一次最大变动. 新浪手机讯 6 月 9 日凌晨消息在中国的端午节前一天,苹果公司全球市场营销高级副总裁菲尔·席勒(Phil Schiller)电话连线新浪科技,在下周的全球开发者大会开幕前(WWDC)透露了一些应用商店方面的消息. 重点包括:1.更完善的应用审核;2.新的商业模式;3.应用商店搜索中加入广告.