首页

搜索结果

"tag:"java""

<<上篇 1 2 3 4 5 6 7 8 9 10 11 12 ... 下篇>>

标题及摘要 日期/时间
21
How to make searching faster ImproveSearchingSpeed - Lucene-java Wiki
How to make searching faster Here are some things to try to speed up the seaching speed of your Lucene application. Please seeImproveIndexingSpeedfor how to speed up indexing. Be sure you really need to speed things up.Many of the ideas here are ...
2015-7-24
17:10:00
22
Java NIO通信框架在电信领域的实践
Netty是业界最流行的NIO框架之一,它的健壮性、功能、性能、可定制性和可扩展性在同类框架中都是首屈一指的,它已经得到成百上千的商用项目验证,例如Hadoop的RPC框架avro使用Netty作为底层通信框架;很多其他业界主流的RPC框架,也使用Netty来构建高性能的异步通信能力。 通过对Netty的分析,我们将它的优点总结如下: 1) API使用简单,开发门槛低; 2) 功能强大,预置了多种编解码功能,支持多种主流协议; 3) 定制能力强,可以通过ChannelHandler对通信框架进行灵活地扩展...
2015-7-23
23:17:00
23
Netty 长连接服务
推送服务 还记得一年半前,做的一个项目需要用到 Android 推送服务。和 iOS 不同,Android 生态中没有统一的推送服务。Google 虽然有Google Cloud Messaging,但是连国外都没统一,更别说国内了,直接被墙。 所以之前在 Android 上做推送大部分只能靠轮询。而我们之前在技术调研的时候,搜到了jPush的博客,上面介绍了一些他们的技术特点,他们主要做的其实就是移动网络下的长连接服务。单机 50W-100W 的连接的确是吓我一跳!后来我们也采用了他们的免费方案,因为是...
2015-7-16
1:27:00
24
Java nio的一个严重BUG,导致cpu 100% - 代码之美 - 博客频道 - CSDN.NET
这个BUG会在linux上导致cpu 100%,使得nio server/client不可用,具体的详情可以看这里http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933 。令人失望的是这个BUG直到jdk 6u4才解决,sun的拖沓让人难以相信。这个BUG在server端容易出现,因为server端有频繁地接入断开连接。 使用jdk 6u4之前版本的nio框架都有这个隐患,除非你的框架很好地处理了这个可能的隐患。Grizzly的处理方式比...
2015-6-12
22:47:00
25
netty/MemcacheClient.java at master · netty/netty · GitHub
/* * Copyright 2014 The Netty Project * * The Netty Project licenses this file to you under the ...
2015-6-11
0:21:00
26
使用Mahout基于用户和物品相似度进行协同过滤推荐内容
基于用户User协同过滤 package mahout; import java.io.File; import java.io.IOException; import java.util.List; import org.apache.mahout.cf.taste.common.TasteException; import org.apache.mahout.cf.taste.impl.model.file.FileDataModel; import org.apache.mahout.cf.ta...
2015-6-2
23:31:00
27
云上Java System Profiling与Debugging——蚂蚁金服观察与实践-CSDN.NET
常见问题解决思路 下面介绍一下处理一些常见的问题时,使用ZProflier和ZDebugger系统与使用传统工具在流程和思路上的一些区别。一个新上线的系统如果处理能力达不到我们的预期,或者一个老的系统处理速度突然下降了,抑或频繁抛出异常,这些都促使我们去思考系统存在性能问题该优化了,那我们通常会碰到的性能问题有OOM、CPU占用率高、Load高、频繁GC等。OOM的现象为Java进程直接退出,出错日志里可以看到OutOfMemoryError的异常。如果发现频繁的做MajorGC甚至是FullGC,一般也...
2015-5-27
3:37:00
28
java - Why is TimeZone.getTimeZone(id) synchronized, and why this isn't documented? - Stack Overflow
有JavaEE系统一个服务器实例耗尽32核CPU,看到有大量如下线程堆栈信息: "[ACTIVE] ExecuteThread: '255' for queue: 'weblogic.kernel.Default (self-tuning)'" daemon prio=10 tid=0x00002aaad2ba8000 nid=0x247f waiting for monitor entry [0x00002aaaefa37000] java.lang.Thread.State: B...
2015-5-22
23:13:00
29
Lucene权限实现 - 简单之美 - 企业应用与站点完美解决方案
1、权限过滤 Lucene的基于关键字的评分机制,适用于基于相关度的过滤和排序。它是基于矢量模型,其中给文档分配一个相应的分数,分数越高相关的文档也越多。然而,应用系统有时因为用户级权限仅需返回相关文档的子集。 过滤的权限问题实际上是查询时将一个布尔过滤器作用于文档的普遍问题的子问题。我们将探讨这种过滤的实现方法。 2、查询改写 上述权限过滤明显的实现方法,就是改写搜索查询为要求某字段包含特定的值。 例如,如果有一个“类别(category)”字段(Field),并假设仅显示历史(...
2015-5-8
21:54:00
30
[ lucene扩展 ] spellChecker原理分析 - MR-fox - 博客园
lucene中spellchecker简述 lucene 的扩展包中包含了spellchecker,利用它我们可以方便的实现拼写检查的功能,但是检查的效果(推荐的准确程度)需要开发者进行调整、优化。 lucene实现“拼写检查”的步骤 步骤1:建立spellchecker所需的索引文件 spellchecker也需要借助lucene的索引实现的,只不过其采用了特殊的分词方式和相关度计算方式。 建立spellchecker所需的索引文件可以用文本文件提供内容,一行一个词组,类似于字...
2015-5-4
23:01:00
31
使用Lucene的MoreLikeThisQuery实现相关内容推荐
在分析MoreLikeThisQuery之前,首先介绍一下MoreLikeThis。 在实现搜索应用的时候,时常会遇到"更多相似文章","更多相关问题"之类的需求,也即根据当前文档的文本内容,在索引库中查询相类似的文章。 我们可以使用MoreLikeThis实现此功能: IndexReader reader = IndexReader.open(……); ...
2015-4-19
23:58:00
32
Lucene过滤器 - baobeituping - ITeye技术网站
有的应用有些要求,对于某类型的内容即使满足条件了,但是也不能被搜索出来,lucene中提供了过滤器的功能,通过自定义的过滤器继承Filter,从而实现特定的过滤功能。 Filter是一种过滤行为BitSet是一种位集合队列,这个队列中只有两种取值,TRUE或FALSE,LUCENE以这两种取值代表文档是否被过滤,也就是说,LUCENE返回结果时,会首先遍历BITSET,仅将那些对应值为TRUE的文档返回。 过滤器: package com.filter; import java.io.IOExcepti...
2015-4-15
0:51:00
33
rank/ITEYEBlogSimilarChecker.java at master · ysc/rank · GitHub
我们如何应对这样的商业广告呢?基本思路如下: 1、当管理员发现一篇博文为黑博文时,人工确认。 2、将人工确认的黑博文保存到黑博文数据库。 3、当有新博文发表时,和黑博文数据库进行相似度计算,如果相似度超过预设的阈值,则拒绝发表博文。 下面是黑博文判断程序的详细判断过程,先上最终结果: 判定相似性的方式一:简单共有词 阈值=Math.min(339, 340)*0.8=271.2 待发表博文和黑博文共有的词数:339 因为待发表博文和黑博文共有的词数339大于阈值:271.2 所以判断为相似,拒绝发表! ...
2015-4-10
21:44:00
34
java多线程实现任务超时监听 - huangying2124的专栏 - 博客频道 - CSDN.NET
使用Future的特性(推荐) 利用Future.get(longtimeout,TimeUnitunit)方法。 1、新建TaskThread类,实现Callable接口,实现call()方法。 2、线程池调用submit()方法,得到Future对象。 3、调用Future对象的get(long timeout,TimeUnitunit)方法,该方法的特点:阻塞式线程调用,同时指定了超时时间timeout,get方法执行超时会抛出timeout异常,该异常需要捕获。 示例代码: [java]vi...
2015-4-7
21:55:00
35
Word Break II -- LeetCode - Code Ganker - 博客频道 - CSDN.NET
原题链接:http://oj.leetcode.com/problems/word-break-ii/ 这道题目要求跟Word Break比较类似,不过返回的结果不仅要知道能不能break,如果可以还要返回所有合法结果。一般来说这种要求会让动态规划的效果减弱很多,因为我们要在过程中记录下所有的合法结果,中间的操作会使得算法的复杂度不再是动态规划的两层循环,因为每次迭代中还需要不是constant的操作,最终复杂度会主要取决于结果的数量,而且还会占用大量的空间,因为不仅要保存最终结果,包括中间的合法结果也要...
2015-4-1
18:24:00
36
lucene实现自定义的评分 - 学习笔记 - 博客频道 - CSDN.NET
Lucene按一个或多个字段进行排序是基本的功能,但可能需要更高级的自定义排序功能,并通过调整得分。Lucene自定义排序调整打分方法,有下面几种: 1、在索引阶段设置Document Boost和Field Boost,提升文档或字段的排名,例如: Document doc1 = new Document(); Field f1 = new Field("contents", "common hello hello", Field.Store.NO, Field...
2015-3-11
13:34:00
37
Lucene索引阶段设置Document Boost和Field Boost 实现合理打分 - 漫步天涯-IT - 博客频道 - CSDN.NET
在索引阶段设置Document Boost和Field Boost,存储在(.nrm)文件中。 如果希望某些文档和某些域比其他的域更重要,如果此文档和此域包含所要查询的词则应该得分较高,则可以在索引阶段设定文档的boost和域的boost值。 这些值是在索引阶段就写入索引文件的,存储在标准化因子(.nrm)文件中,一旦设定,除非删除此文档,否则无法改变。 如果不进行设定,则Document Boost和Field Boost默认为1。 Document Boost及FieldBoost的设定方式如下: ...
2015-3-10
15:48:00
38
lucene FieldCache 实现分组统计 - 记录我的点点滴滴 - 51CTO技术博客
所谓分组统计,就是类似sql里group by的功能。在solr里,这个功能称为faceting。lucene本身不支持分组统计,不过可以使用fieldCache来实现分组统计功能,而且也有很好的性能。solr根据不同的情况,还提供了其他方法(filterCache和UnInvertedField)来实现,这个以后再说。 fieldCache是lucene用来排序的缓存。对要用来排序的字段,lucene会从索引中将每篇文档该字段的值都读出来,放到一个大小为maxDoc的数组中。maxDoc是lucene内...
2015-3-10
15:15:00
39
Lucene 搜索性能优化
搜索优化: 1、设置boost 有些时候在搜索时某个字段的权重需要大一些,例如你可能认为标题中出现关键词的文章比正文中出现关键词的文章更有价值,你可以把标题的boost设置的更大,那么搜索结果会优先显示标题中出现关键词的文章(没有使用排序的前题下)。使用方法: Field. setBoost(float boost);默认值是1.0,也就是说要增加权重的需要设置得比1大。 2、将不需要使用范围查询的数字字段设置precisionstep为Intger.max,这样数字写入倒排仅存一个term,能极大降低...
2015-3-6
16:17:00
40
Lucene-与索引库的交互 - 球球之家 - 博客频道 - CSDN.NET
内存索引库:数据是临时的、访问速度比文件索引库要快、索引库中的数据不能存放太多、内存索引库和文件索引库能结合在一起 两个或者两个以上的索引库的合并: 如果是内存索引库,直接调用构造函数进行合并就可以了 内存索引库中。也可以调用addIndexesNoOptimize进行合并 如果是文件索引库,调用addIndexesNoOptimize进行合并,该方法可以接受多个索引库 /** *文件索引库和内存索引库的结合 */ @Test publicvoidtest...
2015-3-6
16:07:00

<<上篇 1 2 3 4 5 6 7 8 9 10 11 12 ... 下篇>>