<< performance - High load average, low CPU usage - why? - Server Fault | 首页 | 解读广州高中学校生源的分组_2015广州中考-广州家长帮社区 >>

RSS | Atom | 电子邮件

搜索

分类 | 标签 | 高级搜索

分类

AppServer (26)

Database (61)

健康 (4)

生活 (25)

UNIX (38)

Mobile (23)

Tech (70)

Web前端 (0)

随笔 (0)

数据库 (0)

Java技术 (0)

收藏夹 (0)

标签

最新文章

陈爱云：打造坚如磐石的搜索架构 - 中生代技术 | 十条
对于一个在线系统而言，性能和稳定性是永远要追求的两个方向，如果是分布式系统，性能不够可以用机器来凑（当然这不是最好的方法，性能的提升不是本文的关注点，所以这里不对提升性能的方法赘述），但是稳定性不能靠机器来堆，并且机器越来越多可能会带来更多的稳定性的问题。做在线系统的同学应该会对墨菲定理感触特别深，...
Fix certificate problem in HTTPS - Real's Java How-to
HTTPS protocol is supported since JDK1.4 (AFAIK), you have nothing special to do. import java.io.InputStreamReader; import java.io.Reader; import java.net.URL; import java.net.URLConnection; public class ConnectHttps { public static void main(String[...
爬取百度网盘用户分享 | Guodong
获取用户订阅: http://yun.baidu.com/pcloud/friend/getfollowlist?query_uk=%s&limit=24&start=%s&bdstoken=e6f1efec456b92778e70c55ba5d81c3d&channel=chunl...

Log me in using Google

Lucene权限实现 - 简单之美 - 企业应用与站点完美解决方案

1、权限过滤

Lucene的基于关键字的评分机制，适用于基于相关度的过滤和排序。它是基于矢量模型，其中给文档分配一个相应的分数，分数越高相关的文档也越多。然而，应用系统有时因为用户级权限仅需返回相关文档的子集。

过滤的权限问题实际上是查询时将一个布尔过滤器作用于文档的普遍问题的子问题。我们将探讨这种过滤的实现方法。

2、查询改写

上述权限过滤明显的实现方法，就是改写搜索查询为要求某字段包含特定的值。

例如，如果有一个“类别（category）”字段（Field），并假设仅显示历史（history）和科学（science）类的文档，然后对给定的用户查询：

<query>

查询可被改写为：

<query>+category:history+category:science

3、查询过滤器

此种假设对于过滤的字段（Field）可能是不适宜或不可行的（也许由于字段（Field）是易变的和频繁的变化将导致索引的大量修改）。另一方法是通过实现Filter接口创建一个过滤器，只需实现一个方法，即bits()方法，该方法返回BitSet，包含命中的所有允许文档ID。

在bits()方法中，可使用TermEnum通过Term筛选（速度慢！），或使用FieldCache检索字段的所有值（速度快，但为内存密集型！）。

4、HitCollector + FieldCache

另一个筛选文档(Documents)的方法是使用HitCollector而非Hits对象。在collect()方法以文档（Document）ID和评分（score）作为参数，可以此来判断文档允许访问与否。

使用HitCollector有一个小缺点，Hits类中遍历搜索结果的有用方法都没有公布，但解决方法容易。

5、范例

比方说，你有一个多用户博客程序，并希望让用户搜索全部（默认）博客文章，或允许用户只搜索他发表的博客。博客应用的Lucene模型将每一博客映射为一Document。

使用查询改写方法，可以轻松地为该查询附加搜索（条件）子句：

<query>+author:<authorid>

这将只返回作者的文档。问题解决了。

现在，扩展该示例。假设在应用中存在3种访问角色：管理员(admin)，编辑(editor)，作家(author)。这些访问角色的权力是递减的，所以一个编辑（editor）对作者的博客有写（write）权限，但对管理员（admin）的博客无此权限。如何才能让用户只搜索他具有写访问权限的博客呢？

该查询改写方法可用来为每一文档（Document）添加一个“角色（role）”字段（Field），并现场填入作者角色（role）。假设用户的角色为编辑（editor），那么改写后查询为：

<query>+（role：editor role：writer）

这种方法是有效的，但不是最理想的，因为每次作者的角色会改变，就需要更新他所写所有博客文档（Documents）。

另一种使用查询改写的方法是获得角色为编辑（editor）和作者（writer）的所有用户列表，然后追加到查询后，如下所示：

<query>+（author:1author:2 author:......)

这方法更好，但庞大的或-查询子句对于布尔过滤可能会妨碍搜索性能。

实现该功能的第三种方法是获取期望的用户列表，如同上前一方法，但不是改写查询，而是使用HitCollector + FieldCache的方法，因此只接受所期望的博客。这种方法具有第二种方法的优势但无性能问题。

阅读全文……

标签 : java, lucene

发表评论

IT瘾于2015年5月8日下午09时54分00秒发布 #

发表评论发送引用通报

Re: Lucene权限实现 - 简单之美 - 企业应用与站点完美解决方案 Anonymous于2026年7月15日下午04时04分28秒评论 #
标题
正文	HTML : b, strong, i, em, blockquote, br, p, pre, a href="", ul, ol, li, sub, sup
OpenID Login	(Not me?)
姓名
电子邮件
网站
记住我	是否
电邮地址不会公开在网页上，您留下的电子邮件仅用于本文有新评论时通知您（以后可以随时拿掉）。

Lucene权限实现 - 简单之美 - 企业应用与站点完美解决方案

Re: Lucene权限实现 - 简单之美 - 企业应用与站点完美解决方案