知识库检索匹配的服务化实践

- - 有赞技术团队

　　知识库是企业经营过程中的面向客户和内部员工的知识沉淀文档库，里面包含各类教程、问答、案例等，知识库的检索匹配是自然语言处理(NLP)中一个重要的基础问题，本质是进行文本语义的相似度计算，也就是语义匹配，我们很多领域的任务都可以抽象为文本匹配检索任务，例如检索引擎、智能客服、知识检索、信息推荐等领域.

一个AI小白如何理解近似匹配检索

- -

在AI领域的相似度匹配中通常会接触很多新名词：. ANN、KNN、HNSW、SQ8、Faiss、L2、L1、inner product...你可能会查了很多官方解释，但是：. --> 网上每个名词都告诉了是什么，我知道了他是什么，对，没错，我还是不知道它是什么. --> 根据用户手册，我Step by step成功完成了所有的实验，我依然不知道我在实验什么.

相似匹配　　在我们使用网页搜索时，会注意到每一个结果都包含一个 “相似页面” 链接，单击该链接，就会发布另一个搜索请求，查找出与起初结果类似的文档. Solr 使用 MoreLikeThisComponent（MLT）和 MoreLikeThisHandler 实现了一样的功能. 如上所述，MLT 是与标准 SolrRequestHandler 集成在一起的；MoreLikeThisHandler 与 MLT 结合在一起，并添加了一些其他选项，但它要求发布一个单一的请求.

execution匹配符解析

- - CSDN博客推荐文章

Spring AOP 用户可能会经常使用 execution切入点指示符. 除了返回类型模式（上面代码片断中的ret-type-pattern），名字模式和参数模式以外，所有的部分都是可选的. 返回类型模式决定了方法的返回类型必须依次匹配一个连接点. 你会使用的最频繁的返回类型模式是*，它代表了匹配任意的返回类型.

软件测试知识库管理方案——大结局

- Ben - Taobao QA Team

淘宝测试团队的知识沉淀发展到今天，经历了无数风风雨雨，到现在各个产品线的沉淀方式，仍然没有完全统一，处于群雄割据的局面. 我们先简单看看淘测试的知识沉淀的发展历史. 在混沌初开的年代，大家基本都是用MS Word来编写沉淀文档，然后放在一个共享目录下面. 后来wiki概念兴起，产生了很多这一类型的web应用程序，MS share point（SP）是被普遍使用的.

五款最佳个人知识库管理工具

- Yolanda - FeedzShare

来自: 帕兰映像 - FeedzShare . 发布时间:2011年06月07日, 已有 2 人推荐. web2.0给我们带来了大量的信息，但并非每个人都能够很好的整理并消化吸收这些信息. 构建个人知识库，能够让我们更好的应对网络上的各类资讯. 本文Gevin向大家推荐5款个人知识库管理工具，这5款工具各有特色，也是目前Gevin用过的最好用的工具.

盗版电子书网站变成庞大的知识库

- - 奇客Solidot–传递最新科技情报

镜像盗版电子书网站 Z-Library 的 Pirate Library Mirror 注意到，在一年多时间里 Z-Library 的电子书容量增加了逾三倍之多. Z-Library 鼓励用户上传新书，通过限制免费账号每天下载的数量而收费. Z-Library 在过去一年多时间内增加了 380 万册的新书，其中可能有重复的，但绝大部分都是新书或旧书的高质量扫描本.

字符串匹配那些事（一）

- jiessie - 搜索技术博客－淘宝

本系列文章主要介绍几种常用的字符串比较算法，包括但不限于蛮力匹配算法，KMP算法，BM算法，Horspool算法，Sunday算法，fastsearch算法，KR算法等等. 本文主要介绍KMP算法和BM算法，它们分别是前缀匹配和后缀匹配的经典算法. 所谓前缀匹配是指：模式串和母串的比较从左到右，模式串的移动也是从左到右；所谓后缀匹配是指：模式串和母串的的比较从右到左，模式串的移动从左到右.

PHP正则之递归匹配

- KnightE - 风雪之隅

作者: Laruence(. 本文地址: http://www.laruence.com/2011/09/30/2179.html. 我记得早前有同事问, 正则是否能处理括号配对的正则匹配. 比如, 对于如下的待匹配的字符串:. 在以前, 这种情况, 正则无法处理, 最多只能处理固定层数的递归, 而无法处理无线递归的情况… 而在perl 5.6以后, 引入了一个新的特性: Recursive patterns, 使得这种需求可以被正确的处理..

知识库检索匹配的服务化实践

一、背景

二、架构流程

2.1、整体架构

2.2、请求链路

三、算法模型

3.1、DSL改写

3.２、文本召回

3.３、向量召回

3.4、精排序

3.5、排序优化

四、工程实现

4.1、离线训练（DP平台）

4.2、在线推理（Sunfish平台）

4.3、Milvus向量检索

4.4、AI模型接口服务

五、服务场景

5.1、官网帮助中心

5.2、相似商品推荐

六、总结

七、招聘号外

相关 [知识库检索匹配] 推荐：