简易垂直搜索引擎的核心算法总结

- - CSDN博客架构设计推荐文章

倒排索引源于实际应用中需要根据属性值（字段）来查找记录（所在的文件位置）. 这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址. 目前主流的索引技术有三种：倒排索引、后缀数组以及签名. 后缀数组虽然快，但是维护困难，代价高昂，不适合作为搜索引擎的索引. 而签名的速度和性能都不如倒排索引.

uSniff:BT种子搜索引擎

- leqoqo - 软件志

一、uSniff相关信息： 1、官方主页：http://www.usniff.com/ 2、简介：uSniff是一个BT种子搜索引擎，简单、易用、实时是其最大的优点，其搜索引擎数据库包含了17个知名种子站点的种子信息，目的是想发展成为世界上最大的BT种子搜索引擎，而且对于每个种子，该搜索引擎都会进行安全认证，以保证用户的正常使用.

资源搜索引擎

- - 不死鸟 - 分享为王官网

易搜阿里百度夸克网盘搜索. tg中文搜索电报资源搜索引擎. 千帆搜索电报资源搜索引擎. 影视搜影视聚合搜索引擎. 辅助狗无捆绑软件搜索引擎. 查报告可查询各行业的分析报告. 学霸盘课程资料百度网盘. 库问搜索 PDF文献资料搜索.

Google上周宣布将支持声音和图片进行搜索，但一家创业公司在图像搜索方面走在了Google前面. 源自伦敦帝国学院研究项目的创业公司Cortexica，开发出视觉搜索工具，通过手机拍摄产品照片，它会自动呈现价格信息. Cortexica已经发布了一个用于比较酒价格的工具WINEfindr. Cortexica的视觉搜索技术是受到了人眼视觉系统的启发，它能识别出一个目标的关键特征，不受方位、大小、光线亮暗的影响.

比较好的学术搜索引擎

- hfut_chen - C++博客-首页原创精华区

摘要: 1、http://scholar.google.com/. Google学术搜索滤掉了普通搜索结果中大量的垃圾信息，排列出文章的不同版本以及被其它文章的引用次数. 略显不足的是，它搜索出来的结果没有按照权威度（譬如影响因子、引用次数）依次排列，在中国搜索出来的，前几页可能大部分为中文的一些期刊的文章.

Blekko 对搜索引擎的新探索

- thinkingit - 知乎的博客

Blekko 这款搜索产品做的如何. 从目前我的使用过程来看，Blekko还是很让人激动的. 在谈Blekko之前就要先问：为何在搜索这个看似已经垄断的行业还会有人想去分一杯羹，这些小团队能与Google或微软这样的巨头抗衡吗. 比如之前的Powerset，后来的Cuil，和现在的Blekko. 在Google之前Yahoo是靠人工收录网页，Google的算法和蜘蛛革了搜索的命，一直垄断搜索业十余年，而现在随着WEB 2.0的发展，让人又看到了搜索业革命的火种，可以说Blekko就是这样的一个产品.

简易垂直搜索引擎的核心算法总结

1. 倒排索引

2. 向量空间模型

3. 网络爬虫（深度优先策略）

4. 中文内容提取

5. 指纹去重

相关 [简易垂直搜索引擎] 推荐：