Google和必应都无法替代的10大深网搜索引擎

标签: 资讯 安全资讯 深网 | 发表时间:2017-06-26 15:00 | 作者:secist
出处:http://www.freebuf.com

Deepweb_GBHackers.jpg

当我们想要搜索某些内容时,我们第一个想到的就是打开Google、百度或必应这类的搜索引擎。但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐藏在深网的内容。据不完全统计,深网的信息量为表层网络的500倍。那么,深网主要都包含了些什么内容呢?其实,深网主要包括的都是些,例如需要某些条件如注册、付费,才能访问的内容,如数据库和某些服务等。而常规搜索引擎通常只会对静态网页进行抓取,而对于这些存储在数据库中的内容,对其而言几乎是不可见的。其次,当我们使用Google时,Google还可能对我们的活动轨迹进行跟踪。这对于要求匿名的用户而言,也是不可接受的。

为什么Google搜索不到深网的内容?

这是因为所有的Deb网站( .onion)都是没有索引的,而正常的搜索引擎通常都是通过目标网页索引来获取内容的。因此对于没有索引的搜索结果则不会被Google所收录。此外,在搜索过程中还会和服务器建立连接,这样对我们的隐私和安全也带来了一定的隐患。

“据研究人员介绍,只有4%的互联网对公众可见,剩下的96%的网站和数据则隐藏在Deep web。”

此外,深网中还包含了许多非法内容,例如毒品,武器交易,高度成熟的黑客工具,色情,军事机密等。

robots文件

robots.txt是搜索引擎中访问网站的时候要查看的第一个文件。robots.txt文件会告诉蜘蛛程序,在服务器上什么文件是可以被查看/禁止查看的。如果某些页面被设为不可查看,那么搜索引擎也是无法正常获取到的。

说了这么多,那么有没有既可以保证高度匿名性,又可以获取到深网内容的搜索引擎呢?下面,我将为大家推荐十款比Google,必应更加“强大”搜索引擎:

1.  pipl

pipl.png

Pipl是一款为搜索网络上的人物信息而生的搜索引擎。不同于传统意义上的搜索引擎,Pipl是专为检索“深网”上的信息而设计的。Pipl的爬虫能够与可搜索的数据库打交道,从中提取个人信息、联系方式、成员名录、科学出版物、法院记录以及其它很多“深网”内容。

Pipl目前提供五种方式搜索方式搜索特定人物:名字、Email地址、用户名、电话号码以及还处于BETA版的商业搜索。

Pipl所关注的不仅仅是找到更多的结果,它还通过高级语言分析和排名算法将与你搜索关键词最相关最匹配的结果以简单的单页形式展示给你。

2.  My Life

Mylife.png

MyLife是一个全面的成年人资料数据库,可以根据姓名、年龄、邮编等信息来查询你想要找的人。

MyLife的服务可以通过整合Twitter、Facebook、LinkedIn、Friendster和Flickr等社交网站的数据,帮助用户在互联网上找人。MyLife用户是免费注册,但如果要使用单身搜索、查看谁在搜索自己等高级功能,用户就需要付费。

MYLIFE网站还推出了一个全新的个人关系管理系统(PRM),是一个基于浏览器的服务,让用户在同一个内容流里就能看到Facebook、Twitter和LinkedIn的订阅源并进行答复、“赞”、转推等操作。

3.  Yippy

Yippy.png

Yippy是一个将多个搜索引擎信息结合在一起,然后得出统计结果的集成化搜索引擎。如果你想检索暗网的信息,Yippy便是一个不错的工具。暗网因其存储在专用网络而被屏蔽难以发现,而Yippy提供的搜索结果将帮助你发现不被传统搜索引擎检索到的隐藏网站。

4.  Surfwax

surfwax.png

SurfWax是一个元搜索引擎,能限定最多返回结果条数和排序方法,检索速度一般。该搜索引擎有一个显著特点,即点击每条结果左边的“网址按钮”图标,可浏览该结果包括的任何页面,并显示搜索语句在文件中的位置。可以把搜索结果和文件存储起来以备后用。此外,焦点字(FocusWords)功能提供搜索词在各种不同含义下的同义词/近义词、上位词、下位词的列表,辅助选择词语检索。

5.  Way Back Machine

Wayback.png

通过Wayback Machine可以搜索某一特定网站过去(从1996年到现在)的样子。实现对Web过去的存档要求一百太字节的存储空间,并包含一百亿个网页!网页存档起初是由Alexa项目的负责人收集的。你可以在你的电脑上安装一个提供网站信息和排名的工具栏。

在Wayback Machine网站上,你可以搜索和链接你喜欢的网站,看它们过去的样子,你会发现它们像时间“快照”一样保存着。例如,你可以看到whatis.com网站在1996年的样子,也可以看见它在1997年及以后的样子。

6.  Google Scholar

Google.png

GoogleScholar学术搜索专门在期刊论文、理论摘要及其他学术著作文献中进行搜索,内容从医学、物理学到经济学、计算机科学等等,横跨多个学术领域以及大量书籍和整个网络中的学术性的文章。它虽然不支持中文,但可以用拼音搜索国内学者在国际刊物上发表的文章。这个搜索引擎搜索国外的资料非常方便,输入一个学者的名字,就可以搜索出其全部在网上的文章,并且可以知道在哪个数据库,以及该篇文章被多少篇其它文章所引用,以及所引用文章的目录等等。同时该学者所著的书也都有显示,并告知该书被哪些图书馆所收藏,或其它可能获得的商业途径。

GoogleScholar的搜索结果可以过滤掉普通搜索结果中的大量垃圾信息,排列出文章的不同版本以及被其他文章所引用的次数,还可以通过引用链接方便的找到与搜索结果关联的其它相关学术资料,对于学生、学者以及其他需要经常查阅学术文章的人来说是非常实用的。

7.  DuckDuckgo

duck-duck-go.jpg

害怕信息被泄露,想要匿名访问互联网?DuckDuckGo将是你的首选!DuckDuckGo不会保存你的任何浏览信息、社交文件、邮件等,这也是跟Google最大的区别。DuckDuckGo的用户非常喜欢像「zero-click」这样的功能,快速无线下拉设计真的是懒人福利。更棒的是,DuckDuckGo并沒有像Google那么多广告,以及经常弹出广告等问题。DuckDuckGo甚至还配备了自己的Tor出口中继,帮助Tor用户提高搜索性能。

8.  Fazzle

fazzle.png

Fazzle是一个支持英文发文和荷兰文的元搜索引擎。它即可进行一般的网址搜索,又有一个主题目录可提供专题的资源搜索。其前身为SearchOnline著名元搜索引擎。

9.  not Evil

not-evil.png

不像其他的Tor搜索引擎,not Evil是一个不以营利为目的的搜索引擎。它是专门设计用于搜索暗网内容的搜索引擎,堪称暗网中的谷歌。此外,它的安全性体验度也做的非常的到位。既没有多余的广告推送,也不会对用户的搜索行为进行跟踪。再加上其不断更新的搜索算法,用户很容易就能通过它找到想要的内容或信息。值得一提的是,在此之前该项目被人们广泛的称为TorSearch。

10.  Start Page

startpage.png

StartPage是由Ixquick推出的一个托管在美国和荷兰的搜索引擎服务,通过免费匿名代理提供谷歌搜索和图片搜索结果,号称是世界上最安全的保密型搜索引擎。该搜索引擎非常注重把对用户隐私的保护,它不会收集和分享任何用户的资料。

在Startpage,Ixquick的隐私与谷歌的搜索结果紧密相连。你可以放心使用这些来自世界上最受欢迎的搜索引擎搜索的结果,并受到Ixquick的隐私保护,这是世界上最大的私有搜索引擎。并且还受到了第三方权威机构——欧洲的联盟隐私倡议机构EuroPriSe的认证。 2008年7月14日,Ixquick被授予第一个欧洲隐私认证。

*参考来源: gbhackers,FB小编 secist 编译,转载请注明来自FreeBuf(FreeBuf.COM)

相关 [google 必应 深网] 推荐:

Google和必应都无法替代的10大深网搜索引擎

- - FreeBuf.COM | 关注黑客与极客
当我们想要搜索某些内容时,我们第一个想到的就是打开Google、百度或必应这类的搜索引擎. 但针对有些内容,却是这些常规搜索引擎无法获取到的,那就是隐藏在深网的内容. 据不完全统计,深网的信息量为表层网络的500倍. 那么,深网主要都包含了些什么内容呢. 其实,深网主要包括的都是些,例如需要某些条件如注册、付费,才能访问的内容,如数据库和某些服务等.

谷奥: Google = Google+

- 吞佛 - 谷奥聚合——谷奥主站+谷安 aggregator
在上周举办的Google Zeitgeist 2011大会上,John Battelle问Larry Page:在Google大部分的历史里,人们会想到搜索,那么Google品牌=搜索. 但在随后Google的发展史里,Google品牌会等于什么. Larry Page并未直面回答这个问题,至少没有从市场角度来回答.

Google宣布Google CDN

- way - Solidot
Google宣布了最新的帮助加快互联网速度的工具Page Speed Service,加快静态网页的载入速度,不支持动态网页. 在开发者注册该服务之后,可将网站的DNS入口记录指向Google,然后Page Speed Service从服务器上抓取内容,采用最佳的Web性能方案重写网页,通过Google在全球部署的服务器将内容展示给终端用户,加快网页载入速度.

Google将关闭Google Labs

- yifan - Solidot
Google宣布将关闭Google实验室,搜索巨人表示此举将帮助他们将精力集中在优先的产品项目上. Google称,关闭Google实验室意味着大部分试验项目将会被放弃,但不是每一个项目都会被抛弃. Google会将部分试验项目整合到其它产品中. Android应用程序如Google Goggles和Google Listen,则将会继续留在Android Market中.

當Google Docs遇上Google Finances

- 沒有暱稱 - 海芋小站
Google Finances是由Google所推出的一個財經服務,裡面記錄了全球的財經資訊,而如果我們要在Google文件中插入這些財經資訊,如某支股票的收盤價,開盤價等資訊,那要怎麼辦到呢. Google其實提供了非常簡單的函式,怎麼用就往下看啦. 其實在Google文件的試算表中,以插入股票為例,只要輸入「=GoogleFinance("股票代碼.tw"; "參數")」就可以了,以鴻海為例,代碼就是「2317」,記得一定要加變成「2317.tw」才可以.

Google Reader将和Google+整合

- Richard - 月光博客
  Google Reader官方博客宣布,即将对Google Reader进行重大改版,并和Google+进行整合,新版本将重新设计,包括friending、following等功能将会被删除. 之前Google Reader的社交功能是和Buzz整合,随着Buzz的关闭,Google Reader的改版有可能会和以前的Buzz一样,将关注和被关注整合到Google+中,然后用户在Google Reader的分享自动同步到Google+.

谈谈 Google+

- Michael - 云风的 BLOG
Shared by 令狐虫. Google+ 这这些点上给出了技术上的方案,却没有给使用者明确的使用引导. 对于 Geek 来说,这些功能是有趣的. 但是,它极端依赖人的正确使用,你还无法管得了别人的错误使用,在良好的信息过滤这一点上,作为信息接收方来说,几乎没有好的方法. Google 正式发布 Google+ 的时候,我在山上.

Google+ 调查

- mornlee - 爱范儿 · Beats of Bits
Ren Media 的 Thomas Morffew 在 Google+ 上进行了一次调查,在 24 小时内收到 590 份回复,虽然调查的样本还不够多,但其结果与想象的差别不大. 从下面这几副图里,可以了解一下 Google+ 的一些相关数据. 使用桌面浏览器的人比例是 89%. 这并不奇怪,目前 Google+ 的体验上,桌面浏览器在功能和操作上都超过移动版和应用客户端,应用客户端很出色,但一大缺憾是无法转发信息,当然也无法进行视频聊天.

Google Plus新政

- iVane - 槽边往事
本周早些时候,我的Google Plus帐号被停权了. 页面提示上写着:Your account was suspended.理由是我违反了Google Plus的《社区准则》(相关链接),却又没有明确指出我违反了哪一条. 于是,我只好向提交了申诉表单(相关链接). 这一次,Google Plus明确指出,问题出在我的ID“和菜头”,这一ID的命名法违背了《社区准则》的第八条:.

谈谈 Google+

- Sopp - 云风的 BLOG
Google 正式发布 Google+ 的时候,我在山上. 回到文明社会后,还好赶上了第一批用户的末班车,试用了一下. 现在,重新开放,有更多的人尝试用 Google+. 在数天之内,我就圈了接近 100 个朋友,被圈了近 1000 次. 对于类似产品,我觉得算相当不错的成绩了. 要知道,我 twitter 上只 fo 了不到 30 个人,douban 好友不到 50 个.