搜狗互联网图片库2.0(SogouP2.0)正式发布

标签: 科研 CBIR 互联网图片库 图像 图像标注 | 发表时间:2011-09-01 16:50 | 作者:丕子 Wolf
出处:http://www.zhizhihu.com

@搜狗实验室:搜狗互联网图片库2.0(SogouP2.0)正式发布: 1000万张图片,200万组图片源,2T数据规模,包括原图文件、URL、所在网页的URL、所在网页中的Surrounding Text文本、同主题系列图片等信息。图片库还包括了一个识图搜索结果人工标注集合,用于训练和评测。http://www.sogou.com/labs/dl/p2.html。现在开始接受在线申请。

记得很久很久之前搜狗实验室就不断的发布数据集供大家申请使用,真是赞。

http://www.sogou.com/labs/images/banner.jpg

这次的图像库的内容:收集了包括人物、动物、建筑、机械、风景、运动等类别,总数高达1000万张图片。对于每张图片,搜狗给出了图片的原图文件、图片的URL、 图片所在网页的URL、图片所在网页中的Surrounding Text文本、同主题系列图片等信息。图片库还包括了一个识图搜索结果人工标注集合,用于训练和评测。

另外注意下搜狗的图片搜索http://pic.sogou.com/已经发布了CBIR的应用,就是用图来找图。搜索框里有了相机icon了。还不错,挺准的。

好东西啊,感谢搜狗。

 

您可能也喜欢:

搜狗竟然也有了基于内容图像检索应用

介绍一家新公司:淘淘搜(搜图购)

Google新图像检索发布视频

再次关注Google图像检索–嵌入广告

一点老东西:神奇的图像处理算法
无觅

相关文章

相关 [搜狗 互联网 图片] 推荐:

搜狗互联网图片库2.0(SogouP2.0)正式发布

- Wolf - 丕子
@搜狗实验室:搜狗互联网图片库2.0(SogouP2.0)正式发布: 1000万张图片,200万组图片源,2T数据规模,包括原图文件、URL、所在网页的URL、所在网页中的Surrounding Text文本、同主题系列图片等信息. 图片库还包括了一个识图搜索结果人工标注集合,用于训练和评测. 记得很久很久之前搜狗实验室就不断的发布数据集供大家申请使用,真是赞.

新一代的互联网图片格式:WebP

- - 标点符
今年的的Google I/O 大会中再次提到了WebP,在此补充下相关的知识. WebP是Google推出的一种同时提供了有损压缩与无损压缩的图形档格式. 目前互联网上传输的数据有65%都是图片,WebP就是出于减少数据量、加速网络传输的目的而开发的. 为了改善JPEG的图片压缩技术,Google在购买On2 Technologies后使用了一种基于 VP8编码的图片压缩器,利用预测编码技术,发展出来了WebP格式,并以BSD授权条款发布.

图片内嵌广告商GumGum融资700万美元,互联网广告业的一朵新奇葩

- tiger - 36氪
图片内嵌广告商GumGum在新一轮的融资中获700万美元投资. 自此,GumGum的融资总额已达1100万美元. GumGum自创建伊始就在互联网广告领域掀起了一阵狂风. 这种图片内嵌广告的做法是在图片的表面添加悬浮文字、横幅标语或Flash等互交形式呈现广告内容. 对于广告商而言,GumGum特有的图片识别与定位技术能帮助他们更有效地定位消费人群.

【移动互联网】Instagram允许用户自动将“Like”的图片发送到FB账户

- - 爱Apps - 专注限时免费、应用评测、移动资讯
Facebook收购Instagram大概也有3个月的时间了,两者之间也做了不少的功能整合. 今天要介绍的是区别之前所有的功能改进,这次是直接允许用户(可关闭该功能)将Instagram里喜欢的照片分享到自己的Facebook账户上. 但是从现在起,在你Facebook的新鲜事里你就会看到那些你原先并不关心的朋友他们在Instagram里拍的或者喜欢的照片都涌到你的页面上来.

移动互联网=移动+互联网?

- 可可 - It Talks-魏武挥的blog
从名词上看,移动互联网似乎就是互联网加上一个移动. 但移动互联网远不是“移动的互联网”那么简单. 它的本质——网络部分,就和互联网大不相同;而它的表现——移动部分,也正因为移动,造就了很多和互联网相当不一样的商业机会. 而更重要也是很多人并没有注意到的是,它可能会改变整整一代人的信息处理习惯. 从网络部分而言,我们都知道,理论上互联网是没有拥有者的.

重新索引互联网

- keso - 爱范儿 · Beats of Bits
重新索引互联网 Facebook 雇佣公关抹黑 Google 的过程已经水落石出. 问题是: Google 那么多产品, Facebook 为何对 Social Circle 这么敏感. Google 号称自己的使命是“索引互联网”. 这件事的难点并非派出多少爬虫,而是对收集来的海量内容做排序:怎样让真正重要的网页,的排到 Google 搜索结果的前面来.

中美互联网差异

- leeking001 - 互联网的那点事
在互联网以指数的速度发展的今天,人们的生活已经离不开网络,那么,这两个打过在互联网方面有什 么差异呢. 我们从下面一系列与互联网相关的参数来比较两个国家,比如:互联网用户数量,互联网普及率,互联网连接的速度,域名数量,受欢迎的网站,网页浏 览器,操作系统等等. 十年前,美国是世界上的互联网头号大国,而现在很明显已经不是,取而代之的是中国.

重新索引互联网

- Ray - 最新文章 - UCD大社区
重新索引互联网 Facebook 雇佣公关抹黑 Google 的过程已经水落石出. 问题是: Google 那么多产品, Facebook 为何对 Social Circle 这么敏感. Google 号称自己的使命是“索引互联网”. 这件事的难点并非派出多少爬虫,而是对收集来的海量内容做排序:怎样让真正重要的网页,的排到 Google 搜索结果的前面来.

互联网七巧板

- Ray ma - 云科技
话说天下事势,合久必分分久必合. 大半年前在一辆宝马车里,一互联网大佬爆料说“百度可能收购新浪,肯定在谈”. 半个月前又开始传,百度高管去硅谷跟Facebook谈合资了. 前天又听到,搜狐可能和另一家互联网巨头合资做微博. 互联网的谣言和互联网的股价一样,起起伏伏. 不过,本文主题不是关于百度或者搜狐或者新浪,而是关于合资.

被选择的互联网

- Jacqueline - 月光博客
  连线杂志的那篇《互联网死了》确实震动业界,而现在,百度的框计算似乎正在验证他的话. 无论是高兴也好,无论是哀嚎也罢,百度的框计算终究给最终用户带来了一些实际的东西. 他改变了人们对于传统搜索的认知. 而百度这类似的行为,正成为互联网的一种趋势. 可以说,商业化的大潮,正在人为的割裂互联网,让他的边界越来越明显.