超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强

标签: 谷歌搜索 阿里 开源 | 发表时间:2025-05-09 07:14 | 作者:
出处:https://www.ithome.com/

IT之家 5 月 9 日消息,阿里巴巴昨日在 Github 等平台开源了 ZeroSearch 大模型搜索引擎。这是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架。

ZeroSearch 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容。同时,还可以动态控制生成内容的质量,这是传统搜索引擎所不具备的特殊功能。

研究人员在 NQ、TriviaQA、PopQA、HotpotQA 等 7 大问答数据集上进行了综合评测。结果显示,一个 70 亿参数的监督微调模型使用 ZeroSearch 后,其搜索能力达到了 33.06;140 亿参数的模型则达到了 33.97,超过了谷歌搜索的 32.47。

研究人员通过 SerpAPI 使用谷歌搜索进行约 64,000 次搜索查询的训练,成本约为 586.70 美元(IT之家注:现汇率约合 4238 元人民币);而在四个 A100GPU 上使用 140 亿参数的大模型进行模拟时,成本仅为70.80 美元(现汇率约合 511 元人民币),意味着成本降低了 87.93% 以上。

参考链接:

  • 论文地址:https://arxiv.org/abs/2505.04588

  • 开源地址:https://github.com/Alibaba-nlp/ZeroSearch

  • 抱抱脸:https://huggingface.co/collections/sunhaonlp/zerosearch-681b4ce012b9b6899832f4d0

相关 [谷歌搜索 阿里 开源] 推荐:

超谷歌搜索:阿里开源创新大模型搜索引擎 ZeroSearch,成本直降 80% 且能力更强

- - IT之家
IT之家 5 月 9 日消息,阿里巴巴昨日在 Github 等平台开源了 ZeroSearch 大模型搜索引擎. 这是一种无需与真实搜索引擎交互即可激励大模型搜索能力的强化学习框架. ZeroSearch 主要利用了大模型在大规模预训练过程中积累的丰富知识,将其转化为一个检索模块,能够根据搜索查询生成相关内容.

谷歌搜索将有大变化

- - 创业邦
  从下周二开始,谷歌将修改智能手机端搜索算法,这种变化将会影响上千万人购物、觅食和寻找信息的去向.   修改后的算法将向谷歌认为是“移动友好”的网站倾斜. 不符合谷歌“移动友好”标准的网站在搜索结果网页上的排名将会下降,而符合其标准的网站则有更大可能会排在靠前的位置,而靠前的排名意味着访问量和金钱.

谷歌指控微软必应抄袭谷歌搜索

- kezonet - 月光博客
  据Google官方博客报道,谷歌通过一系列实验证明,微软通过IE浏览器、必应工具栏等手段监测用户的谷歌搜索行为,并借用这些信息改进微软必应(Bing)搜索结果,谷歌因而指控微软必应搜索引擎抄袭谷歌的网络搜索结果.   谷歌研究员阿密特·辛格哈尔(Amit Singhal)在这篇博文中指出,谷歌注意到,在用户输入拼写错误的情况下,必应搜索结果与谷歌搜索结果显示的网站惊人地相似.

正常访问谷歌搜索、Gmail和谷歌阅读器

- noairhere - 月光微博客
  Gmail和Google Reader是很多人日常工作的必备工具,但现在却遭到了定时的封锁,这里介绍一种新的解决方法,非常简单,可以在不使用任何第三方工具的情况下,正常而快速的访问Google搜索服务、Gmail、Google Reader等Google服务,并且极大提高Google服务的访问速度和访问稳定性,让Google和Gmail运行如飞.

谷歌搜索成功秘诀:以简洁赢得用户

- - cnBetaFull
边界设计平台Fastcodesign刊登评论文章称,用户搜索也许暗示消费者想要更多的选择. 但是谷歌并不这样认为,而它特立独行地坚持简洁的风格反而让它脱颖而出. 谷歌在推出搜索引擎时,它并不是第一个为消费者提供搜索功能的网络公司. 但是谷歌迅速将竞争对手甩在了身后,获得了主流市场的接受. 正如许多观察员在前几年 所说的那样,谷歌主页的简洁之美为它目前取得的成功起到了重要的作用.

最好的程序员凡事先上谷歌搜索

- - 外刊IT评论
我知道的最优秀的程序员是我的 Framebase.io 网络公司的技术合伙人Tyler Menezes. 我不知道他是如何练就这一身技术本领的,但他让我在对如何使用谷歌的问题上产生了颠覆性的认识. 你应该听说过这句有名的话:. “能在书本上简单查到的东西永远不要放进你的记忆里. 所以,除非已经在心里记住了某种排序算法,为什么你非要花2小时试图自己去实现它.

谷歌搜索推出深度文章功能

- - 月光博客
  谷歌 宣布推出搜索引擎的一项新功能,高亮显示与搜索关键词相关的深度分析文章. 谷歌表示,搜索结果“基于高质量深度内容的多种信号,并按照算法来排列”,而这些“高质量内容将有助于更好地了解或探索某一主题”.   谷歌表示,尽管许多用户只想要简单明了的答案,但该公司的数据显示,约10%用户的搜索是为了查找深度分析文章.

采用人工智能算法,谷歌搜索变聪明了

- - 雷锋网
在今天之前,PageRank算法是谷歌准确而快速呈现你心中所想的秘笈. 在今天之后,可能就是对谷歌越来越重要的以人工智能为核心的搜索技术RankBrain. 众所周知,PageRank算法是由谷歌创始人Larry Page和Sergey Brin于1998年在斯坦福大学发明的,也是谷歌发家致富、独步天下的重要技术.

阿里巴巴Dubbo分布式服务框架已开源

- tangfl - ITeye论坛最新精华讨论帖
Serving services with invocations everyday, Dubbo becomes the key part of Alibaba's SOA solution and has been deployed to the whole alibaba.com family:.

阿里开源Mysql分布式中间件:Cobar

- - 数据库 - ITeye博客
Cobar是阿里巴巴研发的关系型数据的分布式处理系统(Amoeba的升级版,该产品成功替代了原先基于Oracle的数据存储方案,目前已经接管了3000+个MySQL数据库的schema,平均每天处理近50亿次的SQL执行请求. )(github上面的是源码,大家下来需要自己用maven2编译后运行、者放Eclipse里面运行,一开始我用maven3没有执行成功.