原本以为现在头部 AI 模型的幻觉已经很低了,而且觉得我挺能辨别 AI 幻觉的,结果今天还是被摆了一道

标签: 头部 ai 模型 | 发表时间:2025-04-15 20:49 | 作者:heliumjt
出处:https://www.v2ex.com/

用 Django ORM 写了个函数查询 Postgres 数据库,发现 ORM 的速度比原生 SQL 语句慢了好几倍,于是去问 Gemini 2.5 。

Gemini 让我打印出生成的 SQL 语句看看是怎么一回事,我一看,ORM 查询条件是大小写不敏感的,使用了 icontains算符;但是 Django 在把查询条件翻译成 SQL 语句的时候没用上 Postgres 特有的不区分大小写的 ILIKE算符,而是将式子两边都转换成了大写,用了 UPPER() LIKE UPPER()。这下知道原因了,这种情况下字段的索引根本没用上。

那就改嘛。然后 Gemini 信誓旦旦地告诉我,这是 非常不同寻常的,Django ORM 肯定能自动将 icontains 翻译成 ILIKE。我觉得也很有道理,Django 这么老牌的框架,Postgres 也不是什么冷门数据库,怎么会处理不好适配呢,肯定是我自己的问题。

然后我就照着 Gemini 给的方案一步一步调试,是不是你的 Django 配置有问题?是不是 Django / psycopg / Postgres 版本哪里冲突了?做个最小化测试试试?每一步都没有问题,我跟 Gemini 都感到非常困惑。

两个小时之后我才意识到有哪里不太对劲,于是新开了一个对话让他联网搜一下有没有人遇到过类似情况。然后他哐哐搜出来好几篇网页,网页里的人类全都明确地指出 Django 会把 icontains转换成 UPPER()。但是就算是在包含了这些信息的新对话里,Gemini 还是嘴硬地声称:

标准行为是 ILIKE: 多个来源(包括 Django 官方讨论、Stack Overflow 、博客文章)都明确指出,对于 PostgreSQL ,Django 的 icontains 应该被翻译成 ILIKE 。这是 Django 利用 PostgreSQL 对大小写不敏感的 LIKE 查询的原生支持的方式。

最后我只能去翻了翻 Django 的源码,发现源码里确确实实是将 icontains翻译成了 UPPER() LIKE UPPER(),没有用上 ILIKE,原来整个大前提都是 AI 的幻觉。又问了问几个头部模型,每一个都热心地指点我应该如何排查问题,要怎样怎样解决,没有一个指出来这确实就是 Django 应有的行为。反思了一下,我现在写代码似乎有点太过于依赖 AI 了……

相关 [头部 ai 模型] 推荐:

原本以为现在头部 AI 模型的幻觉已经很低了,而且觉得我挺能辨别 AI 幻觉的,结果今天还是被摆了一道

- - V2EX - 技术
用 Django ORM 写了个函数查询 Postgres 数据库,发现 ORM 的速度比原生 SQL 语句慢了好几倍,于是去问 Gemini 2.5. Gemini 让我打印出生成的 SQL 语句看看是怎么一回事,我一看,ORM 查询条件是大小写不敏感的,使用了 icontains算符;但是 Django 在把查询条件翻译成 SQL 语句的时候没用上 Postgres 特有的不区分大小写的 ILIKE算符,而是将式子两边都转换成了大写,用了 UPPER() LIKE UPPER().

如何减少 AI 大模型的功耗

- - 奇客Solidot–传递最新科技情报
AI 技术对电力的狂热需求可以上溯到 2012 年的 AlexNet. 当时多伦多大学的 AI 研究员 Alex Krizhevsky、 Ilya Sutskever 和 Geoffrey E. Hinton 正在为图像识别竞赛 ImageNet LSRVC 开发一种卷积神经网络. 在当时图像识别是非常有挑战性的.

转型AI产品经理,原来不需要学那么深的算法和数学模型

- - IT瘾-tuicool
本文作者李杰克 是我们“AI产品经理大本营”成员,但非常特别是,他是 从互联网产品经理转型成了AI工程师. 李杰克 文章的特点,是 能 通过简单有趣的文字介绍AI技术概念,本文是他的第一篇文章,以飨大家. 这是我的第一篇文章,如果你还没系统地学习过AI算法相关知识,它应该能够让你对AI有些新的认知和理解、多些信心,至少你不会再觉得AI是那么高不可攀、遥不可及,相反,AI是普通人也可以理解、学习和实现的.

你现在可以在笔记本电脑、手机和树莓派上运行 AI 模型 LLaMA

- - 奇客Solidot–传递最新科技情报
单机版大语言模型正快速向我们走来. 自 ChatGPT 发布以来,一些人就对 AI 模型内置的对敏感话题的限制以及需要为使用 API 向 OpenAI 付费而感到沮丧. 大语言模型的开源方案也存在,但距离普通人很遥远,它们或者需要大量的 GPU 显存和存储空间,或者在消费级硬件上达不到 GPT-3 级别的性能.

AI绘画能力的起源:通俗理解VAE、扩散模型DDPM、ViT/Swin transformer_v_JULY_v的博客-CSDN博客

- -
2018年我写过一篇博客,叫:《. 一文读懂目标检测:R-CNN、Fast R-CNN、Faster R-CNN、YOLO、SSD》,该文相当于梳理了2019年之前CV领域的典型视觉模型,比如. 随着2019 CenterNet的发布,特别是2020发布的DETR(End-to-End Object Detection with Transformers)之后,自此CV迎来了生成式下的多模态时代.

看不下去AI胡说八道,英伟达出手给大模型安了个“护栏” | 开源

- - 量子位
量子位 | 公众号 QbitAI. 大模型们 胡说八道太严重,英伟达看不下去了. 他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应该触碰的话题. 这个新工具名叫“护栏技术”(NeMo Guardrails),相当于给大模型加上一堵安全围墙,既能控制它的输出、又能过滤输入它的内容. 一方面,用户诱导大模型生成攻击性代码、输出不道德内容的时候,它就会被护栏技术“束缚”,不再输出不安全的内容.

AI vs AI--当AI与自己聊天

- Tim - Solidot
Shawn the R0ck 写道 "最烦人的事情之一莫过于被强迫与一个白痴对话. 但当你发现你最讨厌与之交谈的白痴其实就是你自己的基于人工智能程序的拷贝...康奈尔创造性机器实验室决定看看当AI尝试跟自己交谈会发生什么. 他们的健谈的AI程序Cleverbot与自己进行文本交互,之后朗读出文本并且显示到视频中.

一家公司的 AI 教育观:AI 管「教」,真人来「育」

- - 极客公园
叮咚课堂 App 上线不过八个月,他们一面竭力在竞争异常激烈的在线少儿英语赛道上保持着刻意的低调,一面又疯狂地收获了平均 300% 月度的用户增长率. 这让他们创始人邱明丰对未来信心更盛了. 在艾瑞咨询发布的《2018 年中国在线幼儿启蒙英语行业白皮书》中提到,近年来人工智能在互联网教育领域大规模展开,但在在线幼儿启蒙英语教育中的应用甚少,随着资本的注入和行业的发展,其有望通过人工智能进一步提升用户在线启蒙英语学习的体验和效率.

贪吃蛇AI挑战赛第二季

- 温柔一刀 - 黑客志
如果你对这个活动感兴趣,可以先从这里开始,编写一个AI程序,然后将你的AI程序以及你对平台的改进建议发送到jin.cai20#gmail.com,主办方将会从中选择12名选手参加6月24到25持续一个周末的编程派对,并提供往返交通及住宿费用,下面是活动的详情:. 时间: June 24th – June 26th *.

AI 政策引发失业担忧

- - 最新更新 – Solidot
政府智库——中国发展研究基金会和红杉中国的报告 显示,中国出口制造业省份浙江、江苏和广东的几家公司在这三年内因自动化削减了 30% 至 40% 的劳动力. 北京正在实施雄心勃勃的政策以升级制造技术. 官方媒体对包括人工智能领域在内的政府发展目标的报道都集中在积极因素上. 然而,有关当局悄然对此类政策导致的裁员表示了担忧.