GPT-4被曝重大缺陷，35年前預言成真！所有LLM正確率都約等於0

- - Futubull - Headlines

最近，一项研究发现，大模型身上存在一种「逆转诅咒」，即使学会「A是B」，它们也无法推理出「B是A」. 大语言模型，竟然存在一种「逆转诅咒」. 所谓逆转，也就是说，一个训练于「A是B」的语言模型能否推广到「B是A」呢. 例如，当我们教会一个模型「乔治·华盛顿是美国第一任总统」后，它能否自动回答「谁是美国第一任总统.

GPT-2 Tokenizer 效率观察

- - Solrex Shuffling

对基于 Transformer 结构的 LLM （大语言模型）来说，模型的输入输出都是 Token（词元）. 一段输入文本，首先要经过 Tokenizer（分词器）切分成 Token 再输入给模型. 不同的 Tokenizer 会把文本按不同的边界切分，那一段文本到底会被切成几个 Token 就体现了 Tokenizer 本身的效率，这本身也是信息论的讨论范畴.

通向AGI之路：大型语言模型（LLM）技术精要 - 知乎

- -

ChatGPT出现后惊喜或惊醒了很多人. 惊喜是因为没想到大型语言模型（LLM,Large Language Model）效果能好成这样；惊醒是顿悟到我们对LLM的认知及发展理念，距离世界最先进的想法，差得有点远. 我属于既惊喜又惊醒的那一批，也是典型的中国人，中国人善于自我反思，于是开始反思，而这篇文章正是反思的结果.

免费可商用开源GPT模型问世，50G权重直接下载，性能不输GPT-3

- - 量子位

量子位 | 公众号 QbitAI. 真·开源GPT模型，终于来了. 参数量级130亿，大小比肩最近Meta开放的LLaMA-13B，但从数据集、模型权重到计算优化训练，全部开源. 没错，虽然就GPT-3而言，之前DeepMind、Meta等组织陆陆续续开源过几个模型，不过基本都是半遮半掩. 尤其最接近GPT-3的Meta OPT模型，不仅权重只开放给研究者，而且不可商用：.

[译] GPT 是如何工作的：200 行 Python 代码实现一个极简 GPT（2023）

- - ArthurChiao's Blog

本文整理和翻译自 2023 年 Andrej Karpathy 的 twitter 和一篇文章： GPT as a finite-state markov chain. Andrej Karpathy 博士 2015 毕业于斯坦福，之后先在 OpenAI 待了两年，是 OpenAI 的创始成员和研究科学家，2017 年加入 Tesla，带领 Tesla Autopilot 团队， 2022 年离职后在 Youtube 上科普人工智能相关技术，2023 年重新回归 OpenAI.

GPT-4重磅发布，你需要知道的10件事

- - 广告网 - 行业观察

本文由全元宇宙Allmetaverse主理人郑秋实出品. 2023年3月14日，OpenAI正式发布全新大型多模态模型GPT-4. OpenAI在以ChatGPT震撼全球的短短几个月之后，火速上线新一代里程碑GPT-4. 相较于上一代的ChatGPT和GPT-3.5, GPT-4到底带来了哪些更新，本文将为你快速盘点：.

谢赛宁团队新基准让LLM集体自闭，DeepSeek R1、Gemini 2.5 Pro都是零分

- - 机器之心

当前 LLM 与人类大师级水平之间仍存在显著差距. 近年来，LLMs（如 GPT-4、Claude、Gemini 等）在代码生成领域取得了显著进展. 它们不仅在经典编程基准（如 HumanEval）中表现出色，甚至在某些测试中超越了人类平均水平. 这促使许多研究者开始宣称：LLM 已经胜过人类程序员，尤其是在竞赛编程领域.

OpenAI 发布 GPT-4，有哪些技术上的优化或突破？

- - 知乎每日精选

在这个历史性的时刻，回答个问题，留下自己作为历史见证人的足迹. GPT4的技术报告里很明确地指出了三个新的方向：. 第一，LLM最前沿研究的封闭化或小圈子化. 技术报告里说了，出于竞争以及安全等方面的考虑，未公布模型规模等技术细节. 从GPT 2.0的开源，到GPT 3.0的只有论文，再到ChatGPT连论文也没有，直到GPT 4.0的技术报告更像效果评测报告.

和AI结对编程！OpenAI与GitHub联手推出AI代码生成工具，比GPT-3更强大

- - 雷锋网

昨日，微软与OpenAI共同推出了一款AI编程工具GitHub Copilot，这款工具基于GitHub及其他网站的源代码，可根据上文提示为程序员自动编写下文代码. GitHub 的首席执行官 Nat Friedman 介绍说，GitHub Copilot是结对编程的虚拟版本. 结对编程是一种常见的敏捷软件开发技术——即两个开发人员在同一个项目上并肩协作，轮流编写代码并检查合作伙伴的输出.

无开发经验如何借助GPT-4开发一个 3D 太空赛跑游戏

- -

有人借助GPT-4，在没有JavaScript二胡3D游戏编程经验的情况下，一点点做除了一个 3D 太空赛跑游戏. 他首先问GPT-4该如何制作游戏，它建议使用BabylonJS，以及HTML和CSS. 然后作者描述了他的具体要求：. 1.游戏将采用与原版天空之城相同的摄像头，玩家从飞船后面看到轨道，而飞船则出现在他们面前.

GPT-4被曝重大缺陷，35年前預言成真！所有LLM正確率都約等於0

回答正确率≈0！

「逆转诅咒」为何重要？

实验和结果

实验一：颠倒虚构明星的描述

数据集和微调

结果

实验二：真实世界知识的逆转诅咒

马库斯：距离AGI还远着呢

相关 [gpt llm] 推荐：