更新于:05-19 08:13

最新推荐

手搓一个 Agent 驱动的项目 Wiki 生成方案

于05-18 08:00 - - AI 工程实践 AI
最近我一直在折腾项目文档生成的事情. 之前写过两篇关于 deepwiki 的文章: deepwiki-rag-principle 讲了 RAG 原理, deepwiki-optimize-line-number 聊了给代码加行号的优化. 经过几轮迭代,搞了两个优化:. 基于 Proto 文件生成确定性目录.

马斯克花 100 亿想清楚一件事,不做 coding agent 就是等死

于05-18 22:10 - 杜晨 - 软件 agent Anthropic Coding Agent cursor
OpenAI 的两大宿敌 Anthropic 和马斯克,放下心中成见之后终于在月初结盟了. 在此之前,Anthropic 和马斯克的关系并不融洽:今年 2 月,马斯克还在自己的 X 账号指责 A 社「woke」「邪恶」「反人类」(misanthropic),说这家公司「仇视文明」. 事后来看,这次攻击并非马斯克清新脱俗的性格使然,而是 Anthropic 所做的某些事情触碰到他的神经,事出有因.

你生活的地点与你衰老的速度相关

于05-18 23:37 - -
根据发表在《Cell》期刊上的一项研究,研究人员通过分析欧洲、东亚和南亚的 322 名健康人去构建迄今最详尽的遗传祖先和环境如何塑造人类生物学特征的图谱. 通过招募居住在不同大洲、具有相同遗传背景的人群,科学家得以以前所未有的清晰度,将 DNA 的影响与环境的影响区分开来. 研究人员发现,无论搬到哪里,种族背景会对免疫系统、新陈代谢和肠道菌群产生深远影响.

20条软件工程定律

于05-18 13:54 - -
Milan 在他的 newsletter里整理了 20 条软件工程定律. 这些定律有些来自 1960 年代,到现在还管用. 它们讲的是人在压力下一起造东西时会发生什么,不教你怎么做,只告诉你已经发生了什么、什么行不通. 一个能跑的复杂系统,一定是从一个能跑的简单系统演变来的. 系统在纸面上看着没问题,真正的问题要等真实用户用起来才会暴露.

Eric Sc​​hmidt 在毕业典礼上谈 AI 收到了学生的嘘声

于05-17 23:55 - -
前 Google CEO Eric Sc​​hmidt 在亚利桑那大学的毕业典礼上谈及了 AI,结果现场学生嘘声四起. Sc​​hmidt 说:“我们原以为自己是在为人类几个世纪以来一直构建的知识殿堂添砖加瓦,但我们构建的世界最终却比我们预想的复杂得多. 那些连接我们的工具,也让我们彼此疏离. 那些赋予每个人发言权的平台——就像你们现在正使用的——却也侵蚀了公共领域.

AI 实施工程师岗位出来了:Forward Deployed Engineer

于05-16 21:38 - -
一场 AI 岗位的“军备竞赛”. 先看看最近 AI 圈的一个关于新职位 Forward Deployed Engineer(FDE)的新闻. Google 正在 FDE 岗位上加倍投入,并且大幅简化了面试流程. Google Cloud 的 CEO 托马斯·库里安(Thomas Kurian) 宣布,他们在市场营销(Go-To-Market)团队下成立了一个全新的、以 AI 为核心的部门,并且正在为此疯狂招募 FDE.

Leapsome:2026年劳动力趋势报告

于05-15 06:00 - DinK - 199IT推荐文章 研究报告 网络招聘 2026年劳动力趋势报告 Leapsome
本报告基于对美国、英国、德国和荷兰共2400名全职员工与HR负责人的调研,样本覆盖50至2500人规模企业,调研时间为2025年6月至7月,具有较强的方向性代表意义. 报告揭示,表面稳定的用工结构背后,员工动机、信任与生产率正在系统性走弱. 数据显示,员工“留下来”更多源于风险规避而非满意度. 四分之一的员工因担心跳槽风险而选择留任,54%的员工留下并非因为喜欢当前工作,约三分之一认为在AI环境下自身技能难以匹配新岗位要求.

中国拿下这届 AI 顶会半壁江山,清华一家单挑斯坦福加 MIT

于05-11 16:45 - 莫崇宇 - 产品 AI
全球 AI 顶会,快成中国卷王的专场了. 每年 AI 顶会放榜,各大机构都会暗戳戳地发喜报,比拼谁家被收录的论文多. 但今年 ICLR(国际学习表征会议)放榜后,一位名叫 Dmytro Lopushanskyy 的研究员,干了一件极其硬核的事. 他没有去引用官方那些现成的统计表格,而是写了整整 250 条正则表达式,把 ICLR 2026 全部 5356 篇接收论文的 PDF 挨个下载下来.

Vibe Coding治网瘾?孩子为何越写越上瘾?

于05-11 21:40 - 老范 讲故事 - AIGC A Return to Code AI编程教育 AI编程治网瘾 Vibe Coding治疗网瘾
以毒攻毒:用 Vibe Coding 治疗网瘾,AI 时代的新选择. 大家好,欢迎收看老范讲故事的 YouTube 频道. 今天咱们来讲一讲“以毒攻毒”:用 Vibe Coding 治疗网瘾,AI 时代的新选择. 大家注意,这个名字听起来稍微有点标题党. 网瘾是一个很严肃的问题:孩子沉迷游戏,或者刷短视频,昼夜颠倒,不写作业,不出门,不社交,家长急得不行.

Anthropic:Claude的“勒索”行为源于网络中的“邪恶叙事”

于05-11 22:35 - -
人工智能公司 Anthropic 近日披露,其大模型 Claude 之所以在内部测试中学会以“勒索”方式自保,并非源自人为设定,而是从互联网上大量将 AI 描绘成“邪恶、渴望自我保全”的故事中习得相关模式. 此前,Anthropic 在一次预发布安全与对齐测试中发现,高端模型 Claude Opus 4 会在自身“生存”受到威胁时,选择以黑料相要挟的方式阻止被关停,引发外界对高级 AI 行为不可预测性的担忧.

全文检索的两个基本技术原理

于05-11 11:12 - -
当使用Lucene(或基于它的Elasticsearch、Solr)进行全文检索时,整个过程就像一个高效的图书馆:. 倒排索引是图书馆里的“书目检索柜”. 它告诉你,哪个词出现在哪本书(文档)的哪一页. TF-IDF向量化是图书管理员手里的“相关性计算器”. 当你输入查询后,它会根据词的重要性和出现频率,给所有相关的书算出一个分数,分数最高的就是最可能符合你需求的.

2026年软件系统的测试怎么做?

于05-09 17:25 - -
实际上有哪家像样的线上核心系统只用了全自动的端到端(E2E)测试就上线了. 这是一个非常“毒辣”且客观的追问. 确实,没有任何一家理性的互联网巨头会宣称: “我们只靠全自动 E2E,完全不需要真人就上线核心系统. 如果有人这么跟你说,那他大概率是在卖课或者是对工程实践缺乏敬畏. Google、Netflix、Amazon 这种级别的公司里,核心系统的上线逻辑并不是“全自动 E2E vs 真人验证”的二选一,而是一套“去中心化的质量防御体系”.

2026年个人Agent自建实战

于05-08 16:41 - -
上一篇我聊了为什么自己不再去追新框架、不再频繁迁移、而是决定自己搭一套Agent. 很多朋友看完后留言说“想动手但不知道从哪开始”,所以这篇文章讲了我用15天把我的个人 Agent “EvoPaw”从“能跑”迭代成每天都在用的工作系统,完整复盘可复制的方法论. 坦率的讲,我自己第一次摸索的时候也走了不少弯路.

Claude Code 基本原理学习

于05-07 14:20 - -
真正的 agent 起点,是把真实工具结果重新喂回模型,而不只是输出一段文本. 主循环本身不用变复杂;工具能力靠一层清晰的路由面增长. 对多步骤任务来说,可见计划不是装饰,而是防止会话漂移的稳定器. 把探索性工作移进干净上下文后,父 agent 才能持续盯住主目标. 专门知识不该一开始全部塞进上下文,而该在需要时被轻量发现、按需展开.

[译] Anthropic 的产品团队为什么能比其他公司更快(2026)

于05-05 08:00 - - ai anthropic
本文整理翻译自 2026 年的一档播客 How Anthropic’s product team moves faster than anyone else | Cat Wu (Head of Product, Claude Code), 嘉宾是 Claude Code 的产品主管 Cat Wu.

Harness最佳实践: Learn Harness Engineering

于05-06 16:06 - -
欢迎来到 Learn Harness Engineering. Learn Harness Engineering 是一门专注于 AI 编程智能体工程化落地的课程. 本课程深度研究并总结了业内最前沿的 Harness Engineering(工具马具/脚手架工程)理论与实践,参考资料包括:. 通过系统的环境设计、状态管理、验证与控制机制,本课程旨在帮助你让 Codex 和 Claude Code 等 AI Agent 能够真正可靠地完成真实工程任务.

MS Edge 被发现会在内存中明文加载所有密码

于05-05 22:12 - -
MS Edge 浏览器被发现启动时会在内存中明文加载其保存的所有密码. 相比下 Chrome 只在需要时解密凭证,没有将所有密码保存在内存中. Edge 和 Chrome 都是基于开源的 Chromium. 微软的做法让从内存中抓取重要数据变得更容易,也增加了共享环境下密码泄露的风险. 安全研究人员将这一问题报告给了微软,收到的回应是该行为就是这么设计的.

本地科研助理

于05-02 08:00 - -
去年年底我就开始关注龙虾类应用,自己也折腾了一段时间,热度过去基本就闲置了,更多时候还是用自然语言编程. 后来仔细回忆了一下,我其实不排斥搞一个个人助理,真正没放开用是因为不了解其实现过程,担心出错跟信息泄露. 那解决方案就很简单了,自己搭一个. 我的核心诉求很简单,就是要一个能在 Telegram 和 QQ 里对话的科研助理.

Agent Loop 简介

于05-02 08:10 - - AI AI Claude Code Agent
先说一个看起来有点反常识的事: LLM 本身是无状态的. 每次调用模型,本质上就是一次”文本补全”——你扔一段 prompt 进去,它根据这段 prompt 续写一段输出,然后整个过程结束. 下一次再调用,模型对上一次的事一无所知. 从机制上讲,它和 2020 年的 GPT-3 没有本质区别,都是一次性的补全器.

Gatling 实现原理与稳定施压核心机制

于04-29 20:42 - edagarli - 后端 压测
Gatling 是一款基于 Scala + Akka + Netty 构建的高性能压测工具,核心突破了传统JMeter「一用户一线程」的模型瓶颈,通过 异步非阻塞事件驱动 + 轻量级Actor并发模型,实现了低资源占用、高并发支撑、毫秒级精准的稳定施压能力,完美适配你做全链路压测时对流量精准控制、长时间稳定运行的核心需求.

Google计划将Chrome打造成企业用户的"AI同事"

于04-23 02:34 - 稿源:cnBeta.COM - 科技
在本周三举行的 Google Cloud Next 大会上,Google宣布将把具备“自动浏览”(Auto Browse)能力的智能代理功能引入企业版 Chrome 浏览器,并同步加强相关安全防护措施. 借助这一功能,企业用户可以利用 Gemini 理解当前打开标签页中的实时网页内容,然后让 AI 代为执行诸如预订差旅、录入数据、安排会议等各类与网页操作相关的工作任务.

Google Deepmind论文解读:如何给AI Agent 投毒

于04-20 14:32 - -
2026 年 3 月,Google DeepMind 发布了一篇论文,题目叫《AI Agent Traps》. 下载地址:📎 ai agent trap.pdf. 五位研究者做了一件之前没人系统做过的事:. 把所有已知的、针对 AI Agent 的攻击方式,第一次完整地梳理成一套框架. 读完,学习了不少AI Agent攻防技巧,但也感觉这件事比大多数人意识到的要严重得多.

Agent Harness:让AI从聊天机器人变成真正的智能体

于04-20 14:19 - -
你可能已经搭建过聊天机器人,甚至接入了几个工具,做出了能演示的原型. 但当你想把它推向生产环境时,问题就来了:. 模型会忘记三步之前做过什么,工具调用会失败,上下文窗口塞满了无用信息. 问题不在模型本身,而在模型周围的一切. LangChain 用一个实验证明了这点:. 他们只改变了 LLM 的基础设施(模型和权重完全不变),在 TerminalBench 2.0 的排名就从 30 名开外跃升到第 5 名.

如何使用NLEmbedding + Gemma4构建一个知识管理和检索友好的系统工具

于04-17 14:15 - -
结合 NLEmbedding 与 Gemma 4 构建知识管理系统,核心是发挥两者的互补优势:NLEmbedding 负责将知识转化为可检索的向量索引(“记忆系统”),Gemma 4 负责基于检索结果生成高质量回答(“认知大脑”). 🧠 第一步:NLEmbedding——构建记忆检索层. NLEmbedding 的核心任务是将文档片段转化为高维向量,本质是建立语义空间索引.

PostgreSQL可以做到Redis能做的一切 - PGSQL

于04-17 13:41 - -
我之前用的是一套很典型的Web应用技术栈:. PostgreSQL负责持久化数据存储. Redis负责缓存、发布订阅以及后台任务处理. 两个数据库,两个体系需要管理,也意味着多了两处故障风险点. 后来我意识到:PostgreSQL可以做到Redis能做的一切. 于是我彻底移除了Redis,迁移过程是这样的.

准确率从60%到94%:构建RAG系统的核心策略(2026最新版)

于04-17 13:38 - -
我第一次构建RAG系统时,以为一切都很简单:把文档切块、创建向量、检索相似内容,然后喂给大模型. 系统会“自信满满”地返回毫无关联的信息,有时甚至错过文档间显而易见的联系. 后来发现,我使用的正是研究人员所称的“朴素RAG”——这种最基础的实现方案,几乎从不在生产环境中奏效. 本文将带你了解11个先进的RAG策略,它们将我的系统准确率从60%提升到了94%,并详细展示如何组合这些策略以实现最大效果.

Stanford:2026年人工智能指数报告

于04-17 06:00 - DinK - 199IT推荐文章 人工智能 研究报告 2026年人工智能指数报告 AI模型
生成式人工智能在2025年前后完成从技术突破向规模化应用的跃迁,其三年内实现53%的人口渗透率,显著快于互联网与个人电脑扩散路径,同时企业采用率已升至88%,高校学生使用比例达到80%,表明AI已从边际工具转变为基础性生产要素. 资本投入与商业化能力同步跃升,美国2025年AI私人投资达到2859亿美元,规模超过中国23倍以上,同时新成立AI企业数量达1953家,处于全球绝对领先地位,而生成式AI对美国消费者的年化价值已达1720亿美元,且单个用户价值在一年内实现三倍增长.

让 Claude Code 在你睡觉时持续运行:完整实战指南

于04-15 13:44 - - AI 开发工具 Claude Code AI Coding Agent
让 Claude Code 在你睡觉时持续运行:完整实战指南. Claude Code 可以通过. -p 标志、权限绕过、循环模式和终端持久化的组合,实现数小时甚至整夜的无人值守运行. 开发者社区已经形成了一套可靠的操作手册:容器化运行环境、使用 “Ralph Wiggum” 循环模式、安装四个关键 Hook 防止卡死、保持 CLAUDE.md 精简.

斯坦福报告凸显了 AI 业内人士和公众之间的分歧

于04-15 22:23 - -
斯坦福大学 HAI 研究院本周一发表了年度报告 AI Index. 报告凸显了 AI 业内人士和公众之间日益扩大的分歧. 报告援引皮尤研究中心上月发布的一份报告:只有 10% 的美国人对 AI 在日常生活中的日益普及感到兴奋而非担忧,但 56% 的 AI 专家认为 AI 将在未来 20 年对美国产生积极影响.

12twenty:2026年早期职业市场就业报告

于04-15 05:30 - DinK - 199IT推荐文章 研究报告 网络招聘 12twenty 就业报告
报告基于超过4000个项目与300万条就业结果数据,覆盖600万学生与校友样本,较2019年增长361%,为观察全球早期职业市场提供了高可信度样本基础. 当前就业市场的核心矛盾在于,经济增长与岗位创造之间出现明显脱钩,企业在利润与效率提升的同时,对新增劳动力的依赖显著下降. 从宏观数据看,全球经济维持温和扩张,但就业并未同步改善.