用Qwen 3.6 35B本地模型作为主力编程工具替代Claude或GPT

标签: | 发表时间:2026-06-17 08:59 | 作者:
出处:https://gemini.google.com

基于 Hacker News 上的这个热门讨论(关于是否有人在日常编程中用本地大模型完全替代 Claude/GPT),以下为您归纳出的几条 本地大模型最佳实践以及该讨论的 主要内容概述

一、 本地大模型(Local LLM)编程的 5 条最佳实践

  1. 选择最适配的混合架构模型(如 Qwen 3.6 35B) 讨论中多位资深用户指出, Qwen 3.6 35B(激活 3B 参数的混合专家模型 MoE) 是目前本地编程的“黄金甜点位(Sweet Spot)”。它在 128GB 或 36GB RAM 的设备(如 Mac Studio、Strix Halo 笔记本)上运行极快,且代码能力表现优异。对于更复杂的任务,可配合 Qwen 3.5 122B(激活 10B)作为后备。

  2. 启用“保持思考”配置(Preserve Thinking)以优化缓存 在使用推理/思考模型(如带有 <think> 标签的模型)进行多轮对话或 Agent 自动化编程时,默认的模板可能会在下一轮对话中丢弃之前的思考链(CoT),导致每一轮都要重新计算完整的 KV 缓存(Context Reprocessing)。 最佳实践是在大模型后端(如 llama.cpp)中开启 preserve_thinking: true,这能大幅提升多轮对话中的缓存命中率,避免卡顿。

  3. 使用 Vulkan 后端提升 AMD/Intel 硬件性能 在特定硬件(如 AMD Strix Halo 笔记本)上运行 llama.cpp 时,部分用户反馈 使用 Vulkan 后端甚至比官方的 ROCm 还要快且更稳定。硬件平台的后端选择(Vulkan vs ROCm/Metal)应根据实际本地测试来决定。

  4. 精确提示与迭代开发(Iterative Development),不当“甩手掌柜” 本地模型(如 Qwen 3.6 35B)相比于闭源的顶尖模型(如 Claude 3.5 Sonnet / Opus),更像是一个 需要密切指导的“初级程序员(Junior)”。最佳实践是 不要指望它一次性生成成千上万行代码,而是采用“讨论设计方案 -> 达成共识 -> 迭代编写单个功能 -> 运行测试”的循环模式,且提示词必须极其精确、消除歧义,否则模型会为了偷懒选择最糟糕的架构(例如直接在 HTML 里塞满 CSS)。

  5. 量化(Quantization)和容器化沙箱(Sandboxing)安全

    • 安全: 配合 Agent 框架(如 Pi 编程脚手架)时,务必将本地模型和执行环境 容器化(Docker)并进行沙箱隔离,限制其仅能访问当前工作目录,防止断网环境下本地脚本误操作或泄露敏感凭证。

    • 量化: 不要盲目相信社区的激进量化。量化对代码质量影响极大(MoE 架构对量化的耐受度稍好),建议在可能的情况下优先选用更高精度的版本(如 FP8 等)。

二、 帖子主要内容概述

这个帖子(Ask HN)的核心议题是: “有没有人真正把本地模型作为主力编程工具,完全替代了 Claude 或 GPT?” 评论区的技术人员对此展开了深度讨论,主要内容可概括为以下几点:

  • 完全替代的可能性与实际体验: 多数硬核开发者表示 完全可以替代,尤其是在注重 隐私、离线开发和完全免费的场景下。有用户分享了他们纯靠本地模型(Qwen3.6 35b + Pi 框架)重构整个 Django+Wagtail 网站主页和博客的成功经历。

  • 本地模型 vs 闭源大模型的差距: 用户普遍认为,Claude Opus 或 Sonnet 就像一个能帮你思考架构的“高级工程师(Senior)”,能带来 15 倍的效率提升;而本地模型则是一个需要你时刻盯着的“初级工程师”,能带来约 5 倍的效率提升。虽然本地模型更容易陷入逻辑死循环或在调用编辑工具时出错,但考虑到它 完全免费且纯离线,这种表现已经令人惊叹。

  • 技术层面的深究(KV缓存与Attention机制): 讨论中有很大一部分篇幅在硬核切磋本地运行的底层 Bug。大家深入探讨了为什么模型在多轮对话中会频繁触发“重新处理上下文(Re-processing context)”。多位开发者指出这通常是由于 Prompt 模板不一致、系统提示词每轮被修改(Harness Bug)或没有保存思考链导致的,并给出了具体的 Jinja 模板修改方案和命令行参数。

  • 人机协作哲学的思辨: 开发者们辩论了“AI编程是否会导致代码质量退化”。主流观点认为,AI 不是为了让人变懒去生成一堆垃圾代码(Vibe Coding),而是作为“自动化 Google”和实时常驻的专家。高水平的开发者可以通过与本地 AI 讨论、审查其方案并编写大量测试,实现“控制权在人,生产力乘数在 AI”的高质量开发。

相关 [qwen 35b 模型] 推荐:

用Qwen 3.6 35B本地模型作为主力编程工具替代Claude或GPT

- -
基于 Hacker News 上的这个热门讨论(关于是否有人在日常编程中用本地大模型完全替代 Claude/GPT),以下为您归纳出的几条 本地大模型最佳实践以及该讨论的 主要内容概述. 一、 本地大模型(Local LLM)编程的 5 条最佳实践. 选择最适配的混合架构模型(如 Qwen 3.6 35B) 讨论中多位资深用户指出,.

在 Mac 用 LM studio 部署本地大模型(DeepSeek/Qwen) + 翻译

- - xLog Latest
得益于 Mac 的 CPU 和 GPU 共享内存, 以及大的内存带宽, 使得使用 macBook 运行本地大模型成为可能,借着最近 DeepSeek 大火的东风,我也尝试在本地构建了一套 AI 翻译的系统. 本文将会介绍如何在 Mac 电脑上正确的配置这套系统. 在 Mac 上免费使用大语言模型进行对话.

模型制作

- 小鱼儿 - 非正常人类研究中心 – Mtime时光网
1.材料:一大袋的一次性筷子(花了60块钱);5支502胶水;5张粗砂纸;记号笔一只;锋利的美工刀片若干,破剪刀一把. 就是这种屌毛筷子,质量也太他妈的差了点,80%都是弯的 . 随便提一下:我的脚丫子还是蛮性感滴 . 开始动工了!!  先做门框跟房子的底架. 3.不好意思,忘了交代一下了,我是先画图纸的,看到那张纸了没有.

MapReduce编程模型

- - CSDN博客云计算推荐文章
MapReduce是一个Google发明的编程模型,也是一个处理和生成超大规模数据集的算法模型的相关实现. 用户首先创建一个Map函数处理一个基于对的数据集合,输出的中间结果基于对的数据集合,然后再创建一个Reduce函数用来合并所有的具有相同中间Key值的中间Value值.

关于BOM模型

- - CSDN博客编程语言推荐文章
当我们使用浏览器打开一个网页程序时,那么,js系统会自动创建对象,首先创建浏览器对象window,然后再为window对象创建它的子级对象,最后形成一个树状模型,这个就是BOM模型. BOM定义了JavaScript可以进行操作的浏览器的各个功能部件的接口. BOM 主要处理浏览器窗口和框架,不过通常浏览器特定的 JavaScript 扩展都被看做 BOM 的一部分.

对象的消息模型

- loudly - 酷壳 - CoolShell.cn
[ ———— 感谢 Todd 同学 投递本文,原文链接 ———— ]. 话题从下面这段C++程序说起,你认为它可以顺利执行吗. 试试的确可以顺利运行输出hello world,奇怪吗. 其实并不奇怪,根据C++对象模型,类的非虚方法并不会存在于对象内存布局中,实际上编译器是把Hello方法转化成了类似这样的全局函数:.

JS三维模型库 Three.js

- Le - 开源中国社区最新软件
Three.js 是一款运行在浏览器中的 3D 引擎,你可以用它创建各种三维场景,包括了摄影机、光影、材质等各种对象. 你可以在它的主页上看到许多精采的演示. 不过,这款引擎目前还处在比较不成熟的开发阶段,其不够丰富的 API 以及匮乏的文档增加了初学者的学习难度(尤其是文档的匮乏) 演示:http://mrdoob.github.com/three.js/.

论NoSQL的数据模型

- - NoSQLFan
本文内容是对《 NoSQL Data Modeling Techniques》一文的简单概述,原文对NoSQL的几种 数据模型进行了详细深入的讨论. 是了解NoSQL数据模型不过错过的全面资料. NoSQL的一些非功能性的特性,比如扩展性、性能以及一致性的讨论,目前已经有很多. 而对于NoSQL产品内部数据模型相关的知识一直比较欠缺,本文就希望能够系统地对NoSQL数据模型进行一些探讨.

深入Java内存模型

- - ImportNew
你可以在网上找到一大堆资料让你了解JMM是什么东西,但大多在你看完后仍然会有很多疑问. happen-before是怎么工作的呢. 用volatile会导致缓存的丢弃吗. 为什么我们从一开始就需要内存模型. 通过这篇文章,读者可以学习到足以回答以上所有问题的知识. 它包含两大部分:第一部分是硬件层次的大体架构,第二部分是深入OpenJdk源代码和实现.

[转]Geodatabase数据模型

- - 小鸥的博客
1  Geodatabase概念.   Geodatabase是ArcInfo8引入的一种全新的面向对象的空间数据模型,是建立在DBMS之上的统一的、智能的空间数据模型. “统一”是指,Geodatabase之前的多个空间数据模型都不能在一个统一的模型框架下对地理空间要素信息进行统一的描述,而Geodatabase做到了这一点;“智能化”是指,在Geodatabase模型中,对空间要素的描述和表达较之前的空间数据模型更接近我们的现实世界,更能清晰、准确地反映现实空间对象的信息.