基于 Koboldcpp 的浏览器 AI 聊天机器人

标签: fedora llm | 发表时间:2026-04-11 17:00 | 作者:lovenemesis
出处:https://linuxtoy.org/

本系列教程的等待期超出了作者的预期。本次,我们将以 Fedora 43 为例,搭建一个基于本地运行的大语言模型工具,配合 Firefox 的 AI 聊天机器人,在没有隐私和流量顾虑的情况下,畅游互联网。本文介绍的思路和基本步骤同样适用于 OSX 和 Windows 系统。

Koboldcpp:多用途的本地 LLM 运行环境

Koboldcpp本站之前介绍过 ,经过一年的发展,Koboldcpp 新增了以下功能:

  • 无缝兼容 Claude Desktop 的 MCP 配置文件
  • 包含 Jinja 支持的完善 通用工具调用模式
  • 内建 lcpp 轻量级 WebUI 界面
  • 进一步优化了 兼容 OpenAI 和 Ollama 接口服务

更多详情请参考项目的 Wiki 说明文件。Koboldcpp 提供了适用于多种平台的预编译版本,兼容无 AVX 的老旧 CPU、新旧版本的 CUDA、Mac Metal 等各种环境。考虑到更广泛的平台适用性,下面以 Vulkan 后端的版本作为示例:

  1. 前往 项目发布页面,下载最新发布版本 Assets 中的 koboldcpp-linux-x64-nocuda(Linux X86_64)。由于功能增多,本文撰写时最新的不包含 CUDA 运行时环境的版本体积已增加到约 115MB。
  2. 将下载好的文件移动到您认为合适的位置:
mv -v koboldcpp-linux-x64-nocuda $HOME/bin/koboldcpp
  1. 赋予其可执行权限:
chmod +x $HOME/bin/koboldcpp

模型文件:Gemma 4

Firefox 的 AI 聊天机器人 可以为当前浏览的网页生成摘要、对选中的文本进行摘要生成、解释说明,甚至执行任意操作。但这些功能对其背后的大语言模型的工具调用能力和提示词格式都有一定的要求,常见的本地部署的 DeepSeek 和 Qwen3.5 模型往往无法满足。直到本月初,Google DeepMind 发布了 新一代的 Gemma4 模型,才实现了与 Firefox AI 聊天机器人的完美兼容。Gemma4 也针对消费级设备进行了优化,其最小版本在搭载 AMD Ryzen 5600U 的轻薄本上也能快速运行:

根据自己的设备配置,从上述选择一个合适的 Gemma4 版本。在平衡体积和质量方面,笔者仍然推荐 Q5_K_M 的量化版本。模型文件较大,下载完成需要一定时间,之后将其移动到您认为合适的位置,例如 $HOME/gguf

使用 Koboldcpp 命令行方式运行模型文件

接下来,我们直接通过命令行的方式将 Koboldcpp 的模型启动和配置整合成一键运行脚本。

除了之前介绍过的参数之外,针对 Gemma4 有一些额外需求:

  • --mmproj:指定映射模型文件名
  • --jinja:指定 Jinja 格式的输出模板,用于规范输出内容
  • --useswa:开启 "Sliding Window Attention",有效降低内存需求
  • --usemmap:可选,使用内存映射文件,对于 MoE 场景和内存有限的场景,加载速度更快,但会影响性能

因此,对于 gemma-4-E2B-it 命令版本,启动方式如下:

$HOME/bin/koboldcpp \
    --model $HOME/gguf/google_gemma-4-E2B-it-Q5_K_M.gguf \
    --mmproj $HOME/gguf/mmproj-google_gemma-4-E2B-it-f16.gguf \
    --usevulkan \
    --gpulayers -1 \
    --skiplauncher \
    --quiet \
    --contextsize 16384 \
    --defaultgenamt 4096 \
    --jinja \
    --useswa \
    --usemmap

将上述命令保存到您偏好的终端脚本或批处理文件中即可。后续运行该脚本或批处理文件时,Koboldcpp 将在后台以进程方式运行,并且不会在浏览器中打开 Kobold Lite,但会在 http://localhost:5001 上提供 KoboldAI、OpenAI 和 Ollama 三种风格的 API 以及一个 轻量级的 WebUI。如需退出,只需关闭终端窗口即可。

当然可以进一步利用 systemd 的方式将其彻底服务化并纳入用户的登录进程管理,这并不会影响外部应用的访问,所以此处不再赘述。

Firefox AI 聊天机器人:网页办公好助手

接下来我们来看看如何将配置好的 LLM 接入到 Firefox AI 聊天机器人中。Firefox AI 聊天机器人默认仅支持少数联网服务,我们需要在它的配置界面中添加本地访问方式,指向 Koboldcpp 内置的轻量级 WebUI。

  1. 在 Firefox 地址栏输入 about:config 打开详细配置界面
  2. 了解风险后,搜索 browser.ml.chat.hideLocalhost 并将其设置为 false
  3. 搜索并修改 browser.ml.chat.provider,指向轻量级 WebUI http://localhost:5001/lcpp/
  4. 打开运行配置好的 Koboldcpp 终端脚本
  5. 使用快捷键 CTRL + ALT + X 开启侧边栏的 AI 聊天机器人,或者在页面空白处右键选择“询问 AI 聊天机器人”,您就能看到 lcpp 风格的轻量级 WebUI 了。也可以通过选中文字后的浮动按钮唤起。更多说明请参考 Mozilla 的帮助文档

看到这里,一些读者可能会好奇使用常见的 ollama 等工具是否也能达到同样的目的? 答案是肯定的,但需要额外搭建诸如 openWebUI 之类的网页前端。因为 Firefox AI 聊天机器人不提供自己的 UI,它依赖于服务提供方的前端来实现交互。恰好 Koboldcpp 内建的轻量级 WebUI 满足了这一需求。

参考内容

相关 [koboldcpp 浏览器 ai] 推荐:

基于 Koboldcpp 的浏览器 AI 聊天机器人

- - LinuxTOY
本系列教程的等待期超出了作者的预期. 本次,我们将以 Fedora 43 为例,搭建一个基于本地运行的大语言模型工具,配合 Firefox 的 AI 聊天机器人,在没有隐私和流量顾虑的情况下,畅游互联网. 本文介绍的思路和基本步骤同样适用于 OSX 和 Windows 系统. Koboldcpp:多用途的本地 LLM 运行环境.

AI vs AI--当AI与自己聊天

- Tim - Solidot
Shawn the R0ck 写道 "最烦人的事情之一莫过于被强迫与一个白痴对话. 但当你发现你最讨厌与之交谈的白痴其实就是你自己的基于人工智能程序的拷贝...康奈尔创造性机器实验室决定看看当AI尝试跟自己交谈会发生什么. 他们的健谈的AI程序Cleverbot与自己进行文本交互,之后朗读出文本并且显示到视频中.

Silk 浏览器:Google? No!

- 橙子 - 爱范儿 · Beats of Bits
前苹果员工, Blogger Chris Espinosa 指出, Amazon 的 Silk 浏览器技术,让 Amazon 不能把自己置于 Google 的控制之下. Silk 在云端为用户组织和优化网页,之后再下载到本地. 这样做的结果是, Amazon 能掌握用户在网络上的一举一动. 不仅仅包括在 Amazon.com 下的订单.

浏览器检测

- - JavaScript - Web前端 - ITeye博客
1.navigator 对象. 由于每个浏览器都具有自己独到的扩展, 所以在开发阶段来判断浏览器是一个非常重要的步骤. 虽然浏览器开发商在公共接口方面投入了很多精力, 努力的去支持最常用的公共功能;但在现实中,浏览器之间的差异,以及不同浏览器的“怪癖”却是非常多的,因此客户端检测除了是一种补救措施,更是一种行之有效的开发策略.

浏览器缓存机制

- Leo Pay - Learning Correcting Improving
Cache-Control 是最重要的规则. 这个字段用于指定所有缓存机制在整个请求/响应链中必须服从的指令. 这些指令指定用于阻止缓存对请求或响应造成不利干扰的行为. 缓存指令是单向的,即请求中存在一个指令并不意味着响应中将存在同一个指令. cache-control 定义是:Cache-Control = "Cache-Control" ":" cache-directive.

浏览器进化史

- Hao Zeng - 爱范儿 · Beats of Bits
这张图非常直观,纵轴是浏览器存在的时间线,横轴代表使用此浏览器的用户数量. 出现在图片中的浏览器包括:Netscape、Opera、IE、Firefox、Safari 和 Chrome. Netscape:1994 年诞生,1995 年用户基数达到最大(2.x 版本). 1998 年 Netscape 被创业杀手 AOL 收购,再加上微软的冲击,逐渐走向衰败,2008 年彻底终结.

百度浏览器评测

- 溪梦 - 月光博客
  百度今年在客户端方面的动作不断,目前已经推出了百度输入法、百度电脑管家、百度安全卫士、百度影音,百度压缩软件,而现在,百度客户端领域的重要产品百度浏览器已经进入了测试阶段,不久后将正式对外发布.   百度在其公关稿里称:“百度浏览器具备以下几点特性:第一,整合百度平台的热门应用,使用户一键触达;第二,采用沙箱安全技术将用户电脑与病毒木马隔离;第三,融合百度搜索技术的智能地址栏;第四,界面设计简洁易操作……百度希望通过浏览器的改进,推动互联网的良性发展,吸引更多的用户来使用互联网,增进使用的频度与时长,最终推动搜索这个媒体平台的发展和巩固.

最新浏览器评测

- John - Solidot
Tom's Hardware发布了最新的浏览器评测,在Windows 7 和Mac OS X Lion系统上分别对Chrome 13、Firefox 6、IE9、Opera 11.50和Safari 5.1执行了近40项测试. 测试结果是:Windows 7上的排名依次是Chrome 13、Firefox 6、IE9、Opera 11.50,Safari 5.1;Mac OS X上是Safari,Chrome,Opera,Firefox.

appcache的浏览器限制

- - 前端观察
appcache(之前的manifest)是html5的一个特性,用来实现浏览器端的资源缓存,是webapp的一个重要工具. 虽然大部分浏览器的最新版都它提供了支持,但是各浏览器的实现却有些差异,我们来看一下~~. 数据来源: browserscope. 可以看出,桌面端的浏览器除了IE10都没有限制,移动端的基本都有各种限制.

IE 浏览器的创新

- - 博客 - 伯乐在线
译者按:IE 曾是 web 创新的先驱,但最近几年因为对 web 标准的支持落后于其他 浏览器以及低版本 IE 的各种 bug 而被人诟病. Zakas 带我们回顾了 IE 在 web 发展过程中扮演的辉煌角色,让我们能以一个更客观的眼光来看待 IE. 看完这篇文章,也许大家都会对 IE 浏览器有一定的改观,这也是我翻译这篇文章的目的.