[分享创造] GNE v0.1 正式发布： 4 行代码开发新闻网站通用爬虫

- - V2EX

GNE （ GeneralNewsExtractor ）是一个通用新闻网站正文抽取模块，输入一篇新闻网页的 HTML，输出正文内容、标题、作者、发布时间、正文中的图片地址和正文所在的标签源代码. GNE 在提取今日头条、网易新闻、游民星空、观察者网、凤凰网、腾讯新闻、ReadHub、新浪新闻等数百个中文新闻网站上效果非常出色，几乎能够达到 100%的准确率.

[分享创造] 开源一个类微博 twitter 的网站

- - V2EX

网址： https://sserr.net. 代码： https://github.com/coyove/iis. 之前的发布： https://v2ex.com/t/628871. 时隔一个多月，当初的 todo 基本上都清掉了，代码也重构到了开源出去也不会太丢人的程度 XD. 总的来说这是一个类微博的系统，提供了大部分你所熟知的微博功能.

[分享创造] 推荐一个 SpringBoot API 文档生成工具

- - V2EX

修复了很多大家提出来的问题，应该稳定了不少，可以稍微放心推荐给大家了. 它是一个开源的 SpringBoot API 文档生成工具，无需额外注解，轻松集成. 目前有 800+star，已经有不少小伙伴在使用了，并且有一个活跃的微信反馈群. 如果你已经厌烦 Swagger 满屏的注解和额外的工作量，你不妨一试.

[分享创造] 看到有人讨论亚健康的问题，分享一些个人锻炼的经验

- - V2EX

下面的方法是没有去健身房，自己在家，没有器材时的方法. 个别动作可以考虑买个瑜伽垫，因为在汗水到床上还需要洗床单的. 一定要吃主食，也可以适量用薯类或者其他谷物代替. 2.蔬菜可以不限量，水果少食糖分多的. 苹果、红薯、玉米等粗粮比较不错. 吃的话可以试一下全麦面包或者坚果之类的. 4.不要特意去补充蛋白质，不吃动物油，动物脂肪，肥肉之类.

[分享创造] 可能是 iOS 上最好用的电视直播软件

- - V2EX

因为平时喜欢看电视，在 app store 上又找不到适合的，就想着自己造个轮子，临时抱佛脚学了三天 iOS 开发，写了个 app. 1.自己添加管理 m3u8 直播源，这个没什么好说的，适合动手能力强的. 2.订阅列表，订阅后，只要负责维护列表的大神列表更新，用户的列表就会自动更新. 目前我自己维护了 4 个列表，加起来频道大概六七十个.

[分享创造] 一个使用 Flask+gorse 实现的 Steam 游戏推荐系统

- - V2EX

之前小弟在 V2EX 推广过一个 Go 语言实现的 RESTful 的推荐系统后端，最近以它为后端，使用 Flask 实现了一个 Steam 推荐系统，发在 V2EX 听取一下老哥们的意见. 关于工程量：因为 gorse 完成了大部分的逻辑，所以 Python 代码也就一百多行. 前端用的是 Materialize，后端用的是 Flask.

[分享创造] Vesta: 一个 Docker 和 Kubernetes 配置安全的快速检查工具

- - V2EX

伴随着容器技术的快速发展，容器安全问题也逐渐成为企业所关注的话题，越来越多的公司以及个人开发着选择将他们的服务迁移到云上. 目前市面上的容器扫描或容器配置检查的产品大部门都需要进行繁琐的环境配置，同时对机器性能也有着比较高的要求，而开发者或安全测试者或许只是需要扫描少数的镜像或者配置，繁琐的配置和高昂的机器费用对他们来说难以承担，导致安全检查的效率不佳.

[分享创造] Pear Admin Ant 基于 Vue 3 与 Ant Design Vue 2 的中台模板框架， 1.0.0.RELEASE 正式发布

- - V2EX

Pear Admin Ant 基于 Vue 3 与 Ant Design 2 的中台框架. 1.登录密码 Input --> type == password. 2.通知 / 公告 / 私信 / 任务. 5.升级 Ant 依赖至 Rc 7. 7.夜间模式 tab 适应问题, windows 下菜单栏滚动条临时处理.

以下PPT和内容，来源是我跟一群爱学习的朋友一起学时下大火的OpenClaw小龙虾，我给大家做了个小分享. PPT几乎是OpenClaw输出的内容，下面的会议总结也是GPT根据会议录屏总结的. 需要注意的是，我其实没有将小龙虾玩得很深，因为我从心底里是不信任AI的，也就不敢给它太多权限. 这次分享的核心，不是在介绍一个“聊天机器人”，而是在介绍一套可自托管、可扩展、可执行任务的个人 AI 基础设施.

[分享创造] GNE v0.1 正式发布： 4 行代码开发新闻网站通用爬虫

如何安装 GNE

功能特性

获取正文源代码

总是返回图片的绝对路径

指定新闻标题所在的 XPath

提前移除噪声标签

使用配置文件

FAQ

GeneralNewsExtractor(以下简称 GNE)是爬虫吗？

GNE 支持翻页吗？

GNE 支持哪些版本的 Python ？

我用 requests/Scrapy 获取的 HTML 传入 GNE，为什么不能提取正文？

GNE 支持非新闻类网站吗（例如博客、论坛……）

关于 GNE

关于作者

相关 [分享创造 gne] 推荐：