免费可商用开源GPT模型问世，50G权重直接下载，性能不输GPT-3

- - 量子位

量子位 | 公众号 QbitAI. 真·开源GPT模型，终于来了. 参数量级130亿，大小比肩最近Meta开放的LLaMA-13B，但从数据集、模型权重到计算优化训练，全部开源. 没错，虽然就GPT-3而言，之前DeepMind、Meta等组织陆陆续续开源过几个模型，不过基本都是半遮半掩. 尤其最接近GPT-3的Meta OPT模型，不仅权重只开放给研究者，而且不可商用：.

开源大模型Llama 3王者归来！最大底牌4000亿参数，性能直逼GPT-4

- - 机器之心

ChatGPT 拉开了大模型竞赛的序幕，Meta 似乎要后来居上了. 本周四，AI 领域迎来重大消息，Meta 正式发布了人们等待已久的开源大模型 Llama 3. 扎克伯格在 Facebook 上发帖：Big AI news today.. 与此同时，扎克伯格宣布：基于最新的 Llama 3 模型，Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook 等全系应用，并单独开启了网站.

GPT-2 Tokenizer 效率观察

- - Solrex Shuffling

对基于 Transformer 结构的 LLM （大语言模型）来说，模型的输入输出都是 Token（词元）. 一段输入文本，首先要经过 Tokenizer（分词器）切分成 Token 再输入给模型. 不同的 Tokenizer 会把文本按不同的边界切分，那一段文本到底会被切成几个 Token 就体现了 Tokenizer 本身的效率，这本身也是信息论的讨论范畴.

10大免费开源Windows软件

- - 行业应用 - ITeye博客

　　尽管微软和开源社区存在着竞争，但仍然有很多开源软件是适用于Windows系统的. 著名的《Infoworld》杂志网站近日就罗列出10款最为著名的适用于Windows系统的开源软件. 　　FileZilla 是一款开源的FTP客户端软件. 与其他FTP软件一样，FileZilla也有一个富有条理的用户界面，并且可以自动批量上传.

[译] GPT 是如何工作的：200 行 Python 代码实现一个极简 GPT（2023）

- - ArthurChiao's Blog

本文整理和翻译自 2023 年 Andrej Karpathy 的 twitter 和一篇文章： GPT as a finite-state markov chain. Andrej Karpathy 博士 2015 毕业于斯坦福，之后先在 OpenAI 待了两年，是 OpenAI 的创始成员和研究科学家，2017 年加入 Tesla，带领 Tesla Autopilot 团队， 2022 年离职后在 Youtube 上科普人工智能相关技术，2023 年重新回归 OpenAI.

GPT-4重磅发布，你需要知道的10件事

- - 广告网 - 行业观察

本文由全元宇宙Allmetaverse主理人郑秋实出品. 2023年3月14日，OpenAI正式发布全新大型多模态模型GPT-4. OpenAI在以ChatGPT震撼全球的短短几个月之后，火速上线新一代里程碑GPT-4. 相较于上一代的ChatGPT和GPT-3.5, GPT-4到底带来了哪些更新，本文将为你快速盘点：.

更开放的微软拥抱开源：微软.NET开源专利免费用

- - WPDang

在微软CEO萨提亚·纳德拉上台之后，其推行的“移动为先，云为先”战略似乎也让微软对待产品服务的态度变得更加开放了. 早前发布的Office For iPad、近日发布的Office For iPhone、Office For Android Tablet都是一个个活生生的例子. 不过这样的开放性态度同样也被扩展到开发者和开发产品中.

开发人员看过来：11 个免费的开源 IDE

- 阿贡 - ITeye资讯频道

今天给大家分享几款开源IDE，太常见的IDE这里就不介绍了. Komodo Edit 是开源的，支持PHP, Python, Ruby, JavaScript, Perl, Tcl, XML, HTML 5 and CSS 3. 它具备语法着色，折叠，背景语法检查，自动完成和提示功能，还包括jQuery，Ext JS，Ruby on Rails等库，可自动完成.

五个免费开源的数据挖掘软件

- ※ABeen※ - 车东[Blog^2]

在网上看到一篇文章介绍五个免费开源的数据挖掘软件，转过来. Orange 是一个基于组件的数据挖掘和机器学习软件套装，它的功能即友好，又很强大，快速而又多功能的可视化编程前端，以便浏览数据分析和可视化，基绑定了Python以进行脚本开发. 它包含了完整的一系列的组件以进行数据预处理，并提供了数据帐目，过渡，建模，模式评估和勘探的功能.

开源时代，第 2 部分: 通过免费来赚钱

- JimQ - IBM developerWorks 中国 : 文档库

本文是本系列的第二篇文章，其着眼于使从事开源工作的人们赚钱的业务模型，也许还解释了为什么这种业务模型如此之多.

免费可商用开源GPT模型问世，50G权重直接下载，性能不输GPT-3

模型性能如何？

曾开发最大AI芯片

相关 [免费开源 gpt] 推荐：