[语言]分类资讯

OpenAI科学家解密：为什么大语言模型会有幻觉？

于11-28 09:02 - -

OpenAI科学家解密：为什么大语言模型会有幻觉. 发一个技术文，OpenAI研究科学家Adam Kalai近期在普林斯顿高等研究院发表的讲座. 原讲座有大量公式，在油管Institute for Advanced Study频道. 我读完，最大一个体会是：模型被鼓励不能说不知道. 一、什么是幻觉，为什么它比你想象的更严重.

机器思考的本质 / Gemini 的核心缔造者揭秘大语言模型推理的魔法与真相

于09-25 07:35 - -

2025 年初的一个下午，斯坦福大学 CS25 课程迎来了一位特殊的演讲者 —— Google DeepMind 推理团队创始人 Denny Zhou（周登勇）. 面对座无虚席的教室，他抛出了一个看似简单却又深刻的问题：“大型语言模型（LLM）真的会推理吗. 台下的学生们大多举手表示相信，但 Denny 的回答却出人意料：“说实话，我不知道.

编程语言是如何实现并发的之操作系统篇 · BMPI

于09-07 07:31 - -

调度(Scheduling). 用户线程(User-level Thread). 线程模型(Thread Model). 上下文切换(Context switching). I/O模型(I/O Model). 这是一台拥有2个虚拟CPU核心的. CPU代表当前线程运行的CPU核心编号. 红框③中是程序的运行命令，其中绿色代表的是.

每个人每天都只有24小时，希望我的选择真的是我的选择 | 枫言枫语

于09-04 22:30 - -

这些变化一般被宣传为蓬勃的，积极的，向上的，比如科技日新月异，经济崛起腾飞，等等诸如此类. 但对个体而言，这些变化也是一种挑战. 通过各国多年间的贸易往来、资本互通、人口流动和知识传播，这些变化深刻影响了几乎所有国家的经济、政治与文化. 中国改革开放还没不到50年，大家想必对“全球化”的体会更为深切.

OpenAI Whisper + FFmpeg + TTS：动态实现跨语言视频音频翻译 - 掘金

于05-23 22:41 - -

本文作者系360奇舞团前端开发工程师. 本文介绍了如何结合 OpenAI Whisper、FFmpeg 和 TTS（Text-to-Speech）技术，以实现将视频翻译为其他语言并更换声音的过程. 我们将探讨如何使用 OpenAI Whisper 进行语音识别和翻译，然后使用 FFmpeg 提取视频音轨和处理视频，最后使用 TTS 技术生成新的语音并替换原视频的音轨.

通向AGI之路：大型语言模型（LLM）技术精要 - 知乎

于01-12 16:03 - -

ChatGPT出现后惊喜或惊醒了很多人. 惊喜是因为没想到大型语言模型（LLM,Large Language Model）效果能好成这样；惊醒是顿悟到我们对LLM的认知及发展理念，距离世界最先进的想法，差得有点远. 我属于既惊喜又惊醒的那一批，也是典型的中国人，中国人善于自我反思，于是开始反思，而这篇文章正是反思的结果.

最强语言 AI 诞生 - ChatGPT

于12-05 20:15 - 煞有介事 -

没错，最强语言 AI 已经诞生，那就是 ChatGPT. ChatGPT 是 OpenAI 实验室最近推出的语言 AI，上周三推出，今天已经有 100万用户量，甚至马斯克都已经注意到了. 这两天也是各个圈子在一直分享和「玩」，有技术圈、web3 圈. 我也注册试玩了下，从 SEO 角度，内容质量和流畅度确实远超其他 AI 几条街.

编程语言是如何实现并发的之并发模型篇 · 构建我的被动收入

于05-29 07:15 - -

初稿征集意见中本文处于初稿状态，可能存在很多错误，如果你有不同的看法，欢迎不吝赐教，先行感谢. 多进程(Multiprocessing). 多线程(Multithreaded). 共享内存通信(Shared memory communication). 消息传递通信(Message passing communication).

腾讯人最喜欢的编程语言是什么？ | 内含完整报告_TAPD敏捷研发-CSDN博客

于08-24 07:43 - -

先抛结论：这份报告，含金量很足，请认真研读. 刚刚，腾讯正式对外发布2020年度《腾讯研发大数据报告》，这份由腾讯技术委员会出品的报告，披露了过去一年腾讯在研发投入、研发效能及开源协同等方面的重要数据. 大家普遍关注的问题，在这里都可以找到答案，比如，腾讯人最喜欢什么编程语言，还有什么技术leader坚持写代码，腾讯开源协同进展等等，你都能在这份报告中找到答案.

人类语言各不相通，历史上第一个翻译是如何做到的？

于03-02 08:21 - -

我讲一个田野调查的故事来回答这个问题吧. 对濒临灭绝的语言进行田野调查工作并把它们记载下来的人，我通常称他们为追风者. 在明治末期，有一个学者把自己的全部人生都献给了日本唯一少数民族阿伊努族的语言研究. 在那个语言学方兴未艾的年代，几乎所有的原住民也即土著的语言都被歧视为未开化的语言，劣等语言. 在金田一京助之前虽然也有人研究过阿伊努语，但是并未成体系.

Go语言项目的安全评估技术

于11-09 00:00 - - tuicool

在今年夏天我们对 Kubernetes的评估成功之后，我们收到了大量Go项目的安全评估需求. 为此，我们将在其他编译语言中使用过的安全评估技术和策略调整适配到多个Go项目中. 我们从了解语言的设计开始，识别出开发人员可能无法完全理解语言语义特性的地方. 多数这些被误解的语义来自我们向客户报告的调查结果以及对语言本身的独立研究.

GO 工具包安装方法 - Go语言中文网 - Golang中文社区

于07-29 11:58 - -

go 安装依赖包一般会通过四种路径. 比如我们可以通过go get github.com/xxx来下载安装包. 下载好之后, 通过go install github.com/xxx来安装包. 安装包会下载到$GOPATH/src文件中. 安装后的执行文件在$GOPATH/bin文件. 当我们执行go get golang.org/x/tools/cmd/goimports会报错.

[深度]周明：自然语言处理的未来之路 | CCF-GAIR 2019

于07-14 13:52 - - 人工智能

雷锋网按：7 月 12 日-7 月 14 日，2019 第四届全球人工智能与机器人峰会（CCF-GAIR 2019）于深圳正式召开. 峰会由中国计算机学会（CCF）主办，雷锋网、香港中文大学（深圳）承办，深圳市人工智能与机器人研究院协办，得到了深圳市政府的大力指导，是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流博览盛会，旨在打造国内人工智能领域极具实力的跨界交流合作平台.

个人对全栈工程师和JVM编程语言的一些理解

于02-23 22:02 - allen - Java

我个人对全栈工程师和JVM编程语言的一些理解，大家有不同看法的，我们一起交流梳理下. 全栈工程师从我的视角来看，是熟练使用多种编程语言，满足前后端各种业务、技术需求的服务和应用开发. 因为语言都有自己的特点、独特性和应用领域，没有能解决所有问题的最佳语言，所以未来混合编程会很普遍，这对开发者也提出了更高要求，需要了解、掌握和使用多种语言.

自然语言处理最新教材开放下载，乔治亚理工大学官方推荐

于06-03 16:06 - 机器之心 -

开放地址：https://github.com/jacobeisenstein/gt-nlp-class/tree/master/notes. Eisenstein 将这一本非常完善的教材称之为「Notes」，它是在乔治亚理工大学学习自然语言处理相关领域所需要了解的基础. 例如在介绍自然语言处理理论与方法的课程 CS4650/7650 中，这本开放书籍就作为标准的课程教材.

自然语言处理领域重要论文&资源全索引

于10-14 11:51 - 刘晓坤 -

自然语言处理（NLP）是人工智能研究中极具挑战的一个分支. 随着深度学习等技术的引入，NLP 领域正在以前所未有的速度向前发展. 但对于初学者来说，这一领域目前有哪些研究和资源是必读的. 最近，Kyubyong Park 为我们整理了一份完整列表. GitHub 项目链接：https://github.com/Kyubyong/nlp_tasks.

GitHub - hankcs/HanLP: 自然语言处理中文分词词性标注命名实体识别依存句法分析关键词提取自动摘要短语提取拼音简繁转换

于08-18 14:08 - -

HanLP是由一系列模型与算法组成的Java工具包，目标是普及自然语言处理在生产环境中的应用. HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点. 基于互信息和左右信息熵的短语提取. 简繁分歧词（简体、繁体、臺灣正體、香港繁體）. 基于神经网络的高性能依存句法分析器. CoNLL UA/LA/DA评测工具.

自然语言处理某个pipeline

于08-02 17:34 - eric_weitm -

1、数据源：包括文本、pdf、数据库等不同来源. 2、使用到的库：jieba gensim sklearn keras . 3、可以实现的服务：找出相关和相近词（以分词为准）、比较2个分词的相似度、和哪些相关同时和别的不相关（语义上的模糊查找）. 数据源的load->gensim->classifier(传统基于词频的/深度学习的 keras).

如何用深度学习做自然语言处理？这里有份最佳实践清单

于07-26 14:16 - 机器之心 -

对于如何使用深度学习进行自然语言处理，本文作者 Sebastian Ruder 给出了一份详细的最佳实践清单，不仅包括与大多数 NLP 任务相关的最佳实践，还有最常见任务的最佳实践，尤其是分类、序列标注、自然语言生成和神经机器翻译. 作者对最佳实践的选择很严格，只有被证明在至少两个独立的群体中有益的实践才会入选，并且每个最佳实践作者至少给出两个参引.

自然语言处理概览

于07-04 18:10 - eric_weitm -

自然语言处理研究的是词、句、文档等几个层次的内容. 一、发展历史（前两个是理论、后一个是经验）. 1、形式语法（复杂特征集）. 2、词汇主义方法（WordNet、ConceptNet、FrameNet），人工总结和整理概念、层次、结构等 . 3、统计语言模型（语言有统计规律性，让机器去自己学习规律）.

作者：张相於，58集团算法架构师，转转搜索推荐部负责人，负责搜索、推荐以及算法相关工作. 多年来主要从事推荐系统以及机器学习，也做过计算广告、反作弊等相关工作，并热衷于探索大数据和机器学习技术在其他领域的应用实践. 责编：何永灿（[email protected]）. 《程序员》原创文章，更多精彩文章请. 个性化推荐是大数据时代不可或缺的技术，在电商、信息分发、计算广告、互联网金融等领域都起着重要的作用.

自然语言处理第一番之文本分类器

于06-18 14:05 - burness - 机器学习 NLP 深度学习 machine learning tensorflow

文本分类应该是自然语言处理中最普遍的一个应用，例如文章自动分类、邮件自动分类、垃圾邮件识别、用户情感分类等等，在生活中有很多例子，这篇文章主要从传统和深度学习两块来解释下我们如何做一个文本分类器. 传统的文本方法的主要流程是人工设计一些特征，从原始文档中提取特征，然后指定分类器如LR、SVM，训练模型对文章进行分类，比较经典的特征提取方法如频次法、tf-idf、互信息方法、N-Gram.

周明：未来5-10年，自然语言处理将走向成熟

于06-14 17:58 - 微软亚洲研究院 -

近日，微软亚洲研究院副院长周明在「自然语言处理前沿技术分享会」上，与大家讲解了自然语言处理（NLP）的最新进展，以及未来的研究方向，以下内容由CSDN记者根据周明博士的演讲内容编写，略有删减. 周明博士于1999年加入微软亚洲研究院，不久开始负责自然语言研究组. 近年来，周明博士领导研究团队与微软产品组合作开发了微软小冰（中国）、Rinna（日本）、Zo（美国）等聊天机器人系统.

为什么说Python是伟大的入门语言

于05-24 08:00 - - bigdata

作者：Elliott Hauser. 本文作者列举了一些Python特性，并认为Python是最适合入门的编程语言，一起来看一下. 最近发表了三篇关于我的艺术史背景是如何影响我教学的文章. 现在要分享一篇，为什么Python对于青少年和成年人是入门语言的最佳选择. 伟大的入门编程语言有什么特征呢. 或者换一种方式问，“当我们教他们编程时，应该给予他们什么.

自然语言处理之词性标注集

于10-29 15:52 - 标点符 - 程序开发自然语言处理

词性标注（Part-of-Speech tagging 或POS tagging)，又称词类标注或者简称标注，是指为分词结果中的每个单词标注一个正确的词性的程序，也即确定每个词是名词、动词、形容词或其他词性的过程. 实词：名词、动词、形容词、状态词、区别词、数词、量词、代词. 虚词：副词、介词、连词、助词、拟声词、叹词.

从NLP到“自然语言理解”，Facebook如何让Messenger更懂人类？

于04-21 21:43 - - 人工智能

雷锋网按：Facebook的AML和FAIR团队合作进行自然语言处理对自然语言理解进行着合作研究. 在2017年4月19日举办的F8开发者大会上，Facebook向公众介绍了他们的研究进展、自然语言理解在Facebook产品中的应用，并且介绍了平民化的自然语言理解平台CLUE，希望依靠大家的力量，继续丰富自然语言理解的应用.

自然语言处理词向量化总结

于04-04 23:52 - bicloud - 数据挖掘

distributed representation 分布式表达（一类表示方法，基于统计含义），分散式表达（从一个高维空间X映射到一个低维空间Y）分布假说(distributional hypothesis)为这一设想提供了理论基础:上下文相似的词，其语义也相似.. 自然语言处理的基础是词向量化，即文本数值化，后面进行数据挖掘工作就和常见的任务类似，即分类，聚类等等.

哪些人在Twitter上发言的语法最规范？比尔盖茨排第二

于03-01 23:21 - -

美国有个诡计的节日，叫国家语法日（National Grammar Day），可能一般人是不知道的，但Grammarly不会忘记. Grammarly是个应用，据说它真正懂英语. 大概是要庆祝国家语法日，Grammarly对Twitter上粉丝最多的50个名人最近发的150条推文进行了研究，排除了那些转发的推文，确保研究对象是这些名人自己说的.

2015年需要了解的前端框架和语言

于08-19 21:05 - techug - 业界观察

Node.js 第一，PHP 第二，JavaScript 第三. 因为Node.js的社区很多，所以这个结果你也不用太意外. 如果你知道JavaScript,你已经一只脚踏进了用Node.js来构建Web APP的可能. AngularJS 处于框架的领导地位. 大量的公司和企业已经采用 Angular，这就要求开发者更多的具备使用这个框架的技能.

有关[语言]分类推荐