更新于:10-03 23:24

最新推荐

Elasticsearch:使用 Elasticsearch 进行语义搜索

于09-28 10:18 - Elasticsearch -
在数字时代,搜索引擎在通过浏览互联网上的大量可用信息来检索数据方面发挥着重要作用. 此方法涉及用户在搜索栏中输入特定术语或短语,期望搜索引擎返回与这些确切关键字匹配的结果. 虽然关键字搜索对于简化信息检索非常有价值,但它也有其局限性. 主要缺点之一在于它对词汇匹配的依赖. 关键字搜索将查询中的每个单词视为独立的实体,通常会导致结果可能与用户的意图不完全一致.

数据库分类分级做完了,接下来怎么用

于09-26 17:24 - -
01/7    数据分类分级的难点回顾. 之前一篇文章内,我们大致讲述了近两年来在各大企业和机构内大热的数据分类分级运动的由来,以及数据分类分级的难点. 简单总结起来其困境主要来源于企业内部系统构建的个性化程度高,如基于数据字段命名并无法推测出实质数据类型(见下图所示,text1 并不能被自动识别为姓名数据);或者组合类的数据类型和业务关联度高的数据类型,无法抽象为技术可描述的确定规则,如财务数据、金融数据、快递数据这种大类的数据类型;或者一大部分的数据并不具备强规则特征,无法通过对数据内容的识别从而进行类型的分类,如用户姓名、金额数字等等.

gitlab 的CI/CD 流水线初体验

于09-25 15:57 - qinfengge - post
关于 CI/CD 的理念与解释这里就不说了,可以看 这篇文章. 为什么选择 gitlab 的流水线 #. 原因也很简单,公司的代码托管在 gitlab 上,且 gitlab 的 free 额度好像还挺高. 不选择 Jenkins的原因也很简单,UI 过时,功能虽多但占用也高. 如果是新手的话 Drone 可能也很好.

GPT-4被曝重大缺陷,35年前預言成真!所有LLM正確率都約等於0

于09-23 17:53 - 新智元 - 追蹤AI最新趨勢
最近,一项研究发现,大模型身上存在一种「逆转诅咒」,即使学会「A是B」,它们也无法推理出「B是A」. 大语言模型,竟然存在一种「逆转诅咒」. 所谓逆转,也就是说,一个训练于「A是B」的语言模型能否推广到「B是A」呢. 例如,当我们教会一个模型「乔治·华盛顿是美国第一任总统」后,它能否自动回答「谁是美国第一任总统.

k8s 自动扩缩容HPA原理及adapter配置详解

于09-22 18:00 - 蓝胖子的编程梦 -
大家好,我是蓝胖子,都知道,k8s拥有自动扩缩容机制HPA,我们能够通过配置针对不同的扩缩容场景进行自动扩缩容,往往初学者在面对其中繁多配置的时候会学了又忘记,今天我将会以一种不同的视角,结合api server 请求 来探索这部分的配置,看完本篇,应该会对扩缩容这部分配置会有更深的理解. 我们先来看一下自动扩缩容的原理,在k8s中HPA这个模块的逻辑会定时请求api server 获取相应的pod或者CRD或者其他资源的指标信息,这些指标信息是用户创建HPA的yaml配置文件时指定的.

国产大模型推理能力已超GPT-3.5!冲进OpenAI评测榜第一梯队

于09-18 16:56 - 衡宇 - 资讯 OpenAI 大语言模型 推理能力
量子位 | 公众号 QbitAI. OpenAI开源的数学数据集,中国厂商新成绩一举冲到最前列. 就在9月16日,国产大模型在权威推理评测集GSM8K中,首次达到了80%正确率,大幅领先GPT-3.5(57.1%)和LLaMA2-70B(56.8%). 而且这家厂商在大模型榜单上刷新全球纪录,已经不是第一次了.

面试官:MySQL 上亿大表,如何深度优化?

于09-18 00:00 - - dev
delete大表优化为小批量删除. 前段时间刚入职一家公司,就遇上这事. XX实例(一主一从)xxx告警中每天凌晨在报SLA报警,该报警的意思是存在一定的主从延迟(若在此时发生主从切换,需要长时间才可以完成切换,要追延迟来保证主从数据的一致性). XX实例的慢查询数量最多(执行时间超过1s的sql会被记录),XX应用那方每天晚上在做删除一个月前数据的任务.

作为穷人的几个问题

于09-13 09:44 - -
一、穷人最大的阻碍是“家学匮乏” 你是考上985、211进大厂得福报 还是黄袍加身送外卖 基本就是考试成绩决定的 而决定考试成绩的因素 除了智商以外,最重要的其实是“家学”. 有人做过统计 接近一半的高考状元都是教师家庭出身 这说明教师群体智商高 孩子遗传了爹妈的高智商 所以才考试成绩好吗. 并不见得 本质上是教师比普通人掌握了更多的“考试套路”.

【线上故障分析】深入理解缓存预热

于09-12 10:01 - 他是程序员 -
缓存不预热会导致系统接口性能下降,数据库压力增加,更重要的是导致我写了两天的复盘文档,在复盘会上被骂出了翔. 事情发生在几年前,我刚毕业时,第一次使用缓存内心很激动. 需求场景是虚拟商品页面需要向用户透出库存状态,提单时也需要校验库存状态是否可售卖. 但是由于库存状态的计算包含较复杂的业务逻辑,耗时比较高,在500ms以上.

接口使用的最佳时机 - 掘金

于09-09 16:05 - -
接口在系统设计中,以及代码重构优化中,是一个不可或缺的工具,能够帮助我们写出可扩展,可维护性更强的程序. 在本文,我们将介绍什么是接口,在此基础上,通过一个例子来介绍接口的优点. 但是接口也不是任何场景都可以随意使用的,我们会介绍接口使用的常见场景,同时也介绍了接口滥用可能带来的问题,以及一些接口滥用的特征,帮助我们及早发现接口滥用的情况.

怎样利用美剧全面提高听说读写? - 知乎

于09-06 16:30 - -
有人问我,不想应试,想踏踏实实的学习英语,提高自身水平,用于日常交际,应该怎么学?. 周围有太多的人,下载了各类英语软件,保存收藏了许多英语方法论. 他们误以为保存了这些资料,就等于自己学过了. 或者装模作样的背背单词,练练听力,就以为自己足够刻苦. 上个世纪,老一辈的英语学习者只依靠一部收音机,一本英语书,靠自己摸索,终成为一代大家.

『DevOps 最佳实践』 — DevOps 实践

于09-05 09:38 - -
Culture – 文化:公司各个角色一起担当业务变化,实现有效协作和沟通;. Automation – 自动化:在价值链中尽量除去手工步骤;. Lean – 精益:运用精益原则更频繁地交付价值;. Metrics – 度量:度量并使用数据来优化交付周期;. Sharing – 分享:分享成功和失败的经验来相互学习.

每个人每天都只有24小时,希望我的选择真的是我的选择 | 枫言枫语

于09-04 22:30 - -
这些变化一般被宣传为蓬勃的,积极的,向上的,比如科技日新月异,经济崛起腾飞,等等诸如此类. 但对个体而言,这些变化也是一种挑战. 通过各国多年间的贸易往来、资本互通、人口流动和知识传播,这些变化深刻影响了几乎所有国家的经济、政治与文化. 中国改革开放还没不到50年,大家想必对“全球化”的体会更为深切.

一份线下实体店选址指南

于09-04 11:04 - -
如何选择一个靠谱的位置!一共分为9个板块来讲解:​. 开店要赚钱,需要成功的选址,而选址就要抓住四个要素,即城市、商圈、街道、店址. 所谓商圈,就是指城市中居民、上班的人群购物或活动,且人流量较大,商店集中扎堆的地段或区域. 一般而言,商圈可分为大商圈和小商圈,大商圈的繁华程度主要是依靠集客设施(后面详细讲解集客设施)的聚客能力,人流越大则其聚客能力越强,聚客力磁场越强则覆盖商圈范围的商业面积越大.

全球18位最伟大的投资家之交易思想 - 币圈暴富宝典

于09-03 21:37 - -
伯纳德·巴鲁克(Bernard Baruch). 享年94岁(1870年8月19日-1965年6月20日) ●经历了美国1929年股灾仍能积累几千万美元财富的大投资家 一位具有传奇色彩的风险投资家,一位曾经征服了华尔街,后又征服了华盛顿的最著名、最受人敬慕的人物. 1897年以300美元做风险投资起家,32岁积累了320万元的财富,经历1929-1933年经济大萧条之后,仍能积累起几千万美元的财富.

食品配料表与营养成分表科普

于09-02 16:34 - -
上次推文给大家介绍了一下“运动饮料”的成分,发现还是非常有必要给推友们科普一下如何看配料表与营养成分表,以免选择更适合自己的食品,避免踩坑. 食品配料,是指在食品的加工或制造过程中使用的,并在产品中存在的任何物质,包括食品添加剂. 我们在选择食品时,可以遵循以下三个原则以及关注六个细节: 原则一:根据法规,各种配料应按制造或加工食品时,加入量的递减顺序排列,加入量不超过2%的配料可以不按递减顺序排列.

优秀英语教材的选择 - 知乎

于09-01 10:36 - -
本人是个学生,依照自己学习英语的经历发表一些浅见. 请各位不要将以下内容做商业用途. 1、在我看来,简单地评判一本英语教材是否优秀,可以观察以下几点:1. 是否是英美出版社出版(或英美引进). 1:CEFR是最重要的欧洲各语言标准,分为A1-C2六个等级,若不清楚可以上网查一下. 教材若没有明确指出,则教材要么落伍20年以上,要么就不符合常规的CEFR大纲的英语教学,对于一般学生来说不选为妙.

广州公交地铁新优惠方案9月起实施:满80元8折满200元5折

于09-01 08:45 - -
8月25日,广州地铁集团与广州公交集团联合发布了《关于实施的公告》(下称公告). 据公告显示,《广州市公共交通票价优惠调整方案》(下称《方案》)已按照《广州市公共交通票价优惠管理办法》有关规定完成相关工作流程,将于2023年9月1日起正式实施. 记者了解到,《方案》中有“两不变两增加”,其中,现有基础票价不变,针对老人、学生、残疾人等特殊群体的公共交通优惠政策亦保持不变;同时,新增了两个方面的票价优惠政策,包括低收入居民(最低生活保障对象、最低生活保障边缘家庭成员、特困供养人员)享受半价优惠,公共交通乘车码纳入优惠实施范围,使得优惠人群覆盖范围扩大.

从输入URL到页面展示过程:深入解析网络请求与渲染

于08-31 09:33 - desc -
项目实战:AI文本 OCR识别最佳实践. AI Gamma一键生成PPT工具直达链接. 玩转cloud Studio 在线编码神器. 玩转 GPU AI绘画、AI讲话、翻译,GPU点亮AI想象空间. 史上最全文档AI绘画stablediffusion资料分享. AI绘画关于SD,MJ,GPT,SDXL百科全书.

1句指令+5美元+20分钟,就能训练出小型专业模型,Prompt2Model了解一下

于08-31 17:10 - 机器之心 -
大规模语言模型(LLM)使用户可以借助提示和上下文学习来构建强大的自然语言处理系统. 然而,从另一角度来看,LLM 在特定自然语言处理任务上表现存在一定退步:这些模型的部署需要大量计算资源,并且通过 API 与模型进行交互可能引发潜在的隐私问题. 为了应对这些问题,来自卡内基梅隆大学(CMU)和清华大学的研究人员,共同推出了 Prompt2Model 框架.

12项性能位居第一,中国最接近GPT-4的大模型来了!现已全面开放服务!

于08-31 17:32 - 十三 - 资讯 首页轮播 GPT-4 商汤科技 商量
量子位 | 公众号 QbitAI. 中国何时会有一个大模型,能以极强的泛化能力,创建各种智能体、成为人类真正的助手. 在各大科技公司卷了半年的生成式AI热潮趋于冷静期的当下,这是一个极其值得思考的问题. 很多人会说,目前可能只有被称为业界标杆的GPT-4才能胜任,甚至对它加以“唯一”这样的头衔. 而与此同时,着眼于国内,即使这半年来各个大模型玩家争先恐后抢着落地,但“需要两到三年才能追赶GPT-4”的声音也是甚上尘嚣.

Node.js 内存溢出OOM分析

于08-23 19:35 - -
Node.js 内存飙涨以及 OOM 的问题,只要业务流量稍微复杂,一般都会遇到. 如果是堆内内存,在 OOM 之前可以打一个 Heap Profiling 进行分析,如果是 OOM 之后,可以利用 llnode 对 corefile 进行分析,但如果是堆外内存飙涨呢. 这一块内存通过 Chrome Devtool 工具是分析不出来的.

如何取得杰出成就

于08-20 22:36 - -
文/Paul Graham | 译/f.chen. Paul Graham 终于发布了他准备了半年之久的文章《如何取得杰出成就》,这篇两万多字的长文是我读过的最实用的工作指南之一. 另外,注脚也十分值得一读 ——为了正文阅读的连贯性,我放弃了将它们逐一插入对应段落,但这 29 个注脚金句频出,与正文一样精彩.

Blog: 考虑所有微服务的脆弱性并对其行为进行监控

于01-20 08:00 - -
作者:David Hadas (IBM Research Labs). 译者:Wilson Wu (DaoCloud). 本文对 DevOps 产生的错误安全意识做出提醒. 开发和配置微服务时遵循安全最佳实践并不能让微服务不易被攻击. 本文说明,即使所有已部署的微服务都容易被攻击,但仍然可以采取很多措施来确保微服务不被利用.

观点 | LibreOffice 和 OpenOffice 的相似与不同之处

于08-10 14:39 - [email protected] (linux) - 观点
对两个最受欢迎的开源办公软件的比较. 了解 LibreOffice 和 OpenOffice 之间的相似与不同之处. LibreOffice 与 OpenOffice 是两个流行的微软办公套件的  开源替代品. 如果你正在寻找一个具备文字处理、电子表格、演示和其他几个程序的开源办公套件,那么这两个办公软件都可以推荐.

美国的芯片制造复兴成功了吗?

于08-10 00:13 - -
美国政府去年通过了《芯片法案》(Chips Act),旨在通过补贴等措施将先进芯片制造带回美国. 自 2020 年以来,芯片制造商宣布了逾 2000 亿美元的投资. 如果一切顺利,到 2025 年美国在尖端芯片制造的份额将达到 18%. 台积电投资 400 亿美元在亚利桑那州造两座芯片厂,三星在德州投资 170 亿美元,英特尔投资 400 亿美元造四座芯片厂.

[OpenAI] 本人在 AIGC 这个赛道待了几个月,对于国内这块市场创业方面的情况,今天有时间简单概括一下。

于08-10 00:52 - jameswhite -
一开始二月份左右,首批赚钱的是靠卖 GPT 提问次数. 起初,这个市场就是赚好奇心的钱,但现在情况是门槛降低了,到处都是套壳产品,GitHub 上有十几个开源项目可供使用,热度也降低了. 然后是卖教程和信息差,赚 FOMO ( fear of missing out )焦虑的钱. 随着时间的推移,这些教材内容被互相转载,现在全部免费了,能够割韭菜的机会已经差不多被利用完了.

Businessinsider:研究表明美国大多数电动车充电费用比油车加油还贵

于08-03 19:57 - 翠花 - 新能源汽车产业 汽车行业 公共场所充电费用 美国电动车主充电费用
据Businessinsider报道,安德森经济集团发布的一份研究显示, 目前北美市场中,许多电动汽车充电成本,仍高于他们给油车加油的成本. 研究指出,关于充电和加油的费用,不同的车型有不同的结果. 对卡车来说,加油和充电成本接近;而对于入门级的中档轿车和SUV来说,在家充或公共场所充电的费用,都高于加油的费用;豪华车和SUV则介于两者之间,如果在家充电,可能比加油便宜,但如果在公共场所充电,则要比加油贵一些.

apiserver 中的webhook开发教程

于08-03 20:48 - admin - 程序开发 k8s webhook
准入控制器 是一段代码,它会在请求通过 认证和 鉴权之后、对象被持久化之前拦截到达 API 服务器的请求. 准入控制器可以执行 变更(Mutating) 和或 验证(Validating) 操作. 变更(mutating)控制器可以根据被其接受的请求更改相关对象;验证(validating)控制器则不行.

Stable Diffusion 模型技术架构与原理

于07-31 20:08 - Yanjun - 人工智能 Stable Diffusion
Stable Diffusion 是一个文本到图像(txt2img)的潜在扩散模型(LDM),是由 CompVis、Stability AI 和 LAION 的研究人员实现并开源的. 我们站在 Stable Diffusion 模型应用用户的角度来看,其实没有多么复杂,核心就是根据文本生成图像,其中可以通过一些技巧或者说调整用户参数,来改变文本生成图像的过程,从而达到优化最终生成图像的目的.