更新于:04-06 09:44

有关[技术]标签推荐

抖音推荐机制与算法的研究

于05-13 18:58 - 钱魏Way - 数据 术→技巧 营销 抖音 推荐算法
最近公司的部分运营工作涉及到的抖音短视频的宣传. 为了达到更好的效果,于是对抖音的推荐机制进行了简单的整理和研究. 通过数据的分析,我们发现在传播效果方面,抖音>小红书>微信朋友圈>新浪微博. 究其原因是内容分发的逻辑存在非常大的差异. 微信朋友圈、新浪微博:订阅模式,用户仅能看到好友或关注者的信息.

知名网站热门排序算法分析

于04-15 19:19 - 钱魏Way - 产品 术→技巧 研发 排序算法
很多内容网站都会根据用户的交互信息等对内容进行排序. 这里整理了一些比较知名的内容网站的排序规则,每个网站都有不同,在此过程中,我们不仅仅要了解其排序规则(公式),更多的期望了解公式背后的逻辑. Hacker News 是一家关于计算机黑客和创业公司的社会化新闻网站,由 Paul Graham 的创业孵化器 Y Combinator 创建.

Vue 3 组件开发:搭建基于SpreadJS的表格编辑系统(环境搭建)

于04-12 11:16 - 葡萄城技术团队 - 前端 葡萄城开发技术 vue.js spreadjs vite
Vue是一套用于构建用户界面的渐进式框架,与其它大型 JS 框架不同,Vue 被设计为可以自底向上逐层应用,更易上手,还便于与第三方库或既有项目整合,因此,Vue完全能够为复杂的单页应用提供驱动. 2020年09月18日,Vue.js 3.0 正式发布,作者尤雨溪将其描述为:更快、更小、更易于维护.

Optuna自动调参使用指南

于02-22 19:03 - 钱魏Way - 数据 术→技巧 lightgbm 超参数
在日常工作中用到的比较多的还是树回归模型,由于LightGBM不需要的类别数据进行预处理所以用得特别多,中间涉及到超参数优化时通常使用随机参数优化方法. 在 算法模型自动超参数优化方法中有提到了Optuna,平时工作中也会使用到,今天主要对如何使用Optuna进行整理. Optuna是一种机器学习自动超参优化框架,前支持的模型:.

风险控制:信用评分卡模型

于01-27 20:13 - 钱魏Way - 器→工具 开源项目 数据 术→技巧 机器学习
评分卡模型又叫做信用评分卡模型,最早由美国信用评分巨头FICO公司于20世纪60年代推出,在信用风险评估以及金融风险控制领域中广泛使用. 银行利用评分卡模型对客户的信用历史数据的多个特征进行打分,得到不同等级的信用评分,从而判断客户的优质程度,据此决定是否准予授信以及授信的额度和利率. 相较资深从业人员依靠自身的经验设置的专家规则,评分卡模型的使用具有很明显的优点:.

浅谈Forrester零信任架构评估的7个技术维度

于06-08 14:10 - Doraemon - 网络安全 Forrester 技术维度 零信任
零信任是由Forrester Research的分析师John Kindervag在2009开发,并在2010年正式提出的. 在过去的10年间,随着云计算、移动互联等技术发展以及全球范围内部威胁的不断涌现,零信任越来越为产业界所接受. Google从2011年开始探索和实践零信任,并在2014年发表了BeyondCorp系列研究论文,成为零信任大规模实施的典范.

技术面试中,什么样的问题才是好问题?

于02-12 15:38 - 四火 - Hiring and Interview Recommended 候选人 技术 问题
其实很久以前就想谈一谈这个话题了,但是最近才有了足够的动机. 因为从最近参加的很多 debrief 来看,我认为身边大多数的软件工程师面试中,在通过技术问题来考察候选人这方面,很多都做得不够好. 比方说,我看到对于一些经验丰富的软件工程师候选人的面试,一些面试官依然是草率地扔出一道算法题让做了事,并且认为能不能够比较清晰完整地将代码写出来,是工程师级别裁定的最重要的标准.

乐心医疗的 Kubernetes 云平台建设实践

于11-15 15:44 - UCloud技术市场团队 - 技术分享
Kubernetes 自 2014 年被 Google 开源以来,很快便成为了容器编排领域的标准. 因其支持自动化部署、大规模可伸缩和容器化管理等天然优势,已经被广泛接纳. 但由于 Kubernetes 本身的复杂性,也让很多企业的 Kubernetes 探索之路充满挑战. 从最初的自建 Kubernetes 到后来迁移至 UK8S 平台,整个过程遇到了哪些问题并如何解决的呢.

实时计算框架 Flink 在教育行业的应用实践

于10-12 14:56 - UCloud技术市场团队 - 技术分享
如今,越来越多的业务场景要求 OLTP 系统能及时得到业务数据计算、分析后的结果,这就需要实时的流式计算如 Flink 等来保障. 例如,在 TB 级别数据量的数据库中,通过 SQL 语句或相关 API 直接对原始数据进行大规模关联、聚合操作,是无法做到在极短的时间内通过接口反馈到前端进行展示的. 若想实现大规模数据的 “即席查询”,就须用实时计算框架构建实时数仓来实现.

HTTP的前世今生

于10-01 19:21 - 陈皓 - 技术读物 程序设计 系统架构 网络安全 HTTP
HTTP (Hypertext transfer protocol) 翻译成中文是超文本传输协议,是互联网上重要的一个协议,由欧洲核子研究委员会CERN的英国工程师 Tim Berners-Lee v发明的,同时,他也是WWW的发明人,最初的主要是用于传递通过HTML封装过的数据. 0.9和1.0这两个版本,就是最传统的 request – response的模式了,HTTP 0.9版本的协议简单到极点,请求时,不支持请求头,只支持 GET 方法,没了.

HTTPS劫持研究

于08-10 13:00 - Kriston - 网络安全 HTTPS劫持 技术研究 电信
这篇文章描述了我们对哈萨克斯坦政府实施的电信级HTTPS劫持的分析. 哈萨克斯坦政府最近开始使用一个假的根证书颁发机构,对包括Facebook,Twitter和Google等网站在内的HTTPS连接进行中间人(MitM)攻击,在此文中,我们给出了还在进行中的研究的初步结果,以及哈萨克劫持系统中新的技术细节.

四大模块,带你了解阿里大数据产品技术架构

于04-22 19:21 - 华仔 - 产品设计 3年 中级 产品技术架构 大数据
本文笔者将从数据采集层、数据计算层、数据服务层、数据应用层四大层次来带大家了解阿里大数据的产品技术架构. 2014年,马云提出:“人类正从IT时代走向DT时代”. 如果说在IT时代是以自我控制、自我管理为主,那么到了DT (Data Technology)时代,则是以服务大众、激发生产力为主. 以互联网(或者物联网)、云计算、大数据和人工智能为代表的新技术革命正在渗透至各行各业,悄悄地改变着我们的生活.

十大常用软件架构模式简介

于04-18 22:15 - HuihuangZhang - IT技术 其他
大型的企业级系统是如何设计的呢. 大型软件开发前,我们必须选择一种合适的架构,它既要提供我们想要的功能,质量也要过关. 因此,在应用不同的架构之前,我们有必要熟悉一下这些架构. 针对软件架构中给定上下文的常见问题,架构模式是一种通用的、可复用的解决方案. 它与软件设计模式相似,但范围更广. 在这篇文章中,我将简要地说明一下10种常用的架构模式,以及它们的用法和利弊.

用户端智能的应用实践

于03-25 12:06 - bang - 技术文章
去年团队在用户端上进行了一些简单的智能应用探索实践,这里记录梳理下. 现在很多“智能”,是普通推荐算法借深度学习的风包装的,核心也就是决策树/随机森林/SVM这些90年代已经提出的算法,我们这里的实践也是这样. 在用户端上,智能应用最广泛的目前两个点:个性化和多媒体识别,我们主要实践是在个性化上,从原来所有用户都用同一套或几套规则,换成根据推荐算法给每个用户制定符合他个性化特征的不同规则.

微软变了!招程序员的流程完全改了

于01-05 19:42 - 伯小乐 - 职场 微软 技术面试 面试
【伯乐在线导读】:在微软新 CEO 萨蒂亚·纳德拉的领导下,微软试图改革公司文化,让整个公司朝着同一个方向发展. 为此,微软在 2016 年开始研究「替代面试框架(Alternative Interview Framework)」. 这是一种在开发部门进行面试的新方式,目的是减少偏见,更好地测试求职者在工作中实际需要的技能.

AI产品再出发:给产品和CEO们的建议!

于12-23 11:26 - LineLian - 产品经理 3年 AI技术 中级 用户画像构建
基于用户画像的商品和服务能够提升平台服务体验并促进服务的个性化、精准化实现,本篇文章为大家详细地讲解了如何运用AI技术构建用户画像. 在帮独角兽企业做产品咨询顾问工作的过程中,多有CEO说:“诗路我要买数据,哪里有卖数据的,我想用我2千万用户的手机号去碰撞数据”. 我常问您要用手机号碰撞数据,碰撞出来的用户偏好还是第三方的,也不是您平台的用户行为,更不能在你的场景业务形成交易落地.

让SpringBoot启动更快一点

于11-21 22:10 - 唐尤华 - 基础技术 springboot
这是 2018 Spring One Platform 中的一场会议. 看完会议视频,我自己动手试了一下. 还没有观看视频的朋友推荐看一下,非常有意思. ↓我使用的是 OpenJDK 11. ❯ java --version openjdk 11.0.1 2018-10-16 OpenJDK Runtime Environment 18.9 (build 11.0.1+13) OpenJDK 64-Bit Server VM 18.9 (build 11.0.1+13, mixed mode).

使用Thread Pool不当引发的死锁

于10-23 17:18 - 一杯哈希不加盐 - 基础技术 多线程 死锁 线程池
多线程锁定同一资源会造成死锁. 线程池中的任务使用当前线程池也可能出现死锁. RxJava 或 Reactor 等现代流行库也可能出现死锁. 死锁是两个或多个线程互相等待对方所拥有的资源的情形. 举个例子,线程 A 等待 lock1,lock1 当前由线程 B 锁住,然而线程 B 也在等待由线程 A 锁住的 lock2.

Redis基础、高级特性与性能调优

于10-16 15:52 - (●'◡'●) - IT技术 Redis
本文将从Redis的基本特性入手,通过讲述Redis的数据结构和主要命令对Redis的基本能力进行直观介绍. 之后概览Redis提供的高级能力,并在部署、维护、性能调优等多个方面进行更深入的介绍和指导. 本文适合使用Redis的普通开发人员,以及对Redis进行选型、架构设计和性能调优的架构设计人员.

Redis 的 KEYS 命令引起 RDS 数据库雪崩,宕机 2 次,造成几百万损失

于09-22 22:23 - 伯小乐 - IT技术 Redis
最近的互联网线上事故发生比较频繁, 9月19日网上爆料出顺丰近期发生了一起线上删库事件,在这里就不介绍了. 在这里讲述一下最近发生在我公司的事故,以及如何避免,并且如何处理优化. 该宕机的直接原因是使用 Redis 的 . keys * 命令引起的,一共造成了某个服务化项目的两次宕机. 间接原因还有很多,技术跟不上业务的发展,由每日百万量到千万级是一个大的跨进,公司对于系统优化的处理优先级不高,技术开发人手的短缺.

Java 内存溢出排查

于09-17 09:55 - TiuVe2 - 基础技术 内存管理 排错
Java OOM 毫无疑问是开发人员常见并且及其痛恨的问题,但是任何服务的开发都没法避免 OOM. 因此,OOM 的排查及定位是每个 Java 工程师都必备的技能. 在使用 scala 开发的一个 web 服务,在用户使用中,经常出现:  java.lang.OutOfMemoryError: Java heap space .

前端异常监控解决方案研究

于09-13 19:00 - frustigor - 技术研发 前端异常 前端监控 异常监控
前端监控包括行为监控、 异常监控、性能监控等,本文主要讨论异常监控. 对于前端而言,和后端处于同一个监控系统中,前端有自己的监控方案,后端也有自己等监控方案,但两者并不分离,因为一个用户在操作应用过程中如果出现异常,有可能是前端引起,也有可能是后端引起,需要有一个机制,将前后端串联起来,使监控本身统一于监控系统.

图像主题色提取算法

于09-12 17:32 - 恒心 - IT技术 算法
许多从自然场景中拍摄的图像,其色彩分布上会给人一种和谐、一致的感觉;反过来,在许多界面设计应用中,我们也希望选择的颜色可以达到这样的效果,但对一般人来说却并不那么容易,这属于色彩心理学的范畴(当然不是指某些伪神棍所谓的那种). 从彩色图像中提取其中的主题颜色,不仅可以用于色彩设计(参考网站: Design Seeds),也可用于图像分类、搜索、识别等,本文分别总结并实现图像主题颜色提取的几种算法,包括颜色量化法(Color Quantization)、聚类(Clustering)和颜色建模的方法(颜色建模法仅作总结),源码可见: GitHub: ImageColorTheme.

Linux 查看进程消耗内存情况总结

于09-10 22:07 - TiuVe2 - 基础技术 Linux 内存管理
在Linux中,有很多命令或工具查看内存使用情况,今天我们来看看如何查看进程消耗、占用的内存情况,Linux的内存管理和相关概念要比Windows复杂一些. 在此之前,我们需要了解一下Linux系统下面有关内存的专用名词和专业术语概念: . 物理内存:就是系统硬件提供的内存大小,是真正的内存,一般叫做内存条.

闲聊 Flutter

于08-27 12:10 - bang - 技术文章
移动端开发从08年开始就有个大家前赴后继不断追求的目标:跨平台,15年时 nwind 有篇 雄文,详细调研了跨平台各流派,其中最后的 Dart 栏可以看到现在 Flutter 的雏形. 可以看出来,Flutter 是从精简浏览器的思路演化过来的,实际上 web 与 Flutter 从底层看是一致的,web 是提供了一层平台无关的独立引擎,可以看成平台只提供了画布,所有的UI组件、框架、事件处理都是 web 引擎封装处理.

在 Linux 上用 DNS 实现简单的负载均衡

于06-25 22:02 - 十七树 - IT技术 Linux
DNS 轮询将多个服务器映射到同一个主机名,并没有为这里展示的魔法做更多的工作. 如果你的后端服务器是由多台服务器构成的,比如集群化或者镜像的 Web 或者文件服务器,通过负载均衡器提供了单一的入口点. 业务繁忙的大型电商在高端负载均衡器上花费了大量的资金,用它来执行各种各样的任务:代理、缓存、状况检查、SSL 处理、可配置的优先级、流量整形等很多任务.

程序员练级攻略(2018) 与我的专栏

于05-29 12:38 - 陈皓 - 技术读物 杂项资源 C++ Java Javascript
写极客时间8个月了,我的专栏现在有一定的积累了,今天想自己推荐一下. 因为最新的系列《程序员练级攻略(2018)版》正在连载中,而且文章积累量到了我也有比较足的自信向大家推荐我的这个专栏了. 推荐就从最新的这一系统的文章开始. 2011年,我在 CoolShell 上发表了 《 程序员技术练级攻略》一文,得到了很多人的好评(转载的不算,在我的网站上都有近1000W的访问量了).

Service Mesh 及其主流开源实现解析

于05-16 19:56 - TiuVe2 - 基础技术 service mesh
什么是 Service mesh. Service Mesh 直译过来是  服务网格,目的是解决系统架构微服务化后的服务间通信和治理问题. 服务网格由 sidecar 节点组成. 在介绍 service mesh 之前,我们先来看一下什么是 sidecar.. Sidecar 在软件系统架构中特指 边车模式.

spring-cloud服务网关中的Timeout设置

于04-28 11:15 - TiuVe2 - 基础技术 Spring Cloud timeout
大家在初次使用spring-cloud的gateway的时候,肯定会被里面各种的Timeout搞得晕头转向. hytrix有设置,ribbon也有. 我们一开始也是乱设一桶,Github上各种项目里也没几个设置正确的. 对Timeout的研究源于一次log中的warning. The Hystrix timeout of 60000 ms for the command “foo” is set lower than the combination of the Ribbon read and connect timeout, 200000ms..

spring-cloud中zuul的两种隔离机制实验

于04-22 19:09 - TiuVe2 - 基础技术 Spring Cloud zuul
ZuulException REJECTED_SEMAPHORE_EXECUTION 是一个最近在性能测试中经常遇到的异常. 查询资料发现是因为zuul默认每个路由直接用信号量做隔离,并且默认值是100,也就是当一个路由请求的信号量高于100那么就拒绝服务了,返回500. 既然默认值太小,那么就在gateway的配置提高各个路由的信号量再实验.