更新于:12-15 23:30

有关[系统]分类推荐

Lektor —— 静态内容管理系统

于12-15 07:14 - wzyboy -
尝试了一下 Lektor 这个静态内容管理系统,觉得挺好用的,于是把博客从 WordPress 迁移到了 Lektor. 本博客的历史可以追溯到 2009 年,至今已经 8 年,一直都是使用 WordPress 作为博客软件. 头几年写博客热情高涨,比较高产,而近几年由于种种原因,已经很少写博客了,最近两年基本是一年一更的节奏.

推03,最最最简单的推荐系统是什么样的 | 附Spark实践案例

于12-15 23:37 - -
接前面这篇《 推02,就算是非技术人员也都有必要了解的一些推荐系统常识》,之前的开篇01/02,其实都是以理论、场景化,概念进行铺垫的,让大伙儿大概知道推荐系统是怎么回事,从这篇开始,照顾一下技术的童鞋,我们开始回归到技术层面,并且 附上代码案例(见后面部分). 当然,依然是入门级,高高高手可以绕路.

推荐系统之用户行为分析

于12-14 00:00 - - dev
基于用户行为的推荐,在学术界名为协同过滤算法. 协同过滤就是指用户可以齐心协力,通过不断地和网站互动,使 自己的推荐列表能够不断过滤掉自己不感兴趣的物品,从而越来越满足自己的需求. 用户行为在个性化推荐系统中一般分两种——显性反馈行为(explicit feedback)和隐性反馈 行为(implicit feedback).

为什么选择Zephyr操作系统开发物联网产品?HereO、CommSolid和Grush有话说

于12-13 07:42 - 奇评测 - 专栏 Zephyr操作系统 物联网
万物联网时代,物联网设备以百花齐放的态势涌向市场,让众多用户体验到互联所带来的智能体验. 物联网设备也以开发成本低、开发周期短吸引了一波创业者的目光,从而造就了当前物联网市场百家争鸣的热闹格局. 除了硬件设计,摆在创业者面前最直接的问题就是:如何为自己的物联网设备选择一款合适的操作系统. 操作系统对于物联网设备而言,与互联网中的Windows同等重要.

[转]万亿级调用系统:微信序列号生成器架构设计及演变

于12-09 08:45 - wzzfeitian -
“每天万亿级调用的重量级系统,每次申请序列号平时调用耗时1ms,99.9%的调用耗时小于3ms,服务部署于数百台4核CPU服务器上. 曾钦松,微信高级工程师,目前负责微信后台基础服务、朋友圈后台等开发优化,致力于高可用高性能后台系统的设计与研发. 2011年毕业于西安电子科技大学,早先曾在腾讯搜搜从事检索架构、分布式数据库方面的工作.

利用python打造自己的人脸识别系统 - 简书

于12-04 13:39 - -
正像著名物理学家,理查德•费曼说的一样,如果要真正理解一个东西,我们必须要能够把它创造出来. 动手去做,永远比被动地听有用,我就是这么想并这么实践的. 本文介绍了我自己动手做的一种基于卷积神经网络的人脸识别系统,以python为语言基础,综合应用了keras、opencv、numpy、sklearn等多种技术.

持续更新,微信公众号文章批量采集系统的构建

于11-27 03:08 - -
我从2014年就开始做微信公众号内容的批量采集,最开始的目的是为了做一个html5的垃圾内容网站. 当时垃圾站采集到的微信公众号的内容很容易在公众号里面传播. 当时批量采集特别好做,采集入口是公众号的历史消息页. 这个入口到现在也是一样,只不过越来越难采集了. 采集的方式也更新换代了好多个版本. 后来在2015年html5垃圾站不做了,转向将采集目标定位在本地新闻资讯类公众号,前端显示做成了app.

基于分布式环境下限流系统的设计

于11-18 03:00 - - Redis 流控
就拿前些天的双十一的 “抢券活动” 来说,一般是设置整点开始抢的,你想想,淘宝的用户群体非常大,可以达到亿级别,而服务接口每秒能处理的量是有限的,那么这个时候问题就会出现,我们如何通过程序来控制用户抢券呢,于是就必须加上这个限流功能了. 1、服务接口所能提供的服务上限(limit)假如是 500次/s.

分布式架构系统生成全局唯一序列号的一个思路

于11-18 00:00 - - dev
作者简介  丁宜人,10年java开发经验. 携程技术中心基础业务研发部用户中心资深java工程师,负责携程账号的基础服务和相关框架组件研发. 之前在惠普公司供职6年,负责消息中间件产品研发. 分布式架构下,唯一序列号生成是我们在设计一个系统,尤其是数据库使用分库分表的时候常常会遇见的问题. 当分成若干个sharding表后,如何能够快速拿到一个唯一序列号,是经常遇到的问题.

基于Redis的限流系统的设计

于11-18 01:51 - -
基于Redis的限流系统的设计,主要会谈及限流系统中. 限流策略这个功能的设计;在实现方面,算法使用的是. 令牌桶算法来,访问Redis使用lua脚本. rate limiting is used to control the rate of traffic sent or received by a network interface controller and is used to prevent DoS attacks.

Oryx 推荐系统初体验 | Eric's Blog

于11-16 09:08 - -
Oryx 的前身叫 Myrrix,后来被 Cloudera 收购改了这个名字. 值得一提的是 Oryx 的维护者就是 Mahout 的主要贡献者——. Sean OwenOryx开源项目旨在提供实时的大规模机器学习/预测分析基础框架目前它实现了一列工程应用常用到的机器学习算法:协同过滤,分类/回归以及聚类.

想学习推荐系统,如何从小白成为高手? - 知乎

于11-16 01:35 - -
同在学习推荐算法,大概介绍一下我自己规划的推荐算法学习轨迹(还在慢慢实践中,好长时间了,捂脸...). 首先,看完了推荐系统实战的话,应该大概了解了大部分的推荐算法. 那我觉得看完了书,应该有必要再从宏观上再来了解一下推荐系统这个研究领域的研究现状,包括研究领域目前有的挑战,比如冷启动问题,大规模矩阵分解问题,增量模型计算问题等等,包括目前热门的研究方向,比如基于LBS、社交网络等等的推荐.

基于Kafka Streams构建广告消耗预测系统

于11-10 00:00 - - bigdata
Pinterest 广告工程团队的宗旨是为我们的广告合作商提供最优质的服务体验,而广告超投,是我们极力要解决的问题之一. 在Pinterest,我们使用了 Kafka Streams ,可以实现把广告消耗的预测数据在数秒钟的时间内发送给数千个广告投放服务. 本文将会先解释什么是超投,然后分享一下我们是如何使用 Kafka Streams 构造预测系统来提供近实时的预测消耗数据、从而降低超投的.

<转>推荐系统原理介绍-用户画像简介 - CSDN博客

于11-07 13:20 - -
最近在做推荐系统,在项目组内做了一个分享. 今天有些时间,就将逻辑梳理一遍,将ppt内容用文字沉淀下来,便于接下来对推荐系统的进一步研究. 推荐系统确实是极度复杂,要走的路还很长. 为什么需要推荐系统——信息过载. 随着互联网行业的井喷式发展,获取信息的方式越来越多,人们从主动获取信息逐渐变成了被动接受信息,信息量也在以几何倍数式爆发增长.

聊聊高并发长连接架构:百万在线的美拍直播弹幕系统如何实现

于11-07 00:21 - -
导读:直播弹幕是直播系统的核心功能之一. 如何迅速作出一个有很好扩展性的弹幕系统. 相信很多工程师/架构师都有自己的想法. 本文作者是美拍的架构师,经历了直播弹幕从无到有,从小到大的过程. 本文是作者对构建弹幕系统的经验总结. 王静波,毕业于西安交通大学,曾任职于网易和新浪微博,微博工作期间负责开放平台业务和技术体系建设.

一个完整推荐系统的设计实现-以百度关键词搜索推荐为例

于09-17 14:42 - admin - 产品 推荐系统 搜索引擎 数据挖掘 机器学习
在之前一篇博文中, 有同学在评论中问了个问题: 如何解决因式分解带来的推荐冷门,热门关键词的问题. 在回答这个问题的时候, 想到了近几年在做搜索推荐系统的过程中, 学术界和工业界的一些区别. 正好最近正在做技术规划, 于是写偏文章说下工业界完整推荐系统的设计. 结论是: 没有某种算法能够完全解决问题, 多重算法+交互设计, 才能解决特定场景的需求.

Prometheus 和 Grafana 监控系统指南

于11-21 18:28 - Bruce Dou - 架构研究 Docker Grafana Kubernetes Monitoring
Prometheus 是源于 Google Borgmon 的一个开源监控系统,用 Golang 开发. Prometheus 基本原理是通过 HTTP 协议周期性抓取被监控组件的状态,这样做的好处是任意组件只要提供 HTTP 接口就可以接入监控系统,不需要任何 SDK 或者其他的集成过程. 这样做非常适合虚拟化环境比如 VM 或者 Docker.

22家顶级银行和金融科技公司R3开发了一套区块链支付系统

于10-31 10:13 - 露天 - 资讯编译
【TechWeb报道】10月31日消息,据路透社报道,金融科技公司R3今日宣布,该公司和全球22家大银行共同开发了一套国际支付系统,该系统将允许现有的央行货币和任何新数字货币通过区块链进行交易. 区块链最初作为支持比特币的架构,它是一种共享数据库,可以实时更新信息,并能在几分钟内使用计算机算法处理和结算交易,无需第三方验证.

九个问题,搞清楚Facebook的广告系统是如何运作的

于10-17 04:39 - -
根据国外的科技媒体报道,谷歌和 Facebook 几乎合占全球数字广告市场的半壁江山. 谷歌自是不消多说,它的搜索引擎业务有着极为庞大的用户群体,依靠搜索广告和与网页内容相关的广告,它被称为新时代的“印钞机”. 但是,Facebook 则不相同,它是一个社交媒体网络服务平台,虽然用户众多,但在它的应用场景中,广告变现并不占优势.

Serverless实战:打造个人阅读追踪系统 – ThoughtWorks洞见

于09-30 02:35 - -
阅读习惯和个人知识管理体系. 进入互联网时代,知识的获取成本变得前所未有的低廉,但是无论再好的知识,若是没有对个人产生价值的话,那也只不过是一种信息噪音而已. 我在《个人知识管理:知识的三种形态》这篇文章中使用“材料 -> 资料 -> 知识”这样的路径来诠释信息的流通,如何方便快捷并且有效地收集材料,再将其整理转化为有价值的个人知识体系结构,在这个信息极度碎片化的时代变得尤为重要.

聊聊高并发系统之限流特技

于09-29 06:46 - wb284551926 -
在开发高并发系统时有三把利器用来保护系统:缓存、降级和限流. 缓存的目的是提升系统访问速度和增大系统能处理的容量,可谓是抗高并发流量的银弹;而降级是当服务出问题或者影响到核心流程的性能则需要暂时屏蔽掉,待高峰或者问题解决后再打开;而有些场景并不能用缓存和降级来解决,比如稀缺资源(秒杀、抢购)、写服务(如评论、下单)、频繁的复杂查询(评论的最后几页),因此需有一种手段来限制这些场景的并发/请求量,即限流.

Spark 实战, 第 2 部分:使用 Kafka 和 Spark Streaming 构建实时数据处理系统

于09-28 08:01 - -
Spark 实战, 第 2 部分:使用 Kafka 和 Spark Streaming 构建实时数据处理系统. 2015 年 7 月 27 日发布. 在很多领域,如股市走向分析, 气象数据测控,网站用户行为分析等,由于数据产生快,实时性强,数据量大,所以很难统一采集并入库存储后再做处理,这便导致传统的数据处理架构不能满足需要.

人工智能在线特征系统中的生产调度

于09-22 11:34 - 美团点评技术团队 -
在上篇博客 《人工智能在线特征系统中的数据存取技术》中,我们围绕着在线特征系统存储与读取这两方面话题,针对具体场景介绍了一些通用技术,此外特征系统还有另一个重要话题: 特征生产调度. 本文将以美团点评酒旅在线特征系统为原型,介绍特征生产调度的架构演进及核心技术. 架构演进共包含三个阶段,不同阶段面临的需求痛点和挑战各有不同,包括导入并发控制、特征变更原子切换、实时特征计算框架涉及、实时与离线调度融合等.

分布式系统一致性保障方案总结

于09-21 03:43 - -
猫友会群里经常卧虎藏龙,转载一篇百度大牛,投稿原创文章,大家交流学习 ,文末有作者个人公众号. 欢迎更多猫友投稿,发布原创文章和干货和大家分享交流.        在互联网系统中,理想的情况下,肯定是希望系统能够同时满足“一致性”、“可用性”和“分区容忍性”. 但是基于熟悉的CAP定律也好,还是BASE理论, 我们知道,在实际情况中是不可能实现的.

运营支撑系统(BSS)在面向物联网IoT业务场景的模型简要分析和设计

于09-17 13:33 - lottons88 -
BSS运营支撑系统(主要指电信运营商),通常都是为了支撑个人客户的业务运营. 虽然在业务运营上也面向集团客户,但是总体上来说,业务的特性总结归纳为2C的业务场景. 而当前运营商在面向物联网的业务运营下,主要是以2B的业务场景. 运营商实际并不会直接面向最终的客户,而是通过其他业务的运营企业的合作或者买卖关系提供,即是一种B2B2C的场景.

可解释推荐系统:身怀绝技,一招击中用户心理

于09-14 09:30 - 微软亚洲研究院 -
​编者按:推荐系统被广泛应用在电商网站、社交网络、生活服务网站、搜索引擎等平台. 一个好的推荐系统不仅需要准确地把握用户的需求,推荐给用户想要的内容,更需要学会与用户沟通,了解用户心理,以用户容易接受的方式给出适当的推荐. 本文中,微软亚洲研究院的研究员王希廷和谢幸将为大家详解可解释推荐系统的分类、推荐解释生成方法以及面临的机遇和挑战.

如何打造一个日均PV千万级别的大型系统?

于09-13 13:56 - 小码哥 - 运维干货 大型系统 架构 系统 运维部署
周金桥,具有丰富的系统规划、设计、开发、运维及团队组织管理工作经验,熟悉.Net、J2EE技术架构及应用. 微软2008-2012五届最有价值专家(MVP),2009年单独著有《ASP.NET夜话》一书,2010年与人合著《程序员的成长之路》. 本文我选定的方向是如何开发一个大型系统,在这里我对大型系统的定义为日均PV在千万级以上,而京东和淘宝这类则属于巨型系统了.

利用超声向语音识别系统发出听不见的指令

于09-08 12:32 - pigsrollaroundinthem -
浙江大学的六名研究人员在预印本网站上发表论文(PDF),描述了利用超声向语音识别系统发出人耳听不见的指令的攻击方法,他们将其称之为海豚攻击——海豚能发出高频声音. 人耳听不见频率超过 20 kHz 的声音,而麦克风软件通常会丢弃高于该频率的信号,但从技术上说,这些信号仍然能探测到. 语音激活的设备会应用低通滤波器去消除 20 kHz 以上的信号,研究人员称他们找到了方法绕过对信号的过滤,方法是在信号发射前将语音设备能响应的低频语音信号调制到超声载波中.

开源 | 微软、Facebook联手打造AI生态系统ONNX

于09-08 12:49 - 微软亚洲研究院 -
​编者按:今日,微软和Facebook宣布将推出Open Neural Network Exchange(ONNX,开放神经网络交换)格式,这是一个用于表示深度学习模型的标准,可使模型在不同框架之间进行迁移. ONNX是迈向开放生态系统的第一步,AI开发人员可以轻松地在最先进的工具之间转换,并选择最适合他们的组合.

两年卖出15万份米粉后,他让人人湘的系统进入了千家餐馆

于09-07 03:16 - -
2015 年算的上是刘正的高光时刻,他开的人人湘米粉店在 2 年间已经卖出了 15 万份米粉,连续两轮融资额达 2800 万元. 开业以来,每天中午顾客都要排队,有时候顾客要排半小时以上才能有座位. 人人湘在那时和雕爷牛腩、伏牛堂等成为 O2O 浪潮中的网红餐饮店. 不过和雕爷牛腩、伏牛堂相比,刘正并不把想把自己归进餐饮 O2O 一类.