更新于:09-23 05:20

有关[系统]分类推荐

九个问题,搞清楚Facebook的广告是如何运作的

于10-17 04:39 - -
根据国外的科技媒体报道,谷歌和 Facebook 几乎合占全球数字广告市场的半壁江山. 谷歌自是不消多说,它的搜索引擎业务有着极为庞大的用户群体,依靠搜索广告和与网页内容相关的广告,它被称为新时代的“印钞机”. 但是,Facebook 则不相同,它是一个社交媒体网络服务平台,虽然用户众多,但在它的应用场景中,广告变现并不占优势.

Serverless实战:打造个人阅读追踪 – ThoughtWorks洞见

于09-30 02:35 - -
阅读习惯和个人知识管理体系. 进入互联网时代,知识的获取成本变得前所未有的低廉,但是无论再好的知识,若是没有对个人产生价值的话,那也只不过是一种信息噪音而已. 我在《个人知识管理:知识的三种形态》这篇文章中使用“材料 -> 资料 -> 知识”这样的路径来诠释信息的流通,如何方便快捷并且有效地收集材料,再将其整理转化为有价值的个人知识体系结构,在这个信息极度碎片化的时代变得尤为重要.

聊聊高并发之限流特技

于09-29 06:46 - wb284551926 -
在开发高并发系统时有三把利器用来保护系统:缓存、降级和限流. 缓存的目的是提升系统访问速度和增大系统能处理的容量,可谓是抗高并发流量的银弹;而降级是当服务出问题或者影响到核心流程的性能则需要暂时屏蔽掉,待高峰或者问题解决后再打开;而有些场景并不能用缓存和降级来解决,比如稀缺资源(秒杀、抢购)、写服务(如评论、下单)、频繁的复杂查询(评论的最后几页),因此需有一种手段来限制这些场景的并发/请求量,即限流.

Spark 实战, 第 2 部分:使用 Kafka 和 Spark Streaming 构建实时数据处理

于09-28 08:01 - -
Spark 实战, 第 2 部分:使用 Kafka 和 Spark Streaming 构建实时数据处理系统. 2015 年 7 月 27 日发布. 在很多领域,如股市走向分析, 气象数据测控,网站用户行为分析等,由于数据产生快,实时性强,数据量大,所以很难统一采集并入库存储后再做处理,这便导致传统的数据处理架构不能满足需要.

人工智能在线特征中的生产调度

于09-22 11:34 - 美团点评技术团队 -
在上篇博客 《人工智能在线特征系统中的数据存取技术》中,我们围绕着在线特征系统存储与读取这两方面话题,针对具体场景介绍了一些通用技术,此外特征系统还有另一个重要话题: 特征生产调度. 本文将以美团点评酒旅在线特征系统为原型,介绍特征生产调度的架构演进及核心技术. 架构演进共包含三个阶段,不同阶段面临的需求痛点和挑战各有不同,包括导入并发控制、特征变更原子切换、实时特征计算框架涉及、实时与离线调度融合等.

分布式一致性保障方案总结

于09-21 03:43 - -
猫友会群里经常卧虎藏龙,转载一篇百度大牛,投稿原创文章,大家交流学习 ,文末有作者个人公众号. 欢迎更多猫友投稿,发布原创文章和干货和大家分享交流.        在互联网系统中,理想的情况下,肯定是希望系统能够同时满足“一致性”、“可用性”和“分区容忍性”. 但是基于熟悉的CAP定律也好,还是BASE理论, 我们知道,在实际情况中是不可能实现的.

运营支撑(BSS)在面向物联网IoT业务场景的模型简要分析和设计

于09-17 13:33 - lottons88 -
BSS运营支撑系统(主要指电信运营商),通常都是为了支撑个人客户的业务运营. 虽然在业务运营上也面向集团客户,但是总体上来说,业务的特性总结归纳为2C的业务场景. 而当前运营商在面向物联网的业务运营下,主要是以2B的业务场景. 运营商实际并不会直接面向最终的客户,而是通过其他业务的运营企业的合作或者买卖关系提供,即是一种B2B2C的场景.

可解释推荐:身怀绝技,一招击中用户心理

于09-14 09:30 - 微软亚洲研究院 -
​编者按:推荐系统被广泛应用在电商网站、社交网络、生活服务网站、搜索引擎等平台. 一个好的推荐系统不仅需要准确地把握用户的需求,推荐给用户想要的内容,更需要学会与用户沟通,了解用户心理,以用户容易接受的方式给出适当的推荐. 本文中,微软亚洲研究院的研究员王希廷和谢幸将为大家详解可解释推荐系统的分类、推荐解释生成方法以及面临的机遇和挑战.

如何打造一个日均PV千万级别的大型

于09-13 13:56 - 小码哥 - 运维干货 大型系统 架构 系统 运维部署
周金桥,具有丰富的系统规划、设计、开发、运维及团队组织管理工作经验,熟悉.Net、J2EE技术架构及应用. 微软2008-2012五届最有价值专家(MVP),2009年单独著有《ASP.NET夜话》一书,2010年与人合著《程序员的成长之路》. 本文我选定的方向是如何开发一个大型系统,在这里我对大型系统的定义为日均PV在千万级以上,而京东和淘宝这类则属于巨型系统了.

利用超声向语音识别发出听不见的指令

于09-08 12:32 - pigsrollaroundinthem -
浙江大学的六名研究人员在预印本网站上发表论文(PDF),描述了利用超声向语音识别系统发出人耳听不见的指令的攻击方法,他们将其称之为海豚攻击——海豚能发出高频声音. 人耳听不见频率超过 20 kHz 的声音,而麦克风软件通常会丢弃高于该频率的信号,但从技术上说,这些信号仍然能探测到. 语音激活的设备会应用低通滤波器去消除 20 kHz 以上的信号,研究人员称他们找到了方法绕过对信号的过滤,方法是在信号发射前将语音设备能响应的低频语音信号调制到超声载波中.

开源 | 微软、Facebook联手打造AI生态ONNX

于09-08 12:49 - 微软亚洲研究院 -
​编者按:今日,微软和Facebook宣布将推出Open Neural Network Exchange(ONNX,开放神经网络交换)格式,这是一个用于表示深度学习模型的标准,可使模型在不同框架之间进行迁移. ONNX是迈向开放生态系统的第一步,AI开发人员可以轻松地在最先进的工具之间转换,并选择最适合他们的组合.

两年卖出15万份米粉后,他让人人湘的进入了千家餐馆

于09-07 03:16 - -
2015 年算的上是刘正的高光时刻,他开的人人湘米粉店在 2 年间已经卖出了 15 万份米粉,连续两轮融资额达 2800 万元. 开业以来,每天中午顾客都要排队,有时候顾客要排半小时以上才能有座位. 人人湘在那时和雕爷牛腩、伏牛堂等成为 O2O 浪潮中的网红餐饮店. 不过和雕爷牛腩、伏牛堂相比,刘正并不把想把自己归进餐饮 O2O 一类.

Mozilla 为《华盛顿邮报》全站部署开源的 Talk 评论

于09-07 03:48 - - 综合新闻
Mozilla 宣布已经与《华盛顿邮报》达成了合作,以加强后者的“Talk”新闻评论系统. 该系统开发自 Mozilla 的 Coral Project,初期只会运用于该新闻机构网站的一部分,然后在接下来几周全面铺开. Talk 具有许多优点,但其在隐私方面最值得称道 —— 它不会追踪用户,也不包含监视功能.

哔哩哔哩大数据采集服务—Lancer设计与实践

于09-06 05:34 - -
        哔哩哔哩(以下简称B站)的日志采集肩负了B站的所有业务的日志收集并传输,提供离线数据和实时数据以满足离线或实时计算以及业务方订阅的需求. B站日志收集系统是基于Flume设计和搭建而成的.        数据采集是大数据的基石,近几年随着业务的高速增长,产生的数据量越来越大,并且会持续快速增长.

如何为技术博客设计一个推荐(中):基于 Google 搜索的半自动推荐

于09-05 12:55 - Phodal Huang - 杂谈
与统计学相比,基于内容来向用户推荐相似的内容,往往更容易获得. 在技术领域,作者通常比大多数读者更专业,他们往往知道什么是读者需要的. 如,你看了一个 React 相关的文章,你可能会需要 Redux 相关的内容. 需要一些前提条件:融合现有系统的数据信息,获取一些用户的信息. 随后,再计算出相关的内容,最后返回给读者.

华为分钱之道:六大

于08-18 15:32 - -
来源:管理智慧(ID:shzb2010). 近些年,华为公司像中国企业界的一颗耀眼的明星冉冉升起,许多学者、企业人都热衷于探讨华为崛起的种种原因. 其中,任正非本人的观点,认为华为能够走到今天,主要得益于“分钱分得好”更是引起无可复加的关注. 许多人注意到华为分钱分得好,于是认为分钱分好就能一劳永逸地激发员工活力,就能激活企业.

浅谈代码审计入门实战:某博客最新版审计之旅

于08-14 13:21 - shendao - 安全漏洞
第一次正式的审一次CMS,虽然只是一个很小的博客系统(提交都不一定收的那种),漏洞也都很简单,但是也算是积累了不少经验,所以最后想来还是在此做个分享,博客系统的CMS就不说了,毕竟有个官网挂着. 缘起某日翻阅某朋友博客的时候无意间发现有个小型的CMS,反正暑假闲的无聊就去审了一下代码(正好拿来练练手),问题挺严重的,好多参数都没有进行过滤,光注入就有好多处,因为文章篇幅有限,这里就不一一列举了,这里只把我找到的漏洞中每类最典型的剖析一下.

shiro 一个项目多个sessionid赋值 (getsession 重载

于08-04 08:25 - -
Shiro Security是非常不错的Security框架. 最近在我的项目中进行相关整合,shiro不难,难就难在如何对已经成熟的系统进行整合. 作为相关切入点,我也考虑了很久,整体运用上了如张开涛大佬所说. 对于Subject我们一般这么使用:. 1、身份验证(login). 2、授权(hasRole*/isPermitted*或checkRole*/checkPermission*).

大型广告架构概述 - TigerMee - CSDN博客

于08-03 00:44 - -
在互联网江湖中,始终流传着三大赚钱法宝:广告、游戏、电商. 三杰之中,又以大哥广告的历史最为悠久,地位也最为不可撼动. 君不见很多电商和游戏公司,也通过广告业务赚的盆满钵满. 其发迹于Y公司,被G公司发扬光大,又在F公司阶段性地完成了其历史使命. F公司,在移动互联网兴起之际,利用其得天独厚的数据优势,终于能够回答困扰了广告主几百年的问题:我的广告究竟被谁看到了.

Home Assistant + 树莓派:强大的智能家居 · 安装篇

于07-20 07:03 - cxlwill -
最近少数派掀起了一阵树莓派热潮,各色教程涌出水面. 将 Pi 接入智能家居控制系统并不新鲜,现有教程本身已经非常全面,但是由于 Homebridge 插件(下称「 HB」)的局限性,使其对智能家居设备的支持广度和深度不足,间接影响了用户使用 HomeKit 的体验. 例如,homebridge-aqara 插件并不支持小米网关 2 的自带灯光控制,白白浪费了设备的功能.

谷歌开放GNMT教程:如何使用TensorFlow构建自己的神经机器翻译

于07-14 00:08 - -
近日,谷歌官方在 Github 开放了一份神经机器翻译教程,该教程从基本概念实现开始,首先搭建了一个简单的NMT模型,随后更进一步引进注意力机制和多层 LSTM 加强系统的性能,最后谷歌根据 GNMT 提供了更进一步改进的技巧和细节,这些技巧能令该NMT系统达到极其高的精度. 机器之心对该教程进行简要的描述,跟详细和精确的内容请查看项目原网站.

「超级高铁」又进一步,Hyperloop One 完成了「全测试

于07-13 13:40 - 无脑 -
作者: 无脑 埃隆•马斯克(Elon Musk)在 2013 年的时候提出了 Hyperloop——也就是所谓的「超级高铁」的设想,其速度能达到每小时 1200 公里以上,甚至比现在普通飞机的速度高出一大截. 而 Hyperloop One 正是 Elon Musk 设想的新型交通工具的主要公司之一,就在今天这个「超级高铁」又离我们更近一步了.

可视化搭建

于07-12 09:17 - 泡沫 - 体验设计
如何搭建数据可视化系统,用丰富的设计语言清晰表达复杂和庞大数据,并形成鲜明的设计风格. 我们把数据可视化的元素进行拆分并建立相应的规范体系. 六种基本图表涵盖了大部分图表使用场景,也是做数据可视化最常用的图表类型:. 柱状图   分类照片照片什么照片什么什么项目之间的比较;. 饼图   构成即部分占总体的比例;.

微博广告 Hubble :秒级大规模分布式智能监控平台架构实践

于07-03 00:00 - - dev
关键词:微博广告 Hubble 监控平台 D+ 大数据 机器学习 LSTM Tensorflow. Hubble(哈勃,其含义是数据如浩瀚宇宙之大,Hubble 如太空望远镜,能窥见璀璨的星辰,发现数据的真正价值)平台定位为 微博广告智能全景监控、数据透视和商业洞察. 计算广告系统是集智能流量分发、投放、结算、CTR 预估、客户关系管理等为一体的大型互联网业务系统.

自然语言处理技术(NLP)在推荐中的应用

于06-28 00:00 - - geek
作者:张相於,58集团算法架构师,转转搜索推荐部负责人,负责搜索、推荐以及算法相关工作. 多年来主要从事推荐系统以及机器学习,也做过计算广告、反作弊等相关工作,并热衷于探索大数据和机器学习技术在其他领域的应用实践. 责编:何永灿(heyc@csdn.net). 《程序员》原创文章,更多精彩文章请. 个性化推荐是大数据时代不可或缺的技术,在电商、信息分发、计算广告、互联网金融等领域都起着重要的作用.

比较Apache Hadoop 生态中不同的文件格式和存储引擎的性能

于06-05 00:00 - - bigdata
这篇文章提出了在Apache Hadoop 生态系统中对比一些当前流行的数据格式和可用的存储引擎的性能:Apache Avro, Apache Parquet, Apache HBase 和 Apache Kudu 空间效率, 提取性能, 分析扫描以及随机数据查找等领域. 这有助于理解它们中的每一个如何(何时)改善你的大数据工作负载的处理能力.

大规模分布式架构下调测能力构建之道

于06-02 02:37 - longlongriver -
大规模分布式系统架构下调测能力构建之道. 最近有朋友辗转找到我,索要我今年参加QCon全球软件开发大会所用的PPT资料. 在这里我将PPT和讲稿做了整理,分享给大家. 这个分享,我首先会给大家总结一下,在分布式环境下做开发,我们都会遇到哪些调测方面的效率问题;并针对这些问题探讨在技术和管理上的应对之道;最后,通过我们所做的一个调测框架的展示来具体说明构建实践中的调测方法论.

秒针&GfK:阿里 OTT TV 价值研究报告(167页

于05-26 16:56 - DinK - 199IT推荐文章 互联网电视 研究报告 网络娱乐 Gfk
由于内容太长需PDF版可加入我们小密圈获取,199IT感谢您的支持. 2017 年 5 月 24 日,秒针系统联合 GfK,发布《阿里巴巴 OTT TV 媒体价值研究报告》. 报告分析了 OTT TV 行业现状,对商业化模式、 OTT TV 行业的营销价值进行了深入的洞察,更从实际的广告营销案例入手,对阿里 OTT TV 媒体价值进行了研究分析.

HBase最佳实践-用好你的操作

于05-25 00:00 - - bigdata
终于又切回HBase模式了,之前一段时间因为工作的原因了解接触了一段时间大数据生态的很多其他组件(诸如Parquet、Carbondata、Hive、SparkSQL、TPC-DS/TPC-H等),虽然只是走马观花,但也受益良多. 对视野、思维模式都有极其重要的作用,至少,扩展了大数据领域的对话圈.

2017年第一季度安卓安全性生态环境研究

于05-24 06:48 - 360安全卫士 - 安全报告 终端安全
此报告数据来源为70万份“360透视镜”(360手机卫士团队发布的一款专业检测手机安全漏洞的APP)用户主动上传的漏洞检测报告,检测内容包括最近两年的Android和Chrome安全公告中检出率最高的42个漏洞,涵盖了Android系统的各个层面. 检测结果显示,截止至2017年4月,70万用户中99.99%的Android手机存在安全漏洞,仅有4台手机完全修复了检测中所包含的42个漏洞.