更新于:08-06 15:08

有关[笔记]分类推荐

每秒百万级流式日志处理架构的开发运维调优笔记 | Cloud

于07-28 22:36 - -
荣幸之至,我们团队在实时日志分析、搜索项目中曾经应对过百万级的挑战,在这方面有长足的进步. 本文以笔记和问答的形式记录了我们曾经遇到过的实际问题及解决方案,而非小白式的大数据科普文章. 相信只有真正做过每秒近百万以上的实时日志处理业务,遇到过棘手问题,才能深刻感受我们当时越不过高坎的窘境与解决问题后的狂喜.

MySQL多数据源笔记3-分库分表理论和各种中间件 - 狂小白 - 博客园

于07-11 17:28 - -
  使用中间件对于主读写分离新增一个从数据库节点来说,可以不用修改代码,达到新增节点数据库而不影响到代码的修改. 因为如果不用中间件,那么在代码中自己是先读写分离,如果新增节点,. 你进行写操作时,你的轮询求模的数据量就要修改.   1.MYSQL官方的mysqlProxy,它可以实现读写分离,但是它使用率很低,搞笑的是MySQL官方都不推荐使用.

MySQL多数据源笔记2-Spring多数据源一主多从读写分离(手写) - 狂小白 - 博客园

于07-11 17:13 - -
一.为什么要进行读写分离呢.   因为数据库的“写操作”操作是比较耗时的(写上万条条数据到Mysql可能要1分钟分钟). 但是数据库的“读操作”却比“写操作”耗时要少的多(从Mysql读几万条数据条数据可能只要十秒钟). 所以读写分离解决的是,数据库的“写操作”影响了查询的效率问题. 读写分离: 大多数站点的数据库读操作比写操作更加密集,而且查询条件相对复杂,数据库的大部分性能消耗在查询操作上了.

Spark2.x学习笔记:11、RDD依赖关系与stage划分 - CSDN博客

于05-23 17:39 - -
11、 RDD依赖关系与stage划分. Spark中RDD的高效与DAG图有着莫大的关系,在DAG调度中需要对计算过程划分stage,而划分依据就是RDD之间的依赖关系. 针对不同的转换函数,RDD之间的依赖关系分类窄依赖(narrow dependency)和宽依赖(wide dependency, 也称 shuffle dependency).

工作笔记5 - websocket心跳重连机制

于03-23 17:07 - 呕心沥熊 -
在使用websocket过程中,可能会出现网络断开的情况,比如信号不好,或者网络临时性关闭,这时候websocket的连接已经断开,. 而浏览器不会执行websocket 的 onclose方法,我们无法知道是否断开连接,也就无法进行重连操作. 如果当前发送websocket数据到后端,一旦请求超时,onclose便会执行,这时候便可进行绑定好的重连操作.

NLP︱高级词向量表达(二)——FastText(简述、学习笔记) - CSDN博客

于03-14 14:12 - -
FastText是Facebook开发的一款快速文本分类器,提供简单而高效的文本分类和表征学习的方法,不过这个项目其实是有两部分组成的,一部分是这篇文章介绍的. fastText 文本分类(paper:. Classification(高效文本分类技巧)),. 另一部分是词嵌入学习(paper:. Information(使用子字信息丰富词汇向量)).

吴恩达deeplearning.ai五项课程完整笔记了解一下?

于03-12 13:28 - 思源 -
项目地址:https://github.com/mbadry1/DeepLearning.ai-Summary. 上周吴恩达在推特上展示了一份由 TessFerrandez 完成的深度学习专项课程信息图,这套信息图优美地记录了深度学习课程的知识与亮点. 这一份信息图的详细介绍请查看:这是一份优美的信息图,吴恩达点赞的 deeplearning.ai 课程总结.

干货 |《深入理解Elasticsearch》读书笔记

于11-17 03:23 - wojiushiwo987 -
由于之前已经梳理过Elasticsearch基础概念且在项目中实战过Elasticsearch的增删改查、聚类、排序等相关操作,对ES算是有了一定的认知. 但是,仍然对于一些底层的原理认知模糊,特买来《深入理解Elasticsearch》过了一遍,将书中一些细节知识点结合官网文档梳理如下. 1——4章偏应用,跟着敲一遍代码基本就能理解原理.

【笔记】第四章:从线性回归到逻辑回归-Mastering Machine Learning With scikit-learn

于11-15 20:47 - -
(这章起换用Markdown). 《Mastering Machine Learning With scikit-learn》是一本非常实用的机器学习实战书籍,它使用通俗易懂的语言和适度的理论知识来帮助python开发者使用scikit-learn机器学习工具包实现机器学习相关算法的应用. 早些时候我拜读了这本书,记了些笔记和重要的知识点,今天重新温习了遍,仍有收获,顺便张贴到博客上,一起学习交流.

关键词抽取算法的研究 | 吴良超的学习笔记

于10-21 16:24 - -
分词–>过滤停止词,得到候选关键词–>从候选关键词中选出文章的关键词. 从候选关键词中选出文章的关键词需要通过关键词抽取算法实现,而关键词抽取算法可以根据是否需要人工标注的语料进行训练而分为有监督的提取和无监督的提取. 有监督的提取需要人工标注的语料进行训练,人工预处理的代价较高. 而无监督的抽取算法直接利用需要提取关键词的文本即可进行关键词的提取,因此适用性较强.

[原]区块链技术学习笔记

于07-04 11:51 - russell_tao -
1、区块链技术是一个解决了拜占庭将军(百度百科 拜占庭将军问题)节点的分布式数据系统. 这是它最大的不同,也导致了这个技术存在诸多限制. 做服务器端开发的程序员,都对zookeeper不陌生,我们解决分布式ACP问题时,寻找一致性解决方案时都会想到它. zookeeper实际使用了paxos的简化版算法(本文不展开,请参考我之前写过的两篇文章: paxos分布式一致性算法–讲述诸葛亮的反穿越 以及 paxos算法如何容错的–讲述五虎将的实践).

近实时搜索SearcherManager和NRTManager的使用 - 学习笔记 - 博客频道 - CSDN.NET

于06-18 15:32 - -
lucene通过NRTManager这个类来实现近实时搜索,所谓近实时搜索即在索引发生改变时,通. 过线程跟踪,在相对很短的时间反映给给用户程序的调用. NRTManager通过管理IndexWriter对象,并将IndexWriter的一些方法(增删改)例如. addDocument,deleteDocument等方法暴露给客户调用,它的操作全部在内存里面,所以如果.

Yeoman学习与实践笔记

于05-05 18:33 - - NodeJs代码示例
Yeoman是Google的团队和外部贡献者团队合作开发的,他的目标是通过Grunt(一个用于开发任务自动化的命令行工具)和Bower(一个HTML、CSS、Javascript和图片等前端资源的包管理器)的包装为开发者创建一个易用的工作流. Yeoman的目的不仅是要为新项目建立工作流,同时还是为了解决前端开发所面临的诸多严重问题,例如零散的依赖关系.

盘点5款可替代新MacBook Pro的笔记本

于11-16 21:20 - STAROUS - 锋科技
  尽管苹果全新的MacBook Pro的Touch Bar自适应按键让不少人感到兴奋,但它也有不少的槽点,如缺少专业用户需要的接口,缺少32GB内存选项,缺少SD卡槽,入门级机型也缺乏专业功能. 目前市面上其实有许多富有吸引力且性能强大的笔记本选择. Windows本身也在努力迎合专业人士,最近增加了大量的实用工具.

(收藏)Spring Security笔记:解决CsrfFilter与Rest服务Post方式的矛盾

于12-17 22:14 - -
基于Spring Security+Spring MVC的web应用,为了防止跨站提交攻击,通常会配置csrf,即:. 如果应用中有Post方式访问的Rest服务(参考下面的代码),会很不幸的发现,所有POST方式请求的服务会调用失败. 原因在于:启用csrf后,所有http请求都被会CsrfFilter拦截,而CsrfFilter中有一个私有类DefaultRequiresCsrfMatcher.

我的jekyll笔记

于02-21 08:00 - -
我的博客用的就是用 jekyll搭建的,有几年历史了,同时《 JavaScript简易教程》也是基于jekyll搭建的,可以说我使用jekyll很长时间了,也算是比较熟悉了,最近我打算基于jekyll搭建一个新的东西,但却发现自己平时只是使用而且,竟然记不清搭建的流程,这篇博客就是由此产生. 本文介绍jekyll的安装,使用的方法,记录下来供自己和大家使用.

学习笔记:确保网站的可用性

于02-21 00:00 - u013256816 -
  网站的高可用架构设计的主要目的就是保证服务器硬件故障时服务依然可用、数据依然保存并能够被访问.   实现上述高可用架构的主要手段是数据和服务的冗余备份及失效转移.   典型的分层模型是三层,即应用层、服务层、数据层;各层之间具有相对独立性,应用层主要负责具体页面逻辑处理;服务层负责提供可复用的服务;数据层负责数据的存储于访问.

iOS 开发笔记-andriod/java/iOS三方AES通用加密 - jiangys

于08-28 22:07 - jiangys -
AES在线加解密验证工具:  http://www.seacha.com/tools/aes.html. AES加密有多种算法模式,下面提供两套模式的可用源码. 将数据进行Base64解码. 一、CBC(Cipher Block Chaining,加密块链)模式. 是一种循环模式,前一个分组的密文和当前分组的明文异或操作后再加密,这样做的目的是增强破解难度..

推荐系统的学习笔记

于05-02 18:10 - whiterbear -
一直以来对推荐系统的学习和理解来自一些机器学习书中简单介绍(如《集体智慧编程》和《机器学习实战》)和自己网上搜的一些资料. 而当被问及对推荐系统的改进和理解,发现自己对推荐系统所知甚少,除了知道几个常用的算法外,根本没有更深入的理解,更别提改进了. 本篇博客为学习《推荐系统》一书的读书笔记,记录了常见的推荐算法和其思想.

关于如何使用Jeesite快速开发笔记

于04-27 01:25 - dch9210 -
公司要求学习jeesite这个框架,网上全是关于jeesite的描述,完全无用,在此只记录如何使用jeesite进行快速开发. 1、这是我的Eclipse、Maven等环境,此步骤略过. step-1:运行基本环境 安装好Eclipse、maven、tomcat(7以上亲测可用). PS:记得在window>preferences>java>Installed JREs中将jre环境配置成jdk的根目录,因为maven运行时需要jdk的tools.jar等工具支持.

Cache-control使用Cache-control:private学习笔记

于05-02 12:08 - tw_wangzhengquan -
网页缓存由 HTTP消息头中的Cache-control控制,常见取值有private、no-cache、max-age、must- revalidate等,默认为private. 其作用根据不同的重新浏览方式,分为以下几种情况:. 值为private、no-cache、must-revalidate,那么打开新窗口访问时都会重新访问服务器.

读写模型整理笔记

于04-27 09:45 - 四火 - System Design 笔记 读写模型
最常见的读模型,说是主键,其实也包括其它索引键,或者联合主键. 常见实现:hash,时间复杂度可以接近O(1);B树或变种:时间复杂度接近O(log(n)). B树(B-树):本质上是二叉查找树的升级版,变成了平衡的N叉查找树,这个N的范围根据磁盘一次读取的块大小来调整,这样复杂度log n的底数就从2变成一个更大的数,减少了树的高度.

Geohash学习笔记

于10-21 22:04 - 标点符 - 程序开发 GIS
Geohash是一种地址编码,它能把二维的经纬度编码成一维的字符串. 比如,北海公园的编码是wx4g0ec1. Geohash有以下几个特点:. Geohash用一个字符串表示经度和纬度两个坐标. 在数据存储时可以简化为只为一列做索引. Geohash表示的并不是一个点,而是一个矩形区域. 使用者可以发布地址编码,既能表明自己大致位置,又不至于暴露自己的精确坐标,有助于隐私保护.

Elasticsearch 学习笔记

于10-14 14:43 - liliang_68 -
安装  Elasticsearch. 1:解压下载的安装包 elasticsearch-1.7.2.zip. 修改  node.name: es(集群状态名字一致). 2:在https://github.com/elasticsearch/elasticsearch-servicewrapper下载该插件后,解压缩.

做一个好的CEO的建议的笔记

于01-04 23:00 - jianshuo - Uncategorized
在看这篇文章: 成功的CEO的8条贴士,标注如下:. 当你在公司的时候,其实很难思考公司的事情. 当你离开一段的时候,反而可以想得更清楚. 每个人都需要足够长的安静的没有打断的时间来思考. 进入思考的状态就跟进入睡眠的状态很像,需要一段时间的安静,才会进入. 每隔帮个小时有人来说一句话是绝对睡不着的.

Codis架构笔记

于03-28 17:11 - 那谁 - 分布式 架构
Codis是起源于豌豆荚的redis Proxy项目,其主要目的是为了解决redis使用中的两个痛点:. 难以动态的平行扩展增加新的redis服务.. dashboard:主要用于管理服务,主要通过ZK向codis-proxy下发命令,比如新增/减少服务器.. zookeeper:用于集群服务之间同步配置..

Android菜鸟笔记- 获取未安装的APK图标、版本、包名、名称、是否安装、安装、打开

于06-30 01:19 - GiantGreen -
周末闲来无事,把Android的基础知识拿出来复习复习,今天主题是《获取未安装的APK图标、版本、包名、名称、是否安装、跳转安装、打开》. 通常读取APK的图标可以用,PackageManager里面的getApplicationIcon(ApplicationInfo)来得到一个drawable.

学习笔记:Twitter核心数据类库团队的Hadoop优化经验

于07-17 09:49 - foreach_break - IT技术 Hadoop Twitter
此稿介绍了Twitter的核心数据类库团队,在使用Hadoop处理离线任务时,使用的性能分析方法,及由此发现的问题和优化手段,对如何使用JVM/HotSpot profile(-Xprof)分析Hadoop Job的方法调用开销、Hadoop配置对象的高开销、MapReduce阶段的排序中对象序列化/反序列的高开销问题及优化等给出了实际可操作的方案.

学习笔记:The Log(我所读过的最好的一篇分布式技术文章)

于07-17 11:00 - foreach_break - IT技术 kafka log 分布式 数据库
学习的材料来自Jay Kreps的一篇讲Log的博文. 原文很长,但是我坚持看完了,收获颇多,也深深为Jay哥的技术能力、架构能力和对于分布式系统的理解之深刻所折服. 同时也因为某些理解和Jay哥观点吻合而略沾沾自喜. Jay Kreps是前Linkedin的Principal Staff Engineer,现任Confluent公司的联合创始人和CEO,Kafka和Samza的主要作者.

Google《Android性能优化》学习笔记

于06-21 11:40 - techug - 编程技术 android
现在有不少App为了达到很华丽的视觉效果,会需要在界面上层叠很多的视图组件,但是这会很容易引起性能问题. 如何平衡Design与Performance就很需要智慧了. 大多数手机的屏幕刷新频率是60hz,如果在1000/60=16.67ms内没有办法把这一帧的任务执行完毕,就会发生丢帧的现象. 丢帧越多,用户感受到的卡顿情况就越严重.