更新于:06-21 18:04

有关[微博]分类推荐

来自滴滴、、唯品会、魅族、点评关于全链路压测等问题实践分享

于12-27 03:00 - Myl123 -
架构师小组交流会:每期选一个时下最热门的技术话题进行实践经验分享. 第二期:因为大家对全链路压测的问题比较感兴趣,因此做了一番探讨. 参与嘉宾:滴滴技术负责人彭令鹏、魅族系统架构师何伟、唯品会应用架构负责人张广平、新浪微博技术专家聂永、大众点评交易平台技术负责人陈一方、七牛云首席架构师李道兵. 本文是对此次交流的整理,欢迎探讨.

新浪混合云架构实践挑战之容器编排设计与实践

于08-12 00:00 - - tuicool
《微博混合云架构》专栏是InfoQ向新浪微博技术团队的系列约稿,本专栏包含8篇内容,详细阐述以DCP设计理念为指导思想的混合云架构实践. 本文是该系列的第五篇,主要介绍容器编排的设计与实现. 《微博混合云架构》专栏主要包括以下8篇内容:. DCP的容器编排设计与实践. 最近由于个人原因,与InfoQ约稿的专栏《微博混合云架构》很久没更新了,在此深表歉意.

这个励志故事

于08-11 02:14 - 魏武挥 - TMT乱弹 媒体供稿
微博发布2016年二季度财报,业绩相当亮眼,利润同比大涨5倍有余. 在中国互联网这二十多年的发展历史上,微博算是一个另类. 它的独特点在于,很少有像它这样被舆论一致看好然后又一致看衰却又在看衰中崛起的产品. 2011年,微博在舆论看多中走到顶峰,一度有所谓“微博改变中国”的说法. 2012年,微博开始走上下坡路,一个很有趣的现象就是,从“每天都要刷微博”到“现在还有什么人在用微博.

Redis实战:如何构建类的亿级社交平台

于05-04 01:36 - aoyouzi -
微博及 Twitter 这两大社交平台都重度依赖 Redis 来承载海量用户访问. 本文介绍如何使用 Redis 来设计一个社交系统,以及如何扩展 Redis 让其能够承载上亿用户的访问规模. 虽然单台 Redis 具备极佳的性能,但随着系统规模增大,单台服务器不能存储所有数据、以及没办法处理所有读写请求的问题迟早都会出现,这时我们就需要对 Redis 进行扩展,让它能够满足需求.

[Python爬虫] Selenium爬取新浪客户端用户信息、热点话题及评论 (上

于04-24 07:29 - Eastmount -
前一篇文章" [python爬虫] Selenium爬取新浪微博内容及用户信息"简单讲述了如何爬取新浪微博手机端用户信息和微博信息. 用户信息:包括用户ID、用户名、微博数、粉丝数、关注数等. 微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等. 它主要通过从文本txt中读取用户id,通过"URL+用户ID" 访问个人网站,如柳岩:.

新浪分布式爬虫分享

于03-16 15:38 - Bone_ACE -
代码请移步GitHub: SinaSpider. (上面有跳转链接,别再问我代码在哪里了). 此项目实现将单机的新浪微博爬虫(见 《新浪微博爬虫分享(一天可抓取 1300 万条数据)》)重构成分布式爬虫. Master机只管任务调度,不管爬数据;Slaver机只管将Request抛给Master机,需要Request的时候再从Master机拿.

分布式存储作业实现方法

于01-21 08:27 - Tim - 架构
可能通过「高可用架构」听说过在微博的系统中,单张 MySQL 在线业务表 60 亿条数据的场景. 很多关注互联网架构的工程师也非常关注如何如何设计类似系统. 下面是一道微博新兵训练营的分布式存储课堂练习,要设计合格才能上岗. 关注为什么超长列表数据的翻页技术实现复杂的读者请直接参看文末链接. 考虑到网上有很多架构师也在讨论,补充题目一些说明如下.

推荐架构的演进

于10-14 05:56 - -
微博(Weibo)是一种通过关注机制分享简短实时信息的广播式社交网络平台. 微博用户通过关注来订阅内容,在这种场景下,推荐系统可以很好地和订阅分发体系进行融合,相互促进. 微博两个核心基础点:一是用户关系构建,二是内容传播,微博推荐一直致力于优化这两点,促进微博发展. 在微博推荐发展的过程中遇到体系方向的变化、业务的不断更迭、目标的重新树立,其产品思路、架构以及算法也随之进行变迁.

长期通过信、知乎等平台接收碎片化的知识有什么弊端

于07-19 18:42 - - 工作笔记
“碎片化”是移动互联网时代的大势,虽说一方面可以将这样的趋势理解做“合理运用时间”. 然而长期接受碎片信息的后果也是有弊端的,即碎片化的信息极其容易被我们遗忘. 你以为你得到了很多,但其实你什么都没有得到. 希望今天分享的文章对同样碎片化的你们有些用. 作   者:Lachel (知乎). 你所接受的一切信息,构成了你的思维方式.

如果用户是“三低人群”,那么互联网用户都是

于06-25 22:52 - 付亮的竞争情报应用 -
2015年6月24日,由中国社会科学院新闻与传播研究所和社会科学文献出版社共同举办的新媒体蓝皮书《中国新媒体发展报告No.6(2015)》发布会在京举行. 蓝皮书指出,“三低人群”依然是微博主力军. 2013年该蓝皮书发布的报告显示,微博用户多是“三低人群”,即低学历、低年龄,低收入的人群. 时隔两年,据最新版蓝皮书分报告《微传播格局中的熟媒介——2014年中国微博发展报告》显示,微博用户的这一基本特征依然明显.

张雨石:背后的那些算法

于04-14 02:51 - 伯乐 - IT技术 微博 算法
微博是一个很多人都在用的社交应用. 天天刷微博的人每天都会进行着这样几个操作:原创、转发、回复、阅读、关注、@等. 其中,前四个是针对短博文,最后的关注和@则针对的是用户之间的关系,关注某个人就意味着你成为他的粉丝,而他成为你的好友;@某个人意味着你想要他看到你的微博信息. 微博被人们认为是“自媒体”,即普通大众分享与本身相关的“新闻”的途径.

sina面试题

于01-21 18:57 - jisuanji2121 -
以下至少三个名词进行解释:. 请分别描述防范SqlInjection ,XSS,CSRF(或XSRF)攻击的关键要点. 请描述Mysql中varchar(2),int(9),int(11). Mysql的存储引擎,常用的MyIsAM,InnoDB. 正则表达式中贪婪和懒惰的区别,举例使用场景. 列出至少两种在不同程序间进行数据交互的通用格式(如XML),列出优缺点.

亿级用户下的新浪平台架构

于01-21 08:34 - -
  新浪微博在2014年3月公布的月活跃用户(MAU)已经达到1.43亿,2014年新年第一分钟发送的微博达808298条,如此巨大的用户规模和业务量,需要高可用(HA)、高并发访问、低延时的强大后台系统支撑.   微博平台第一代架构为LAMP架构,数据库使用的是MyIsam,后台用的是php,缓存为Memcache.

一条暴”电信思维“与“互联网思维”的差距

于01-01 15:15 - 付亮的竞争情报应用 -
今天评了一个微博,后面的评论转发让人无语. 某号以“最无耻亏损”棒打几大片,这是典型的段子手的写法,就为了吸引眼球,在回复中也很可能有水军参与. 当然我没功夫一一辟谣,也不象该号那样需要吸引眼球,希望引起回复. 在此微博的评论、转发中有辩称运营商资费贵的,特别是说流量资费贵的,我一点不感觉到意外,这非常正常.

HttpClient 模拟登录手机版新浪

于11-20 08:29 - -
我们要做的就是获取服务器需要的数据,然后用HttpClient模拟浏览器提交. go标签内的href是我们第二次请求的地址,通过这个地址来获取cookie. 用户密码那个field的name属性是随机变化的,需要先获取它然后提交. 思路:先获取表单的值,然后用POST方法提交. 注意添加RequestHeader信息,否则会被服务器拒绝(403).

HttpClient 模拟登录Web版新浪

于11-20 08:30 - -
其中密码部分进行了加密,加密的算法在网页的js文件里,网上有人把它改成了Java代码. 下面是SinaSSoEncoder类:. 转:http://www.cnblogs.com/e241138/archive/2012/09/16/2687124.html. 已有 0 人发表留言,猛击->> 这里<<-参与讨论.

用WebCollector爬取新浪数据

于09-01 17:58 - AJAXHu -
用WebCollector可以轻松爬取新浪微博的数据.. 首先需要一个能查看cookie的浏览器插件,推荐使用 firefox浏览器+firebug(插件).. 1.用浏览器打开 http://weibo.cn/pub/   这是新浪微博面对手机用户的一个入口.建议不要使用自己的账号来做爬虫.之所以选择weibo.cn来爬去,是因为这个手机版的限制较少,但是weibo.cn的账号密码都是以明文传输,所以为了防止盗号,建议新申请账号进行爬取..

jQuery插件实现网页底部自动加载-类似新浪

于08-22 17:43 - 天梯梦 -
要实现滚动条滚到底部自动加载后续内容到内容到底部的功能,用jQuery非常方便的,只要知道什么时候滚动到了底部就好办了. $(document).scrollTop() //获取垂直滚动条到顶部的距离 $(document).height()//整个网页的高度 $(window).height()//浏览器窗口的高度.

很多网站提供用和 QQ 账号登录,好处是什么呢

于08-20 04:30 - 林灿斌 -
首先反对目前赞同数超过1的除了我以外的所有回答. 回答下题主本身的问题:很多网站提供用微博和QQ账号登录,好处是什么呢. 好处是当你登陆了QQ客户端或者微博时,用户可以不输入账号密码 直接点击(无需输入任何数据)使用绑定的QQ号或微博账号 登陆. 这个需求是很大的,我网站设立初期就有很多人要求我添加这个功能.

常用社交网络(SNS、人人网、新浪)动态新闻(feed、新鲜事、好友动态)系统浅析

于08-05 07:09 - wangxiaoxu -
原文地址:http://blog.csdn.net/sunmenggmail/article/details/8472546. 最近见几个朋友都在说人人网新鲜事排序的问题,恰巧对这方面也较感兴趣,于是打算顺便把手头收集到的资料梳理学习一下. 由于本人也只是新手,很多内容仅仅是参阅资料后的个人猜测与纸上谈兵故难免存有错误与纰漏,感谢大家指正.

Growth Hacker 奇技淫巧一则:零授权,抓取新浪任何用户的内容

于05-08 10:05 - xdash - Coding growth hacker hack
有时或基于以下凡此种种需求,我们会想要去抓取新浪微博的内容:. 产品冷启动,导入外部数据,而非从头积累;. 通过大数据+语义分析获取用户兴趣行为偏好,提供智能推荐;. 监控微博舆情,对特定关键词或是用户行为进行响应;etc. 想必新浪深知微博内容本身是最其有价值的资产,一旦被竞争对手大批量抓取导入,则辛苦建立起的门槛将瞬间化作他人之嫁衣,因此做了非常繁复的安全保护,包括强制登录跳转认证、跨域检测、cookie 植入、禁止账号密码登录而启用 OAuth2.0 等等.

Redis在新浪中的应用

于06-12 03:43 - 丕子 - 技术 Cluster Redis weibo
感觉国内对Redis玩的最转的就是新浪微博了,最近也在研究和使用Redis,准备把某些数据放到redis中. 看了几篇新浪微博的文章,挺受启发的,特别是对Redis集群扩容、内存容量配置等经验的介绍. Redis计数在新浪微博的应用. 微博关系服务与Redis的故事. Redis 在新浪微博中的应用.

CacheService架构浅析

于04-26 10:14 - -
  微博作为国内最大的社交媒体网站之一,每天承载着亿万用户的服务请求,这些请求的背后,需要消耗着巨大的计算、内存、网络、I/O等资源. 而且因为微博的产品特性,节假日、热门事件等可能带来突发数倍甚至十几倍的访问峰值,这些都对于支撑微博的底层基础架构提出了比较严苛的要求,需要满足:.   为了满足业务的发展需要,微博平台开发了一套高性能高可用的CacheService架构用于支撑现有线上的业务系统的运转.

Redis 在新浪中的应用

于12-19 11:44 - 大CC - Redis 内存数据库 redis
Redis 在新浪微博中的应用. 支持strings, hashes, lists, sets, sorted sets. string是很好的存储方式,用来做计数存储. sets用于建立索引库非常棒;. K-V 存储 vs K-V 缓存. 新浪微博目前使用的98%都是持久化的应用,2%的是缓存,用到了600+服务器.

新浪运营数据分析工具

于04-23 07:59 - - 3

关于新浪的6个Point

于03-16 23:58 - tips+guest@36kr.com(guest) -
本文来自36氪特约作者赵楠(个人微信号:zhaonan,自媒体公众号:村里那点儿事). 关于 新浪微博上市的几个Point. 招股书首先定义了下什么叫“月活跃用户”,以及“日活跃用户”. 简单来说,就是在一个给定的月份,或一个给定的日期内,不管你用哪种方式,只要登录、跳转、浏览了微博内容,都算是一个活跃用户.

月活跃用户1.29亿,新浪估值该怎么算

于03-15 01:48 - cly -
新浪微博终于提交了上市招股书,其中披露微博月活跃用户数为1.29亿,日活跃用户为6140万. 用户活跃度是评价社会化平台的重要指标,而且是最容易被量化和对比的指标. 首次披露月活跃用户数,也使资本市场能够对 新浪微博的估值做出更清晰的判断. i黑马分享本文,希望对大家有所帮助. 在国际市场,Facebook和Twitter普遍采取月活跃用户推测估值,因此 微博估值也适用于这一指标.

春晚背后的技术故事

于03-12 15:05 - -
一年一度的春晚再次落下帷幕,而微博也顺利地陪伴大家度过除夕之夜. 谈及马年春晚,人们首先想到的不是春晚上精彩的节目,而是微博上的吐槽,边看春晚,边刷微博,边吐槽,已经成了国人的习惯. 看春晚不再是为了看节目,而是为了能够在微博上吐槽,知道大家在吐槽什么,更有人戏称不是春晚成就了微博,而是微博拯救了春晚.

识别虚假信息的十个技巧

于03-09 15:54 - 付亮的竞争情报应用 -
微博时代,人人皆媒体,同时也处处是假信息或有瑕疵的信息. 微博大量出现瑕疵细信息的原因:. ①微博信息自发布,缺少有效的审核环节;. ②140字对于阐明一件事来说,太少了;. ③人的学识是有限的,粉丝多,名声大,职位高,不代表是万能的专家;. ④为吸引眼球,搏出位现象越来越普遍;. ⑤时间错位、位置错位,以讹传讹现象普遍;.

新浪图床架构解析

于03-06 10:05 - zxcvg -
可以先看一下  http://c.blog.sina.com.cn/profile.php?blogid=a466bf9189000rsw 新浪微博官方发出来的文章. 以下我们来解析一下如何构建高可用的图片存储系统 以满足现在日益增长的图片量,保证系统稳定高效的运行. 图床系统 ,我们先来分析下基于此类系统的一个特性.