巧用 Img / JavaScript 采集页面数据-云栖社区

标签: | 发表时间:2018-01-19 08:29 | 作者:
出处:https://m.aliyun.com

我们发送重要邮件时为了确认对方已读,都会在邮件中设置一个“读取回执"标签以确定对方时候读信。

这种模式用途很广,例如:

  • 发送传单时,确保对方已读
  • 推广网页时,多少用户做了点击
  • 移动App运营活动页面,分析用户访问情况

对这类个性化的采集与统计,针对站长CNZZ、百度统计,移动的Talking Data、友盟等都无法胜任。主要难点在于:

  • 个性化需求难满足:用户产生行为并非移动端场景,其中会包括一些运营个性化需求字段,例如:来源、渠道、环境、行为等参数
  • 开发难度大/成本高:为完成一次数据采集、分析需求,首先需要购买云主机,公网IP,开发数据接收服务器,消息中间件等,并且通过互备保障服务高可用;接下来需要开发服务端并进行测试
  • 使用不容易:数据达到服务端后,还需要工程师先清洗结果并导入数据库,生成运营需要的数据
  • 无法弹性:无法预估用户的使用量,因此需要预留很大的资源池

从以上几点看,当一个面向内容投放的运营需求来了后,如何能以很快捷的手段满足这类用户行为采集、分析需求是一个很大的挑战。

日志服务提供 Web Tracking/JS/Tracking Pixel SDK就是为解决以上轻量级埋点采集场景而生,我们可以在1分钟时间内完成埋点和数据上报工作。此外日志服务每账号*每月提供 500MB 免费额度,让你不花钱也能办事。

方案简介

这里引入采集 + 分析方案基于阿里云日志服务,该服务是针对日志类数据的一站式服务,无需开发就能快捷完成海量日志数据的采集、消费、投递以及查询分析等功能,提升运维、运营效率。 服务功能包括:

  • LogHub:实时采集与消费。与Blink、Flink、Spark Streaming、Storm、Kepler打通。
  • 数据投递:LogShipper。与MaxCompute、E-MapReduce、OSS、FunctionCompute打通
  • 查询与实时分析:LogSearch/Analytics。与DataV,Grafana,Zipkin,Tableua等打通。

Snip20180116_56.png

采集端介绍

日志服务提供 30+数据采集方式,针对服务器、移动端、嵌入式设备及各种开发语言都提供完整的解决方案,比较典型有:

  • Logtail:针对X86服务器设计Agent
  • Android/iOS:针对移动端SDK
  • Producer Library:面向受限CPU/内存 智能设备

Snip20180116_58.png

这里介绍的轻量级采集方案(Web Tracking),该方案只需一个http get请求即可将数据传输至日志服务Logstore端,适应各种无需任何验证的静态网页,广告投放,宣传资料,移动端数据采集。相比其他日志采集方案,特点如下:

Snip20180116_60.png

WebTracking接入步骤

Web Tracking(也叫Tracking Pixel)术语来自于HTML语法中的图片标签:我们可以在页面上嵌入一个0 Pixel图片,该图片默认对用户不可见,当访问该页面显示加载图片时,会顺带发起一个Get请求到服务端,这个时候就会把参数传给服务端。

Web Tracking使用步骤如下:

  1. 为Logstore打开Web Tracking标签(Logstore默认不允许匿名写,在使用前需要先开通Logstore的Web Tracking开关)
  2. 通过埋点方式向Logstore写入数据,有三种选择:

    1. 直接通过HTTP Get方式上报数据

                    curl --request GET 'http://${project}.${sls-host}/logstores/${logstore}/track?APIVersion=0.6.0&key1=val1&key2=val2'
    2. 通过嵌入HTML 下Image标签,当页面方式时自动上报数据

                    <img src='http://${project}.${sls-host}/logstores/${logstore}/track.gif?APIVersion=0.6.0&key1=val1&key2=val2'/>
      or
      <img src=‘http://${project}.${sls-host}/logstores/${logstore}/track_ua.gif?APIVersion=0.6.0&key1=val1&key2=val2’/> 
      track_ua.gif除了将自定义的参数上传外,在服务端还会将http头中的UserAgent、referer也作为日志中的字段。
    3. 通过Java Script SDK 上报数据

                    <script type="text/javascript" src="loghub-tracking.js" async></script>
      
      var logger = new window.Tracker('${sls-host}','${project}','${logstore}');
      logger.push('customer', 'zhangsan');
      logger.push('product', 'iphone 6s');
      logger.push('price', 5500);
      logger.logger();

详细步骤 参见WebTracking接入文档

案例:内容多渠道推广

当我们有一个新内容时(例如新功能、新活动、新游戏、新文章),作为运营人员总是迫不及待地希望能尽快传达到用户,因为这是获取用户的第一步、也是最重要的一步。

以游戏发行作为例子:

  1. 市场很大一笔费用进行游戏推广,例如投放了1W次广告
  2. 广告成功加载的有2000人次,约占20%
  3. 其中点击的有800人次
  4. 最终下载并注册账号试玩的往往少之又少

Snip20180116_62.png

从以上可见,能够准确、实时地获得内容推广有效性对于业务非常重要。为了打到整体推广目标,运营人员往往会会挑选各个渠道来进行推广,例如:

  • 用户站内信(Mail),官网博客(Blog),首页文案(Banner等)
  • 短信,用户Email,传单等
  • 新浪微博,钉钉用户群,微信公众账号,知乎论坛,今日头条等新媒体

Snip20180116_61.png

方案设计

  1. 我们日志服务中创建一个Logstore(例如叫:myclick),并开启WebTracking功能
  2. 为需要宣传的文档(article=1001) 面对每个宣传渠道增加一个标示,并生成Web Tracking标签(以Img标签为例),如下:

    1. 站内信渠道(mailDec):

                    <img src="http://example.cn-hangzhou.log.aliyuncs.com/logstores/myclick/track_ua.gif?APIVersion=0.6.0&from=mailDec&article=1001" alt="" title="">
    2. 官网渠道(aliyunDoc):

                    <img src="http://example.cn-hangzhou.log.aliyuncs.com/logstores/myclick/track_ua.gif?APIVersion=0.6.0&from=aliyundoc&article=1001" alt="" title="">
    3. 用户邮箱渠道(email):

                    <img src="http://example.cn-hangzhou.log.aliyuncs.com/logstores/myclick/track_ua.gif?APIVersion=0.6.0&from=email&article=1001" alt="" title="">
    4.               其他更多渠道可以在from参数后加上,也可以在URL中加入更多需要采集的参数
  3. 将img标签放置在宣传内容中,就可以散布出去了,我们也可以去散步喝咖啡了

采集日志分析

在完成埋点采集后,我们使用日志服务 LogSearch/Analytics功能可以对海量日志数据进行实时查询与分析。在结果分析可视化上,除 自带Dashboard外,还支持 DataVGrafana、Tableua等对接方式,我们这里做一些基本的演示:

以下是截止目前采集日志数据,我们可以在搜索框中输入关键词进行查询:

Snip20180117_64.png

也可以在查询后输入SQL进行秒级的实时分析并可视化:

Snip20180117_69.png

除了在日志服务中分析外,

以下是我们对用户点击/阅读日志的实时分析:

  • 当前投放总流量与阅读数
      * | select count(1) as c
  • 每个小时阅读量的曲线
      * | select count(1) as c, date_trunc('hour',from_unixtime(__time__)) as time group by time order by time desc limit 100000
  • 每种渠道阅读量的比例
      * | select count(1) as c, f group by f desc
  • 阅读量来自哪些设备
      * | select count_if(ua like '%Mac%')  as mac, count_if(ua like '%Windows%')  as win, count_if(ua like '%iPhone%')  as ios, count_if(ua like '%Android%')  as android
  • 阅读量来自哪些省市
      * | select ip_to_province(__source__) as province, count(1) as c group by province order by c desc limit 100

最终可以将这些实时数据配置到一个实时刷新Dashboard中,效果如下:

Snip20180117_71.png

写在最后

当你看完本文时,可以留意这行文字下有个不可见Img标签将这次访问记录下来了,找找看吧:)

相关 [img javascript 页面] 推荐:

巧用 Img / JavaScript 采集页面数据-云栖社区

- -
我们发送重要邮件时为了确认对方已读,都会在邮件中设置一个“读取回执"标签以确定对方时候读信. 推广网页时,多少用户做了点击. 移动App运营活动页面,分析用户访问情况. 对这类个性化的采集与统计,针对站长CNZZ、百度统计,移动的Talking Data、友盟等都无法胜任. 个性化需求难满足:用户产生行为并非移动端场景,其中会包括一些运营个性化需求字段,例如:来源、渠道、环境、行为等参数.

Javascript高性能动画与页面渲染

- - 极客521 | 极客521
如果你不得不使用setTimeout或者setInterval来实现动画,那么原因只能是你需要精确的控制动画. 但我认为至少在现在这个时间点,高级浏览器、甚至手机浏览器的普及程度足够让你有理由有条件在实现动画时使用更高效的方式. 页面是每一帧变化都是系统绘制出来的(GPU或者CPU). 但这种绘制又和PC游戏的绘制不同,它的最高绘制频率受限于显示器的刷新频率(而非显卡),所以大多数情况下最高的绘制频率只能是每秒60帧(frame per second,以下用fps简称),对应于显示器的60Hz.

【JavaScript】获取页面停留时间并提交 - 枫芸志

- -
花了点时间研究了下JavaScript获取页面停留时间并提交的方法,小结一下. 页面停留时间为什么为0》中介绍Google Analytic的算法是:当发现一个访问者进入一个网站访问了第一个页面时,会记录下他的访问时间. 等到他访问第二个页面时,记录下第二个时间,用第二个时间和第一个时间的差值作为这个访问者在第一个页面的停留时间.

使用原生 JavaScript 在页面加载完成后处理多个函数

- - 我爱水煮鱼
网页中的 JavaScript 脚本运行是需要通过事件去触发的. 一般的做法就是在网页中,直接编写几个函数,有的在代码被加载的时候就被浏览器处理,或者使用类似下面的代码来触发实现函数的相关功能. 上面代码的意思就是,当鼠标点击 id 为 link 的元素的时候,就触发了它的 onclick 事件,然后执行使用 JavaScript 定义的 fun 函数.

javascript 获取滚动条高度+常用js页面宽度与高度

- - Web前端 - ITeye博客
javascript 获取滚动条高度+常用js页面宽度与高度 / ******************** * 取窗口滚动条高度 ****************** / function getScrollTop() {. return scrollTop; } / ******************** * 取窗口可视范围的高度 ******************* / function getClientHeight() {.

用JavaScript探测页面上的广告是否被AdBlock屏蔽了的方法

- - Web骇客
看电视、看电影、看优酷、看网页时,对满天飞的广告也是深恶痛绝. 但是,对一个中小网站站长/博客主来说,广告几乎是唯一的能成支持网站/博客正常运转的资金来源. 如果一个博客主,只是无私发布稿件,能坚持几年的,很少. 火狐浏览器和谷歌浏览器里都有能够屏蔽页面给广告的插件,最有名的是AdBlock和AdBlock Plus.

IMG to ISO – 小巧的镜像文件转换软件 | 小众软件 > 实用工具

- SotongDJ - 小众软件
ISO 已然成为目前最流行的镜像文件格式,包括各大系统安装文件、各大商业软件等等. 如果你手头上有 IMG 格式的镜像文件,有需要转换成 ISO 的话,可以使用 IMG TO ISO ,小巧、简单并不失实用. MG to ISO 支持 windows xp/vista/7,转换成的 ISO 符合标准的 ISO格式,此外该软件支持打开 ima 文件.

手机网站开发及手机中图片加速显示img的Canvas方法

- - CSDN博客Web前端推荐文章
    随着手机开发越来越流行,手机开发的很多框架也应运而生,比较好用的手机网站开发框架推荐如下:.     1、zeptojs,里面封装了很多手机特有方法,例如touch.js等等. 和jquery用法差不多,很好上手. API地址:http://zeptojs.com/#$.extend.     2、jquerymobile   演示地址:http://jquerymobile.com/.

jQuery参考实例 1.2 在DOM加载完毕,页面元素完全加载之前运行jQuery/JavaScript代码

- - CSDN博客推荐文章
本文翻译自jQuery Cookbook (O’Reilly 2009) 1.2 Executing jQuery/JavaScript Code After the DOM Has Loaded but Before Complete Page Load. 主流的JavaScript应用程序一般只在DOM完全加载后才运行JS代码.

Javascript诞生记

- Milido - 阮一峰的网络日志
二周前,我谈了一点Javascript的历史. 今天把这部分补全,从历史的角度,说明Javascript到底是如何设计出来的. 只有了解这段历史,才能明白Javascript为什么是现在的样子. 我依据的资料,主要是Brendan Eich的自述. "1994年,网景公司(Netscape)发布了Navigator浏览器0.9版.