上海电信运用大数据打击营销和诈骗电话,可为违规行为精准画像

标签: 大数据 运营商 投稿 | 发表时间:2017-06-20 15:38 | 作者:IT时报
出处:http://www.tmtpost.com

图片来源:视觉中国

图片来源:视觉中国

“你好,我是你老板,请到我办公室来一下……”“你好,你的邮政包裹在我手上,需要提供身份证件……”“我是王宝强,需要你借1万元钱来缓解资金紧张……”一直以来,很多用户为陌生手机号码来电困扰,一接听才发现对方是在推销产品,甚至是进行诈骗。

面对“顽疾”,国内运营商开始主动出击,对过度营销电话和诈骗电话进行整治。今年初,上海电信自主研发了反通信诈骗和反过度营销的两套系统,借助大数据对过度营销号和诈骗号进行精准画像,并及时进行精准打击,取得不错效果。

营销团伙越来越隐蔽

 “过去,运营商对诈骗、过度营销号主要是采取先举报后打击的方式。”上海电信相关人士介绍,对于主动关停手机号,运营商始终保持谨慎态度,主要原因在于 运营商内部过去缺乏有效的方法对上万条号码进行精准筛选,只能被动依赖举报信息进行打击。

同时,过度营销号地下产业链在与运营商“较量”中,想方设法躲避运营商的拦截。过去两年,运营商集中整治了一批4008固定电话号码,之后大批营销团队开始利用手机号码进行推销,由此衍生了一大批地下呼叫中心,通过拨号器向外进行规模性营销。

去年底,上海警方打击整治了一个地下呼叫中心, 发现了数百张手机卡,涉及三家运营商。营销团伙每天只随机使用其中数张,通过自动拨号系统向外呼出,设定了每张卡每日的呼出量,一旦超出运营商的呼出量监测的上限值,他们就更换另一批号段。

过度营销团队的营销手段越来越隐蔽,对于运营商来说,单纯依靠原有的检测系统进行有效拦截的难度越来越高。

大数据面前无处遁形

虽然地下营销团伙隐藏得越来越深,不过“魔高一尺道高一丈”,运营商现在开始借助大数据的力量重拳出击。

“每次通话时长不超过15秒,符合;同一个号码每天的呼出电话号码重复率不高于X%,符合;呼出呼入比高于X%,符合……”

上海电信的大数据系统 根据事先设置好的“基站信息”“上网信息”“通话行为信息”“基本信息”等维度,对相应的手机号进行特征分析。如果特征符合,相应的手机号码几秒钟内就能被“定位”并关停。

这是国内运营商首次尝试用大数据算法来打击诈骗及过度营销号。据了解,通过这样的方法,上海电信从去年底至今总共关停的营销、骚扰、诈骗号码达21万个。

去年底开始,上海电信网络安全部门投入了巨大精力推进大数据库的建设。这并非易事,为了厘清过度营销的行为特征,技术人员进行了长时间的跟踪,将内部员工的手机号和被举报号码一起纳入监测范围。通过对两组号码的长期追踪比对,技术人员发现除了每日呼出量明显高于常人外,过度营销号码还有许多“异常特征”,比如 使用基站数量远低于普通手机用户

“一个正常的人每天在上下班路上,会经过至少近十个基站,但营销号所使用的基站是固定不变的,一天不会超过两个。”

上海电信相关人士介绍。此外,在通话时长、呼入呼出占比等维度上,营销号都与正常手机号存在明显差异,这些都被纳入对营销号的“画像”之中。经过长时间的比对分析,营销号的特征越来越明显,“画像”越来越清晰,由此建立的大数据IT系统就能布下天罗地网,系统几秒钟之内就能自动“打掉”符合条件的过度营销号、诈骗号。

对诈骗电话实施精准打击

与营销电话行为不同的是,实施诈骗电话的犯罪分子在前期往往已经精确掌握了用户的个人信息,对诈骗对象有了详细了解,人们很容易上当,电话诈骗的危害性更大。比如,此前发生的徐玉玉事件中,就是相关信息泄露让犯罪分子以助学金的借口轻易诈骗得手。

为了打击危害更大的诈骗电话,此次上海电信也制定了一套数据库样本。上海电信技术人员用了一个多月时间,对诈骗电话号样本进行反复分析和比对,

“因为样本量小,前期无法通过机器来完成。只能用人工来逐条对比分析。”

最终技术人员发现,隐藏在“上海号段”背后的诈骗团伙聚集地其实挺有规律。除了都集中在偏远山区外, 不同地区内的诈骗产业链正在形成“集群”。

比如,来自某地的诈骗电话大多从事“色情诱骗”,在他们的通话账单中,除了普通话费外,往往附加有漫游流量包,用来传发色情图片。再比如,来自另一地区的诈骗团伙往往冒充信用卡中心,在通话记录中会留下拨打各大银行服务热线的记录……通过比对, 通信诈骗高发地区名单诞生了,来自这些地区的漫游电话被重点监测,同时通过大量的特征分析,对漫游诈骗电话进行精准打击。

 记者手记

打击电话骚扰需要法律“补位”

打击通信诈骗,不仅是技术层面的事情,更是法律层面的事情。

在我国,对“营销电话”与“诈骗电话”的界定始终含糊不清。比如,房地产推销、教育信息推销的电话是正常行为还是电话骚扰行为?如果违法,又应当承担怎样的法律责任?这些都处于空白。

定义不清,事情做起来就很难。在有的用户看来,推销电话提供了自己正好需要的信息,但同样的行为在其他人看来,或许就是骚扰电话。

所以, 如果要有效根治电话骚扰等现象,法律法规也要跟进。因此,也有业内人士建议,可适当借鉴国外经验,对接听营销号进行分层管理,将愿意接收营销信息的用户与完全不愿接收营销信息的用户精确划分,在运营商内部形成相关服务项目,由用户自行选择开通与否。(本文作者为IT时报记者章蔚玮)

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

相关 [上海 电信 大数据] 推荐:

上海电信运用大数据打击营销和诈骗电话,可为违规行为精准画像

- - 钛媒体:网罗天下创新事
“你好,我是你老板,请到我办公室来一下……”“你好,你的邮政包裹在我手上,需要提供身份证件……”“我是王宝强,需要你借1万元钱来缓解资金紧张……”一直以来,很多用户为陌生手机号码来电困扰,一接听才发现对方是在推销产品,甚至是进行诈骗. 面对“顽疾”,国内运营商开始主动出击,对过度营销电话和诈骗电话进行整治.

大数据在电信行业的应用

- - 互联网的那点事
电信与媒体市场调研公司Informa Telecoms & Media在2013年的调查结果显示,全球120家运营商中约有48%的运营商正在实施大数据业务. 该调研公司表示,大数据业务成本平均占到运营商总IT预算的10%,并且在未来五年内将升至23%左右,成为运营商的一项战略性优势. 可见,由流量经营进入大数据运营已成为大势所趋.

上海电信年底户均带宽将超8兆 缩短资费跳变期

- Woooon - cnBeta.COM
9月8日,中国电信上海公司(以下简称上海电信)宣布,将于10月1日启动“体验免费送、光网再提速、企业新回馈”智慧城市宽带再提速计划. 这也是继今年1月1日实施的“二免一赠一极速”宽带大提速活动之后,上海电信推出的新一轮宽带提速计划.

上海电信全面启动智慧城市宽带再提速计划 免费升至10-30M

- Quantum - cnBeta.COM
2011年9月8日,中国电信上海公司(以下简称上海电信)正式宣布,将于2011年10月1日全面启动“光网家庭再提速、免费体验大签约、中小企业新回 馈”智慧城市宽带再提速计划. 此次提速,是继2011年1月1日实施的“二免一赠一极速”宽带大提速活动之后推出的新一轮宽带提速计划.

谈大数据(2)

- - 人月神话的BLOG
对于大数据,后面会作为一个系列来谈,大数据涉及的方面特别多,包括主数据,数据中心和ODS,SOA,云计算,业务BI等很多方面的内容. 前面看到一个提法,即大数据会让我们更加关注业务方面的内容,而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了,再系统来看大数据的完整解决方案和体系化.

大数据之惑

- - 互联网分析
算起来,接触大数据、和互联网之外的客户谈大数据也有快2年了. 也该是时候整理下一些感受,和大家分享下我看到的国内大数据应用的一些困惑了. 云和大数据,应该是近几年IT炒的最热的两个话题了. 在我看来,这两者之间的不同就是: 云是做新的瓶,装旧的酒; 大数据是找合适的瓶,酿新的酒. 云说到底是一种基础架构的革命.

白话大数据

- - 互联网分析
这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实,大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时,正好一个妹子推门而入,听到这句话,微微一怔,低头坐下.

交通大数据

- - 人月神话的BLOG
本文简单谈下智慧交通场景下可能出现的大数据需求和具体应用价值. 对于公交线路规划和设计是一个大数据潜在的应用场景,传统的公交线路规划往往需要在前期投入大量的人力进行OD调查和数据收集. 特别是在公交卡普及后可以看到,对于OD流量数据完全可以从公交一卡通中采集到相关的交通流量和流向数据,包括同一张卡每天的行走路线和换乘次数等详细信息.

全球10大数据库

- - 译言-电脑/网络/数码科技
原文: Fiorenttini   译者: julie20098. [非商业性转载必须注明译者julie20098和相关链接. ,否则视为侵权,追究转载责任. 世界气候数据中心:气候全球数据中心, 220TB 的网络数据, 6PB 的其它数据. 国家能源研究科学计算中心,有 2.8PB 容量.

谈大数据分析

- - 人月神话的BLOG
对于数据分析层,我们可以看到,其核心重点是针对海量数据形成一个分布式可弹性伸缩的,高查询性能的,支持标准sql语法的一个ODS库. 我们看到对于Hive,impala,InfoBright更多的都是解决这个层面的问题,即解决数据采集问题,解决采集后数据行列混合存储和压缩的问题,然后形成一个支撑标准sql预防的数据分析库.