解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

标签: 解密 阿里巴巴 公司 | 发表时间:2016-09-21 15:24 | 作者:
出处:http://news.cnblogs.com/

本文作者 fuqiang liu,文章原载于知乎,雷锋网已获授权。

本文通过一个的实验,简要介绍频域手段添加数字盲水印的方法,并进一步验证其抗攻击性。在上述实验的基础上,总结躲避数字盲水印的方法。(多图预警)

本文分为四个部分,第一部分综述;第二部分频域数字盲水印制作原理介绍;第三部分盲水印攻击性实验;第四部分总结;

一、综述

本文提供的一种实现“阿里通过 肉眼无法识别的标识码追踪员工”的技术手段。通过看其他答主的分析,阿里可能还没用到频域加水印的技术。

相对于空域方法, 频域加盲水印的方法 隐匿性更强,抵抗攻击能力更强。这类算法解水印困难,你不知道水印加在那个频段,而且受到攻击往往 会破坏图像原本内容。本文简要科普通过频域手段添加数字盲水印。对于 web,可以添加一个背景图片,来追踪截图者。

所谓 盲水印,是指人 感知不到的水印,包括 看不到或听不见(没错,数字盲水印也能够用于音频)。其主要应用于音像作品、数字图书等,目的是,在 不破坏原始作品的情况下,实现版权的防护与追踪。

添加数字盲水印的方法简单可分为 空域方法频域方法,这两种方法添加了冗余信息,但在编码和压缩情况不变的情况下, 不会使原始图像大小产生变化(原来是 10MB 添加盲水印之后还是 10MB)。

空域是指空间域,我们日常所见的图像就是空域。空域添加数字水印的方法是在空间域直接对图像操作(之所以说的这么绕,是因为不仅仅原图是空域,原图的差分等等也是空域),比如将水印直接叠加在图像上。

我们常说一个音有多高,这个音高是指频率;同样,图像灰度变化强烈的情况,也可以视为图像的频率。频域添加数字水印的方法,是指通过某种变换手段(傅里叶变换,离散余弦变换,小波变换等)将图像变换到频域(小波域),在频域对图像添加水印,再通过逆变换,将图像转换为空间域。相对于空域手段, 频域手段隐匿性更强,抗攻击性更高

所谓对水印的攻击,是指破坏水印,包括 涂抹,剪切,放缩,旋转,压缩,加噪,滤波等。数字盲水印不仅仅要敏捷性高(不被人抓到),也要防御性强(抗打)。就像 Dota 的敏捷英雄往往是脆皮,数 字盲水印的隐匿性和鲁棒性是互斥的。(鲁棒性是抗攻击性的学术名字)

二、频域制作数字盲水印的方法

信号是有频率的,一个信号可以看做是无数个不同阶的正弦信号的的叠加。

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

上式为傅里叶变换公式,是指时域信号(对于信号我们说时域,因为是与时间有关的,而图像我们往往说空域,与空间有关),是指频率。想要对傅里叶变换有深入了解的同学,建议看一下《信号与系统》或者《数字信号处理》的教材,里面系统介绍了傅里叶变换、快速傅里叶变换、拉普拉斯变换、z变换等。

简而言之,我们有方法将时域信号转换成为频域,同样,我们也能将 二维信号(图像)转换为频域。在上文中提到, 图像的频率是指图像灰度变换的强烈情况。关于此方面更系统的知识,参见冈萨雷斯的《图像处理》。

下面以傅里叶变换为例,介绍通过频域给图像添加数字盲水印的方法。 注意,因为图像是离散信号,我们实际用的是 离散时间傅里叶变换,在本文采用的都是 二维快速傅里叶变换,快速傅里叶变换与离散时间傅里叶变换等价,通过蝶型归并的手段,速度更快。下文中傅里叶变换均为二维快速傅里叶变换。

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

上图为叠加数字盲水印的基本流程。编码的目的有二,一是对水印加密,二控制水印能量的分布。以下是叠加数字盲水印的实验。

这是原图像,尺寸 300*240 

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

之后进行傅里叶变换,下图变换后的频域图像,

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

这是我想加的水印,尺寸 200*100,

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

这是我编码后的水印,编码方式采用随机序列编码,通过编码,水印分布到随机分布到各个频率,并且对水印进行了加密,

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

将上图与原图的频谱叠加,可见图像的频谱已经发生了巨大的变化,

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

之后,将叠加水印的频谱进行傅里叶逆变换,得到叠加数字水印后的图像,

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

肉眼几乎看不出叠加水印后的图像与原图的差异,这样,数字盲水印已经叠加到图像中去。

实际上,我们是把水印以噪声的形式添加到原图像中。

下图是在空域上的加水印图与原图的残差(调整了对比度,不然残差调小看不见),

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

可以看出,实际上上述方法是通过频域添加冗余信息(像噪声一样)。这些噪声遍布全图,在空域上并不容易破坏。

最终,均方误差(MSE)为 0.0244

信噪比(PSNR)为 64.2dB

那么,为什么频谱发生了巨大的变化,而在空域却变化如此小呢?这是因为我们避开了图像的主要频率。下图是原图频谱竖过来的样子,其能量主要集中在低频。

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

水印提取是水印叠加的逆过程,

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

经提取后,我们得到如下水印,问:为什么水印要对称呢?嘿嘿,大家想想看。

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是? 解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

三、攻击性实验

本部分进行攻击性实验,来验证通过频域手段叠加数字盲水印的鲁棒性。

1. 进行涂抹攻击,这是攻击后的图片:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

再进行水印提取:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

2. 进行剪切攻击,就是网上经常用的截图截取一部分的情况:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

进行循环补全:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

提取水印:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

3. 伸缩攻击(这个实验明码做的,水印能量较高,隐匿性不强):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

提取水印(水印加的不好,混频挺严重的):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

4. 旋转攻击(明码):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

提取水印:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

5. JPEG 压缩后(这个实验我好像是拿明码做的,能量主要加在了高频):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

提取结果:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

6. PS 4 像素马赛克/均值滤波等,攻击后图像

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

提取水印后图像:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

7. 截屏,

截屏后我手动抠出要测试的图像区域,并且抽样或者插值到原图尺寸:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

测试结果:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

8. 亮度调节(明码):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

水印提取:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

9. 色相调节(明码):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

水印提取:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

10. 饱和度调节(明码):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

水印:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

11. 对比度(明码):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

水印:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

12. 评论区用 waifu2x 去噪后图片:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

解水印:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

13. 美图秀秀,我对我女票一键美颜,美白,磨皮,加腮红,加唇彩(有一种很羞耻的感觉,捂脸):

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

提取水印:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

14. 对于背景纯色的图其实也是无所谓的

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

能量系数为 10 时加水印图片:觉得太显噪就把能量系数调低,不过水印的隐秘性和鲁棒性是互斥的

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

最终提取出的水印:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

15. 我用将 RGB>600 的像素设置成为(0,255,0) 来模拟 PS 魔术手,

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

提取水印为:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

16. 屏摄,好吧,这个实验我做哭了

屏摄图:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

实验结果:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

我把水印能量系数调整到 2000 都没有用。

屏摄之后与原图信噪比为 4dB 左右,我用多抽样滤波的方式试过,滤不掉屏摄引入的噪声。屏摄不仅引入了椒盐噪声,乘性噪声,还有有规律的雪花纹理(摩尔纹)。

四、总结

基于频域的盲水印方法隐藏性强,鲁棒性高,能够抵御大部分攻击。但是,对于盲水印算法,鲁棒性和隐匿性是互斥的。

本文方法针对屏摄不行,我多次实验没有成功,哪位大神可以做一下或者讨论讨论。还有二值化不行,这是我想当然的,觉得肯定不行所以没做实验。其他的我试了试,用给出的方法调整一下能量系数都可以。

我想大家最关心的是什么最安全,不会被追踪。

不涉及图像的都安全,比如拿笔记下来。

涉及图像的屏摄最安全,

截屏十分不安全。

本文链接

相关 [解密 阿里巴巴 公司] 推荐:

解密:阿里巴巴公司根据截图查到泄露信息的员工的技术是?

- - 博客园_新闻
本文作者 fuqiang liu,文章原载于知乎,雷锋网已获授权. 本文通过一个的实验,简要介绍频域手段添加数字盲水印的方法,并进一步验证其抗攻击性. 在上述实验的基础上,总结躲避数字盲水印的方法. 本文分为四个部分,第一部分综述;第二部分频域数字盲水印制作原理介绍;第三部分盲水印攻击性实验;第四部分总结;.

解密阿里巴巴的技术发展路径

- - 钛媒体网
2008年的一天, 阿里巴巴集团(下称“阿里”)开了一次内部会议. 在这次当时看来很平常的会议上,明确了两个议题:一,阿里是一家数据公司;二,阿里要把“计算”变成一种像水和电一样的公共品. 当时在中国还没有人谈“大数据”的概念;更没有人想到云计算会和一家互联网公司未来发展如此紧密. 1999年阿里成立之初,创始人“十八罗汉”中就不乏 技术基因.

阿里巴巴的零知识证明

- 见涛 - 科学松鼠会
战争中你被俘了,敌人拷问你情报. 你是这么想的:如果我把情报都告诉他们,他们就会认为我没有价值了,就会杀了我省粮食,但如果我死活不说,他们也会认为我没有价值而杀了我. 怎样才能做到既让他们确信我知道情报,但又一丁点情报也不泄露呢. 这的确是一个令人纠结的问题,但阿里巴巴想了一个好办法,当强盗向他拷问打开山洞石门的咒语时,他对强盗说:“你们离我一箭之地,用弓箭指着我,你们举起右手我就念咒语打开石门,举起左手我就念咒语关上石门,如果我做不到或逃跑,你们就用弓箭射死我.

[原]阿里巴巴B2B搜索学习

- - 文武天下
主搜索:商品搜索、商家搜索、采购搜索、app搜索. 行业搜索:淘货源、淘工厂、聚好货、主题市场、品牌馆等. 由于用户多,需求强烈,收益大,所以功能、场景、架构做到极致高效. 代码复用性强:基础通用功能进行组件抽象化. 组件通用性好:一些组件或者组件进行组合的服务,适用更多场景,支持更多功能. 转化效果好:算法做的比较深入、细致.

专访阿里巴巴研究员赵海平:从Facebook到阿里巴巴

- - 博客园_新闻
赵海平,2007 年加入只有不到 50 个软件工程师的 Facebook,致力于软件性能和架构分析,在此期间创建了 HipHop 项目,重新编写和实现 PHP 语言,使其速度提高 5 到 6 倍,为公司节约数十亿美元. HipHop 项目之后,致力于“用异步处理来优化分布式系统”的设计理念中,并为此做了多项分布式数据库的优化研究,在 PHP 语言中加入了 yield 和 generator 的新功能,来帮助日趋复杂的 Facebook 网页设计.

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

- - agapple
   08年左右,阿里巴巴开始尝试MySQL的相关研究,并开发了基于MySQL分库分表技术的相关产品,Cobar/TDDL(目前为阿里云DRDS产品),解决了单机Oracle无法满足的扩展性问题,当时也掀起一股去IOE项目的浪潮,愚公这项目因此而诞生,其要解决的目标就是帮助用户完成从Oracle数据迁移到MySQL上,完成去IOE的第一步. .

阿里巴巴高层震动的扯淡

- chenqj - It Talks--上海魏武挥的博客
这是真扯淡了,完全就是写博客,没有什么中心思想,想扯哪里扯哪里. 国内外有两家公司,遥相呼应地都非常强调所谓“价值观”,外有谷歌,内有阿里. 谷歌上市时,可以挑战华尔街的规矩,阿里上市时,则创下当时一批IPO的新高. 故而,这两家公司都是一时的翘楚,属于“从优秀到卓越”的公司. 公司是非常象一个宗教组织的——或者这么说,“好”公司都得象宗教组织.

阿里巴巴集团股权结构图

- telefan - Finacial Planet China 中国投资专家博客集
雅虎SEC文件原文是:“为了尽快获得一个重要牌照,阿里巴巴集团旗下在线支付公司支付宝已经被重组,其100%流通股现由阿里巴巴集团CEO马云控股的一家中国公司持有. 阿里巴巴集团管理层、主要股东雅虎和软银参与了有关支付宝重组条款的详细讨论. 收起 | 查看大图 | 向左转 向右转.

TradeSparq:阿里巴巴+Linkedin的采购网站

- anger - 互联网的那点事...
为什么人们会在Linkedin注册. 其中一个原因在于,他们想和他们的同伴(卖家或者买家)保持联络. 那么阿里巴巴这些年又是为什么这么流行呢,是因为它让国外用户很容易的找到数以千计的中国商品. 但是,你在Linkedin上,通常并不知道你联系的公司实际销售的是什么产品;而在阿里巴巴,如果你是一个制造商,想要推广自己的产品通常需要支付高昂的会员费(供应商会费一年3012美元).

马云给阿里巴巴员工的公开信

- Alex - cnBeta全文版
董事会已经批准B2B公司CEO卫哲、COO李旭晖引咎辞职的请求,原B2B公司人事资深副总裁邓康明引咎辞去集团CPO,降级另用. 几个月前,我们发现B2B公司的中国供应商签约客户中,部分客户有欺诈嫌疑. 而更令人震惊的是,有迹象表明直销团队的一些员工默许甚至参与协助这些骗子公司加入阿里巴巴平台. 大家已经看到了公司的公告,董事会已经批准B2B公司CEO卫哲、COO李旭晖引咎辞职的请求,原B2B公司人事资深副总裁邓康明引咎辞去集团CPO,降级另用.