谁说的抓X东价格就必须OCR啊?

标签: News e-commerce IT | 发表时间:2011-10-26 07:08 | 作者:est mrluanma
出处:http://blog.est.im

最近Horse Cloud手下的事情比较多,很多人是在吵架中才发现,X东的价格其实是用个图片显示的。这个貌似X蛋和X东打价格战的时候就是图片了。但是X东的价格根本不需要OCR就可以抓取到的:

从过去的体验来看,不大看好一淘,我还是喜欢box-z.com这样的。

看到这个新闻《一淘网:X东商城没有技术能力屏蔽抓取

一淘网公关部负责人吴昊25日对财新记者证实称,目前一淘对X东商城的商品信息及价格变动的抓取还在继续,但暂时停止收录京东商城产品的用户评论。
吴昊表示,原因是一淘内部目前正对“是否收取用户评论”进行相关的策略讨论,但他强调,从技术层面上讲,X东商城并没有能力真正阻挡一淘对其用户评论信息的抓取。

一淘真应该直接把这个PR开了。主动占据道德制低点,这真是一种奉献精神啊。

这个根本就不是技术问题,而是个PR灾难。其实最简单的办法就是,一淘网可以去向某个 “第三方” 中立机构购买相关数据。这个 第三方 只要user-agent不是EtaoSpider就行啊。真笨。

相关 [价格 ocr] 推荐:

谁说的抓X东价格就必须OCR啊?

- mrluanma - hUrR DuRr
最近Horse Cloud手下的事情比较多,很多人是在吵架中才发现,X东的价格其实是用个图片显示的. 这个貌似X蛋和X东打价格战的时候就是图片了. 但是X东的价格根本不需要OCR就可以抓取到的:. 从过去的体验来看,不大看好一淘,我还是喜欢box-z.com这样的. 看到这个新闻《一淘网:X东商城没有技术能力屏蔽抓取》.

iOS上的OCR软件TextGrabber

- Webto - 大鱼若智,大智若鱼
就在我写完上一篇关于读书笔记的Blog之后,我迅速而及时地发现了一款OCR大厂的产品. 昨天我闲来无事在App Store里闲逛,忽然发现了ABBYY(中文名叫做“泰比”,有兴趣可以访问 abbyy.cn )的名字,它不久前(6月2日)推出了一款名为“ABBYY TextGrabber”的软件. 跟中国的汉王一样,这家总部位于莫斯科的公司拳头产品就是光学识别(OCR, Optical Character Recognition)技术.

OCR:慧眼读世界

- - 微软亚洲研究院
作者:微软亚洲研究院首席研究员 霍强. 把手机摄像头对准菜单上的法语菜名,屏幕上实时显示出翻译好的中文菜名;将全世界图书馆的藏书转化为电子书;街景车游走于大街小巷,拍摄街景的同时也从街景图像中自动提取文字标识,让地图信息更丰富更准确……这些场景的背后有一个共同的关键技术——OCR (Optical Character Recognition),光学字符识别.

クラウド型「人力OCR」、どう思う?

- 三十不归 - スラッシュドット・ジャパン
uxi 曰く、ASCII.jpにて、クラウドノート「KYBER」なるものが紹介されている(記事). 要するに自分の書いたノートをクラウドに保存できるという、一見よくありそうなサービスなのだが、このサービスが一線を画すのが(中国人を主体とした)人海戦術によって非常に高精度なOCRを行うという点. しかし、処理を行うのは日本語が分からない人間で、また一度に処理するのは意味の繋がらないような細切れの断片だとしても、自分の書いたメモが確実に人目に触れていると思うと、どうにも気持ちが悪い.

最好的OCR识别软件:ABBYY FineReader中文绿色版

- 米随随 - 精品绿色便携软件
ABBYY FineReader是世界排名第一的OCR文字识别工具,提供高效和精准的文档识别、数据提取解决方案,支持多国字符和彩色文件识别,主要用于将扫描图像、图片型PDF转化成可编辑的文本. ABBYY FineReader可以看作是超级无敌的PDF转换器,能转换任意类型的PDF,其他PDF转换工具、或清华紫光OCR、尚书七号、汉王OCR等在它面前都可谓是浮云.

专业PDF转换器(支持OCR):Wondershare PDF Converter便携版

- 抹布 - 精品绿色便携软件
Wondershare PDF Converter是一款具备专业转换效果的PDF转换器,支持将PDF转换为Word、Excel、PowerPoint、EPUB、HTML、Text等格式,转换后能保留源PDF的文本、图片、表格、超链接、页面布局与格式等信息. 转换PDF至XLS/XLSX时,能够使设置是否保存表单的格式信息,如字体颜色等,转换PDF为EPUB时,则可设置字体颜色及背景色.

Java OCR tesseract 图像智能字符识别技术

- - CSDN博客互联网推荐文章
公司有需求啊,所以就得研究哈,最近公司需要读验证码,于是就研究起了图像识别,应该就是传说中的(OCR:光学字符识别OCR),下面把今天的收获整理一个给大家做个分享. 本人程序用的tesseract,官方地址:https://code.google.com/p/tesseract-ocr/,不为别的,谁让它支持我们的天朝的文字呢~哈.

android 端拍照并运用Tesseract OCR 识别图片中字符

- - 移动开发 - ITeye博客
我上传了一个android studio环境下的例子,可以拍照或者选择图库中图片进行识别. 这个链接()包括一份工程源代码和 两个压缩包(语言包),一个是中文汉字,一个是英文. 必须现在手机内部存储根目录. (在程序中获取这个字符串就明白这个目录是什么了Environment.getExternalStorageDirectory()).

OCR技术在爱奇艺的应用实践及演进

- - 掘金 后端
随着人工智能的热度上升,图像识别这一细分领域也渐渐被人们所关注. 在很多公司的业务中,有很多需要对图片进行识别的需求. 为了帮助业务实现对这些图片、文档的识别和结构化,业界进行了一系列的实践和探索,最终确定了一些可行的方法,总结了在实践过程中可能遇到的问题和难点. 为了更好地了解OCR技术在爱奇艺的应用实践,最近,InfoQ“大咖说”栏目邀请爱奇艺智能平台部助理研究员——Harlon 进行了一场直播分享,结合目前的业务需求,为我们陈述了爱奇艺在探索OCR技术发展过程中遇到的痛点和难点,以及识别技术的一些细节,以下是采访实录.