谁说的抓X东价格就必须OCR啊?
- mrluanma - hUrR DuRr最近Horse Cloud手下的事情比较多,很多人是在吵架中才发现,X东的价格其实是用个图片显示的. 这个貌似X蛋和X东打价格战的时候就是图片了. 但是X东的价格根本不需要OCR就可以抓取到的:. 从过去的体验来看,不大看好一淘,我还是喜欢box-z.com这样的. 看到这个新闻《一淘网:X东商城没有技术能力屏蔽抓取》.
最近Horse Cloud手下的事情比较多,很多人是在吵架中才发现,X东的价格其实是用个图片显示的。这个貌似X蛋和X东打价格战的时候就是图片了。但是X东的价格根本不需要OCR就可以抓取到的:
从过去的体验来看,不大看好一淘,我还是喜欢box-z.com这样的。
看到这个新闻《一淘网:X东商城没有技术能力屏蔽抓取》
一淘网公关部负责人吴昊25日对财新记者证实称,目前一淘对X东商城的商品信息及价格变动的抓取还在继续,但暂时停止收录京东商城产品的用户评论。
吴昊表示,原因是一淘内部目前正对“是否收取用户评论”进行相关的策略讨论,但他强调,从技术层面上讲,X东商城并没有能力真正阻挡一淘对其用户评论信息的抓取。
一淘真应该直接把这个PR开了。主动占据道德制低点,这真是一种奉献精神啊。
这个根本就不是技术问题,而是个PR灾难。其实最简单的办法就是,一淘网可以去向某个 “第三方” 中立机构购买相关数据。这个 第三方 只要user-agent
不是EtaoSpider
就行啊。真笨。