文本用得好,也是神兵利器

标签: 文本 | 发表时间:2011-07-19 08:35 | 作者:(author unknown) Liao Yun
出处:http://www.feedzshare.com

来自: 趣科技 - 果壳网 - FeedzShare  www.guokr.com - FeedzShare  
发布时间:2011年07月18日,  已有 2 人推荐


文本(Text)虽然不是电脑上最出众的工具,但它却是我们日常生活中经常使用的格式。你可能会觉得冗长的文本十分烦人,但是一旦你能将以下九大文本处理窍门融会贯通,那么再碰到大段棘手的文字时,你一定能手到擒来。

1. 清除文本格式

/gkimage/e4/y4/ye/e4y4ye.png

如果文本拥有已定义的风格,那么在复制粘贴时你就会遇到麻烦,这是我们日常生活最常见的问题。当你从一个网站上复制一段文字到word中时,你会发现它仍然保持原有的字体、颜色和间距。 这时候你可能会先新建个文本文档,复制进去再粘贴回word,或者使用word中的“无格式文本”粘贴,可是如果复制文本带有许多空格、换行的话,你就需要借助到工具了。 Text cleaner这款软件不仅可以消除文本格式,还可以移除指定字符,如换行、空格等。在Windows系统中我们还可以使用Text Scrubber软件,而PlainClip工具则在MAC OS上表现出色。(当然还有更贵更强力的工具可供选择,比如CleanText和TextSoap)

2. 轻松从PDF中获取文本

/gkimage/6r/lm/ow/6rlmow.png

我们都知道PDF中可以直接复制文字,可是当你从剪贴板中粘贴出内容时,你会发现实际的文字和预想中的大相径庭。比如换行符错误、特殊符号无法识别等。我们向你推荐PDFTextOnline.com网站,你只需要将PDF上传至该网站,稍等片刻即可得到准确无误的文本。Windows用户还可以试试Text Mining Tool工具。

3. 使用命令行快速改变文本格式

/gkimage/15/nx/lc/15nxlc.png

一般的桌面应用程序和网页应用都可以很好的进行基本文本操作处理,但是遇到高级的复杂文本修改,我们就需要使用命令行了。借助命令行,我们可以在单个或多个文本中寻找/替换文字、管理任务列表、清空文本文件、记事等,因此它可以帮你省去不少时间和精力。Snipt.net网站储存有很多便捷的代码和命令行。

4. 识别未知字体

/gkimage/7b/21/0v/7b210v.png

一般而言,文本其实就是一段文字,但是给它们配上合适的字体就能使它们变得多姿多彩。但如果你的本地字体库没有该字体,那你就不知道它的名字,也就无法使用该字体。这时WhatFontIs、Identifont和WhatTheFont网站就能帮你找到答案,你只需上传一张文字图片即可。如果你所需要识别的字体在网页上,那么进入WhatFont,将“WhatFont”按钮加入书签,然后在打开的网页上点击该书签,该工具便会出现,只要点击文字,就会出现字体的全部信息。

5. 将文字图片转化为文本

/gkimage/q7/mh/71/q7mh71.png

一些作者或网站为了保护版权,将文字转化为图片格式,使人们无法复制出文本。经常在起点看小说的童鞋一定深有同感。难道我们就束手无策了吗?所谓道高一尺魔高一丈,这时候光学字符辨识(OCR)便派上了用场。网上有很多使用这一技术的软件,推荐以下五款:Adobe Acrobat、Evernote、OmniPage、ABBYY FineReader、Readiris。ABBYY FineReader曾拿过文字识别工具评选的冠军。如果你只是想在文字图片中超找有关文字,你可以使用Evernote快速搞定。

6. ASCII码使文本更有趣、安全

/gkimage/lx/rx/zn/lxrxzn.png

作为现今最通用的字节编码,ASCII码已经广为人们熟知。你可能还听说过“ASCII艺术”,它是指使用ASCII码中可打印的95种电脑字符(一共有128个)来表达图片,比如:-) 这一微笑符号。如果你想体验其中的乐趣,那就在试试这些在线工具吧: 制作ASCII码肖像生产ASCII文字甚至还能用ASCII制作QuickTime电影 !如果你想来点实用性强的,那么试试用 ASCIIFlow 来绘制纯文本流程图表吧。除此之外,ASCII不仅能用来娱乐,还可以隐藏email地址,防止垃圾邮件骚扰,或是增强密码安全性。

7. 增强网页可读性

/gkimage/3v/5e/k2/3v5ek2.png

网页可读性是用户体验中十分重要的基本环节,它决定信息能否被顺利被用户获取。没人会喜欢看满是广告和图片的网页,因此适当使用文本十分重要。以下几款工具可使网页变得更加舒适、简易:Readability 这个网站就提供简化网页的服务,它可以去除网页广告、调整网页字体大小和颜色以及背景色等,极大的增强了网页的可读性,一些RSS阅读器也嵌入了该服务。Instapaper和ReadItLater也提供了相似的服务。

8. 多种设备,同步操作

/gkimage/rj/zj/ps/rjzjps.png

如果你同时使用笔记本电脑、台式电脑、平板电脑和智能手机中的一种或多种,就不得不考虑多种设备之间的效率问题了。首先我们需要面对的就是数据问题。有时你需要将这些设备中的一些信息数据进行同步,当然同步信息的工具也有很多:Mac系统、Windows系统、iPhone和Android,推荐Simplenote软件,轻松搞定文本过滤、同步等一系列要求。文本同步可以保证你无论何时何地都能得到想要的数据,这些数据你可以放在设备中,也可以使用云服务储存。

9. 文本扩展

/gkimage/w0/51/yp/w051yp.png

什么是文本扩展(Text Expansion)呢?你可以简单地理解为简称,比如我们通常使用doc表示document,扩展后的文字通常比较长。只用文本扩展可以帮助我们节约时间精力,还能避免一些拼写错误。不论你是在写论文或是在聊天,文本扩展工具都可以极大得提高你的效率,进而你就会发现生活离开了它将会变得多么不便。

好了,菜鸟们要是能熟练运用以上的文本技巧一定能使平时的工作事半功倍,高手们要是也有实用的文本秘籍,不妨也来分享下吧!


信息来源: lifehacker

相关 [文本] 推荐:

使用 Antlr 处理文本

- bill - IBM developerWorks 中国 : 文档库
Antlr 是一个基于 Java 开发的功能强大的语言识别工具,其主要功能原本是用于识别编程语言,但是当我们遇到一些常规的文本处理工作时,使用 Antlr 做这些工作可能比单纯的使用正则表达式高效、有趣的多. 本文将和您一起探讨如何使用 Antlr 完成抽取(Extract)、转换(Translate)和重写(Rewrite)这 3 类常见的文本处理工作.

奇怪的一段文本

- 1212e - Solidot
slrey 写道 "最近在网上看一本小说,发现里面有些句子很突兀,似乎是别的文章里的,于是 Google 了一下其中一小段,发现结果很有意思,大家可以试试. 关键词是“厂里的集体宿舍人满为患”,无论是 Google 还是百度,会搜索出很多不同领域的文章,而这些文章中都会包含这段关键字. 个人推测是不是某网站论坛或ISP对某些关键词设置了替换过滤.

简单的文本协议

- - DCCMX
写网络程序躲不过协议,协议其实就是定义了消息的格式,以及消息是如何交换的. 协议可简单可复杂,复杂精密如TCP协议,简单奔放如HTTP的协议. 这里将我所接触到的协议稍微总结一下,最后抛出一个个人设计的简单通用的文本协议. 设计一个协议不是一件很容易的事情,尤其是当对设计的要求包含很好的描述性和可扩展性的时候.

文本数据的价值

- - 技术改变世界 创新驱动中国 - 《程序员》官网
文/Bill Franks. 当你开车路过一家餐厅的停车场时,你的手机屏幕上弹出了这家餐厅的当日特价菜品推荐,这种体验是不是很棒. 如果赌场老板把发牌人忘记付给你的20美元亲自送还给你,你的心里是不是有点儿小激动. 如果在线视频游戏能够把和我们玩法相近的用户即刻告知我们,这世界会不会变得很美妙. 我们发现了一个非常明显的趋势,各行各业虽然生成了许多大数据源,但其底层的支撑技术却是相同的.

TextToSpeech 文本自动朗读

- - Java - 编程语言 - ITeye博客
Android提供了自动朗读支持. 如果调用setLanguage(Locale loc)的返回值是 TextToSpeech.LANG_COUNTRY_AVAILABLE 则说明当前TTS系统可以支持所设置的语言、国家选项. 归纳起来,使用TextToSpeech引擎的步骤如下:. (1)创建TextToSpeech对象,创建时传入OnInitListener监听器监听创建是否成功.

监听文本框输入

- - 博客园_Ruby's Louvre
Firefox、Chrome、IE9,IE10 均支持 oninput 事件,此外所有版本的 IE 均支持 onpropertychange 事件. oninput 事件在用户输入、退格(backspace)、删除(delete)、剪切(ctrl + x)、粘贴(ctrl + v)及鼠标剪切与粘贴时触发(在 IE9 中只在输入、粘贴、鼠标粘贴时触发).

LibShortText - 短文本分类

- - 互联网旁观者
Chih-Jen Lin的新作.   青春就应该这样绽放   游戏测试:三国时期谁是你最好的兄弟.

文本特征抽取

- - zzm
文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域. 文本挖掘就是从大量 的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不同. 文本挖掘的对象是海量、异构、分布的文档 (web);文档内容是人类所使用的自然语言,缺乏计算机可理解的语义.

kmeans 实现文本聚类

- - IT瘾-dev
拿到的需求是输入n个文本,对文本进行聚类,由于这些输入不能通过历史数据进行训练,所以这个主要就是用无监督学习来解决. 谈到聚类就会想到kmeans,它的核心思想是给定的K值和K个初始质心将样本中每个点都分到距离最近的类簇中,当所有点分配完后根据每个类簇的所有点重新计算质心,一般是通过平均值计算,然后再将每个点分到距离最近的新类簇中,不断循环此操作,直到质心不再变化或达到一定的迭代次数.

浏览器如何渲染文本

- old9 - jjgod / blog
浏览器是我们最常用的软件之一,文本又是网页中最主要的元素,在浏览器显示文本的过程中有许多有趣的细节,值得展开来讲讲,或许能减少一些误解. 这是一个比较粗略的,概括性的介绍,尽可能不涉及过多的技术细节和具体实现,而立足于给 Web 开发者和设计师提供一些正确的概念. 下面的介绍主要根据我对 WebKit 和 Gecko (Firefox) 的印象来谈,其他的浏览器也大致相同,如有阙漏之处欢迎指出.