如何写好技术文档——来自Google十多年的文档经验

标签: java | 发表时间:2021-07-27 12:33 | 作者:xindoo
出处:https://segmentfault.com/blogs
本文大部分内容翻译总结自《Software Engineering at Google》 第10章节 _Documentation_。 另外,该书电子版近日已经可以免费下载了 https://abseil.io/resources/swe_at_google.2.pdf,有兴趣的同学可以下载翻阅下。 首先声明, 本问所说的文档不仅限于纯文本文档,还包含代码注释(注释也是一种特殊形式的文档)

在这里插入图片描述
很多技术人自己非常轻视技术文档的书写,然而又时常抱怨文档不完善、质量差、更新不及时…… 这种在程序猿间普遍存在的矛盾甚至已经演变成了一个段子。
在这里插入图片描述

文档的重要性

高质量的文档对于一个组织或团队来说有非常多的益处, 比如让代码和API更容易理解、错误更少;让团队成员更专注于目标;也可以让一些手工操作更容易;另外如果有新成员加入的话有文档也会让他们更快融入……

写文档有比较严重的 收益滞后性,不像测试,你跑一个测试case,它能立即告诉你是对还是错,它的价值马上就体现出来了。而写一份文档,随着时间的推移,它的价值才会逐渐体现出来。 你可能只写一次文档,将来它会被阅读上百次、上千次,因为一份好的文档可以在未来替你向别人回答类似下面这些问题。

  1. 为什么当时是这么决策的?
  2. 为什么代码是这样实现的?
  3. 这个项目里都有哪些概念?
  4. ……

写文档同样对于写作者也有非常大的收益:

  • 帮你构思规范化API: 写文档的过程也是你审视你API的过程,写文档时会让你思考你API设计是否合理,考虑是否周全。如果你没法用语言将API描述出来,那么说明你当前的API设计是不合理的。
  • 文档也是代码的另一种展现: 比如你两年后回过头来看你写过的代码,如果有注释和文档,你可以很快速理解代码。
  • 让你的代码看起来更专业: 我们都有个感觉,只要文档齐全的API都是设计良好的API,虽然这个感觉并不完全正确,但这两者确实是强相关的,所以在很多人眼里,文档的完善度也成为衡量一个产品专业度的指标。
  • 避免被重复的问题打扰: 有些问题你只需要写在文档里,这样有人来问你的时候你就可以让他直接去看文档了,而不是又给他解释一遍。

    为什么大多数人都不喜欢写文档?

    关于文档的重要性,每个技术人或多或少都知道一些,但很多人还是没有写文档的习惯,为什么? 除了上文中提到的文档的 收益滞后性外,还有以下几点原因:

  • 很多工程师习惯将写代码和写作割裂开,不仅仅是在工作上,而且在思想上就认为它们是完全不相关的两项工作,这就导致好多人重代码不重文档。
  • 也有很多工程师认为自己不善写作,索性就不写了。 这实际是个偷懒的借口,写文档不需要华丽的辞藻、生动的语言,你只需要将问题讲清楚即可。
  • 有时候工具不好用也会影响的文档写作。如果没有一个很好的写作工具将写文档嵌入到开发工作流程中的话,写作确实会增加工作的负担。
  • 大多数人将写文档看做是工作的额外负担。 我代码都没时间写,哪有时间写文档!,这其实是错误的观念, 文档虽然前期有投入,但能让你代码的后期维护成本大幅降低,磨刀不误砍柴工这个道理相信大家都还是能理解的。

如何产出高质量文档

既然理解了好文档的重要性,我们如何保证在时间的长河中维护好一份文档,这里有些相关的方法论,大家可以参考下。

像管理代码一样管理文档

对于如何写出好代码,整个技术圈已经有好多经验的总结了,比如书籍《重构》《代码简洁之道》…… 针对各种编程语言,也有相关的规范,比如国外的Google C++规范,国内的 阿里Java开发规范等…… 但对于文档 似乎相关的资料却很少。但实际上,不应该把文档和代码割裂开来,你可以简单粗暴地认为 文档其实就是用一种特殊语言书写的代码,这种语言就是人类的语言。这么想的话,实际上我们很多在代码和工程中总结出来的经验,也可以直接用在文档中,比如:

  • 有统一的规范
  • 有版本控制
  • 有明确的责任人维护
  • 有变更Review机制
  • 有问题的反馈和更新机制
  • 定期更新
  • 有衡量的指标(比如准确性,时效性)

明确你的读者是谁

写文档有一个很常见的错误,那就是很多人文档都是写给自己看的,这种情况下就会导致你的文档只有自己或者和你有相似知识背景的人才能看懂,团队较小时这种问题还好,你们都做着类似的工作,所以也都能看懂文档。但当团队逐渐壮大后,问题就会凸显出来,新人有时候有着和你不同的工作背景,甚至现在都做着不同的工作内容,这时候你之前写的文档他们就很难读懂了。

所以在写文档之前请明确你文档可能的读者会是哪些人,然后针对他们的特点着重关注如何才能让他们理解。当然,文档也不一定要非常严肃和完美,只要能向你潜在的读者说明问题即可。 记住 文档是写给别人看的,不是给自己看的。

根据专业水平可以大致将读者分为三种 新手、老手和专家,针对不同水平的人写作需要有侧重点。比如针对新手,你需要重点介绍下里面涉及到的术语和概念,然后详细讲解具体的的实现。相反,针对专家 你可以省去这些额外的信息。注意,这里没有严格的标准,因为有些文章新手会看,专家也会看, 这里还是需要具体情况具体分析。

另外一种对读者分类的方式就是根据读者阅读文档的目的来分类,比如有人知道自己遇到了什么问题,就是来找解决方案的。还有一批人只有一个简单的想法,但不知道具体的问题。举个例子,以读数据库慢为例,前者已经知道数据库慢可能是因为数据量巨大且没有加索引,解决方案很简单 加索引,这时候他可能需要知道的是如何正确地加索引。而后者可能着重关注的是为什么读数据库会慢,这时候你可能需要额外重点介绍下数据库相关的原理。

清晰的分类

文档大致可以分为以下几种类型,每种类型也有自己不同的特点和写作侧重点。

参考文档

参考文档也是大部分开发人员日常会使用和书写的文档,比如我们使用某个框架或者工具,都会有API说明文档,这就属于参考类文档。 它并没有太多的要求,只要能向读者展示清楚如何 使用即可,但无需向读者讲明具体的实现。

注:参考文档并不仅限于API文档,还包括文件注释、类注释、方法注释,要求都是能准确说明其用法。

设计文档

很多公司或者团队在项目开始前都要求有设计文档,设计是项目实施的第一步,所以在设计文档书写的过程中要求尽可能考虑周全,例如该项目的存储、交互、隐私……

好的设计文档应该包含以下几个部分:

  1. 设计目标
  2. 实现的策略
  3. 各种利弊权衡和具体决策
  4. 替代方案
  5. 各种方案的优缺点

写设计文档的过程也你对整个项目做规划、思考可能出现问题的过程,设计的越详细、思考的越多,未来遇到问题的可能性就会越小。

引导类文档

引导类文档也很常见,一般都是 Step by Step的形式。比如我们在使用某个框架或者工具的时候,一般都会有个引导类的文档一步一步帮助你快速上手。 大家 写引导类文章大家非常容易犯的一个错误就是预设了很多背景知识。 一般使用文档都是有开发者写的,他们都非常了解这个工具的相关的知识,所以习惯性的会认为, 啊 这个知识点很简单 用户也肯定会吧,实际上用户不一定会。这 本质上就是一种认知偏差,这种现象在跨团队协作 尤其是多端协作的时候也非常明显。

这类型的文档写作中, 要求写作者尽可能站在用户的视角上思考,极力避免出现和用户的认知偏差,力争每个步骤做到明确无歧义,每两个步骤之间做到紧密衔接。

概念性文档

当参考文档无法解释清楚某些东西的时候,就需要概念性文档了,比如某个API的具体实现原理。其主要是为了扩充参考文档,而不是替代参考文档。有时候这和参考文档会有些内容重复,但主要还是为了更深层次的说明某些问题、解释清楚某个概念。

概念性文档也是所有文档中写作最难的,也是被阅读最少的,所以很多情况下工程师最容易忽视。而且还有另外一个问题,没合适的地方放,参考文档可以写代码里,落地页可以写项目主页里,概念性文档似乎也只能在项目文档里找个不起眼的角落存放了。

这类文档的受众会比较广,专家和新手都会去看。另外,它需要强调概念清晰明了,因此可能会牺牲完整性(可以由参考文档补齐),也有可能会牺牲准确性,这不是说一定要牺牲准确性,只是应当分清主次,不重要的就没必要说了。

Landing pages(落地页)

Landing pages就先简单翻译成落地页了,没想到啥恰当的翻译词。比如一个团队或者项目的导航页,虽然没啥具体的内容,但应该包含其他页面的链接。 比如你新入职一个团队,比较成熟的团队都会扔给你一个文档,这个文档里包含常用的工具、文档链接,这就是这个团队的落地页。
落地页的问题就是随着时间的推移,页面可能会变的越来越乱,而且有些内容会失效,不过这些问题都好解决,做好定期的维护和整理就行。
落地页的技术难度不高,但要求内容的有效性、完整性和分类清晰。

文档Review

在一个组织内,光靠个人去维护文档是不行的,必须得借助群体的智慧。在一个组织内部,文档的变更也应该像代码的变更一样,需要被其他人Review,以提前发现其中的问题并提升文档的质量。

如何Review文档:

  • 专业的视角来保证准确性: 一般由团队里比较资深的人负责,他们关注的核心点是文档写的对不对,专不专业。如果Code Review做的好的话,文档的Review也属于Code Review的一部分。
  • 读者视角保证简洁性: 一般由不熟悉这个领域的人来Review,比如团队的新人,或者文档的使用者。这部分主要是关注文档是否容易被看懂。
  • 写作者视角保证一致性: 由写作经验丰富或者相关领域比较资深的人承担,主要是为了保证文档前后是否一致,比如对同一个专业术语的使用和理解是否有歧义。

写文档的哲学

上面部分站在组织和团队的视角来看如何提高文档质量,我们接下来看看站在个人写作者的视角上如何写出高质量的文档。

5W法则

5W法则相信大家已经听的多了,分别是Who What When Where Why,这是一个广泛被用在各行各业的法则,写文档当然也能用(5W法则堪称万金油,啥地方都能用)。

  • WHO: 前面已经说过了,文档是写给谁看的,读者是谁。
  • WHAT: 明确这篇文档的用途,有时候,仅仅说明文档的用途和目的就能帮你搭建起整个文档的框架。
  • WHEN: 明确文档的创建、Review和更新日期。因为文档也有时效性,明确相关日期可以避免阅读者踩坑。
  • WHERE: 文档应该放在哪! 建议一个组织或者团队有统一的永久文档存放地址,并且有版本控制。最好是方便查找、使用和分享。
  • WHY: 为什么要写这篇文档, 你期望读者读完后从文档中获得什么!

三段式写作

写文章一般都会有三个部分,专业写作者也讲究 凤头、猪肚、豹尾,这三个词概括出了好文章三部分应有的特点。技术文档也算是文章的一种,所以一般也都会有这三部分,每个部分有其自己的作用,比如 第一部分阐述问题,中间部分介绍具体的解决方案,第三部分总结要点。 但这也并不以为着文档应该有三个部分,如果文档内容比较多,可以将其做更细致的拆解,可以适当增加一些冗余的信息帮助读者理解文档内容。虽然很多工程师都讨厌冗余 极力追求简洁,但写文档和写代码不同,适当的冗余反而可以帮助读者理解,很简单,举个例子,比如写作中经常举例子,举的例子本质上就是冗余信息,生动的例子肯定是能帮助读者理解抽象内容的(我想这就是自举
吧)。

结语

目前看到比较好的一个现象就是大家越来越重视文档了,但和测试相比 重视的程度还不够。测试已经是工作流程中不可或缺的一部分了,而文档依旧还不是。当然这可能和文档本身的特性相关,测试很容易被自动化,也有非常多的客观指标来评估。文档却做不到,首先文档的书写需要人手动介入,而文档的质量也没有太多客观的指标评估,提升文档的数量和质量只能从文化和工作流程上去逐渐改变。

最后总结下本文几个关键点:

  • 随着时间的推移和组织规模的壮大,文档会越来越重要。
  • 文档也应该是开发流程的一部分。
  • 一篇文档只专注在一件事上。
  • 文档是写给读者看的,而不是给你自己看的。

相关 [技术 文档 google] 推荐:

如何写好技术文档——来自Google十多年的文档经验

- - SegmentFault 最新的文章
本文大部分内容翻译总结自《Software Engineering at Google》 第10章节 _Documentation_. 另外,该书电子版近日已经可以免费下载了 https://abseil.io/resources/swe_at_google.2.pdf,有兴趣的同学可以下载翻阅下.

[技术贴]不用翻墙上Google+,Youtube

- Ken - 草榴社區
修改C:\Windows\System32\drivers\etc下的hosts文件,用记事本打开. 将下面的字段添加进去,保存即可(注:每行一条,前面不要有空格)也可以直接下载我的hosts文件  覆盖即可  http://filemarkets.com/file/cjwdluo/27a50499/.

免费的晚餐--Google技术学习

- - 企业架构 - ITeye博客
作者: 江南白衣,原文出处:  http://blog.csdn.net/calvinxiu/archive/2007/01/31/1498597.aspx. 如果说Google的搜索引擎是免费的早餐,Gmail们是免费的午餐的话,.      http://labs.google.com/papers/ 就是Google给开发人员们的一份免费的晚餐.

Google Images才是Google最有价值的技术

- - 比特客栈的文艺复兴
社交网络这种低效率的内容整合见鬼去吧. Google Images是怎样把一张图转化为搜索关键词与搜索结果的. 用户只要输入一张图,而且根本不需要是完整的图片(例如QQ群里右键的截图). 图像处理算法找到对应完整的图片记录(图片结果). 找到引用图片的网站,抽取常见关键字(网页结果). 关键字联想,寻找最匹配的网页(维基,提供关键词解释,等于图片注释).

Crocodoc推HTML5文档嵌入技术,Dropbox, Yammer, SAP已在使用

- - 雷锋网
从YC毕业的 Crocodoc正推出一项新的技术,旨在将企业级的HTML5的office或者PDF嵌入基于web的产品中. 该公司最初利用基于Flash的技术让你上传一份PDF,在浏览器中可以获得一个相同版本的文档,并且可以和同事一起实时协同共享,添加备注等. Crocodoc在2010年成立,目标是干掉Acrobat.

探索Google App Engine背后的奥秘(1)--Google的核心技术

- Hui Hui - DBA Notes
作者:ikewu 发布在 dbanotes.net. 投稿人吴朱华曾在IBM中国研究院从事与云计算相关的研究,现在则致力于云计算技术. 本系列文章基于公开资料对Google App Engine的实现机制这个话题进行深度探讨. 在切入Google App Engine之前,首先会对Google的核心技术和其整体架构进行分析,以帮助大家之后更好地理解Google App Engine的实现.

Google 向新版 Linux 内核贡献技术

- flypen - 谷奥——探寻谷歌的奥秘
本月初刚刚发布的 Linux 2.6.35 版内核中,包含了 RPS 和 RFS 这两项由 Google 贡献的新技术. RPS 的全称是 Receive Packet Steering,这项技术将流入的数据包分布给所有可用的 CPU 去处理,而 RFS (Recevie Flow Steering) 则负责计算哪个核心最适合处理哪项工作.

Google+用户群生相:大多为男性 木讷懂技术

- 宏劼 - cnBeta.COM
社交网站数据统计公司称,Google+用户大多数为男性,其比例或高达86.8%. 这些人生性木讷,但是对于技术有很深刻的理解. 从社交网站选定个人资料页面中收集数据的第三方网站SocialStatistics称,谷歌社交网站Google+的男性用户比例高达86.8%. 而专 门追踪调查Google+用户信息的网站findpeopleonplus称,Google+上的男性用户占到了全部用户的73.7%.

逃离 Google——不再酷的公司,落后的技术!?

- Ray - 爱范儿 · Beats of Bits
之前我们报道过 Google Wave 的开发者 Lars Rasmussen 跳槽到 Facebook 的一些感受. 最近,另一位 Google Wave 的成员 Dhanji Prasanna 也在拿到了 2010 年的年度奖金后离开了 Google,他在博客中撰文称,有 8 个 Google Wave 项目组的同事在过去两个月相继离开了 Google.

桌面版 Google Maps 开始测试用 WebGL 替换 flash 技术

- 可可 - 谷奥——探寻谷歌的奥秘
如果你喜欢Google Maps for Android那远比桌面版流畅的界面,那么现在是时候尝试新事务了. 如果你使用Chrome 14+或Firefox 8+浏览器,且显卡支持WebGL标准,那么现在打开Google Maps即可在左侧看到一个提示:“Want to try something new?”,点击之后Google Maps就不会再使用flash技术来显示街景了,而换用WebGL(Google称其为MapGL),且可显示出跟Android手机上一样的3D地图界面.