如何阅读一篇论文

本文作者是滑铁卢大学David R. Cheriton计算机学院的教授S. Keshav,第一版发表在SIGCOMM Computer Communication Review 2007上,最新版链接在这里

研究人员通常会花费大量的时间来阅读论文。然而,很少有人教我们怎样高效地阅读论文。本文主要介绍了一种名为“三遍法”(three-pass method)的阅读方法,以及如何使用这种方法做文献综述。

1. The Three-Pass Approach

顾名思义,“三遍法”的核心思想就是按照不同的目标多次阅读论文,而不是直接从论文的开头读到结尾。每一遍阅读都有特定的目标,而且后面的阅读建立在前面阅读的基础之上:第一遍阅读给出关于论文的一般性概念。第二遍要掌握论文的主要内容而非细节。第三遍则是深入理解论文。

1.1. The First Pass

第一遍阅读主要是快速浏览论文,类似于“鸟瞰”,对全文内容有一个大致理解。此外,还可以决定是否需要继续阅读第二遍和第三遍。第一遍阅读大致需要5-10分钟,主要包括以下步骤:

  1. 仔细阅读标题、摘要和介绍部分
  2. 阅读每一节和每小节的标题,忽略其他东西
  3. 浏览数学相关的内容(如果有的话)以确定潜在的理论基础
  4. 阅读结论部分
  5. 浏览参考文献,重点看一下哪些参考文献已经阅读过了

第一遍阅读结束后,我们可以回答下面的5C问题:

  1. Category: 这是一篇什么类型的论文?一篇测量相关的论文?还是对现存系统的分析?亦或是对研究原型的描述?
  2. Context: 有哪些文献与这篇论文比较相关?分析问题时的理论基础有哪些?
  3. Correctness: 论文中做的假设是否有效?
  4. Contributions: 文章的主要贡献是什么?
  5. Clarity: 这篇文章表达清晰吗?

通过回答这五个问题,我们可以决定是否继续阅读这篇文章。不在继续阅读的原因可能有:对论文不感兴趣;对该领域了解不足;作者做出了无效的假设等。第一遍阅读适用于那些目前不在我们研究领域但未来可能相关的论文。

顺便提一下,我们写的一篇论文,大多数审稿人和读者可能只阅读一次,所以要选择连贯的小节标题,并撰写简洁而全面的摘要。如果审稿人在浏览论文一遍之后还不能抓住论文的中心点,那么这篇文章大概率会被拒绝;如果一个读者不能在五分钟之内找到文章的闪光点,那么这篇文章可能不会再被阅读。因此,使用精心挑选的图表总结论文的“图形摘要”是一个很好的想法,并且可以越来越多地在科学期刊中找到。

1.2. The Second Pass

在第二遍中,仔细阅读论文,但忽略诸如证明之类的细节。这样有助于记下关键点,或在边缘空白处做出批注。来自奥格斯堡大学的Dominik Grusemann建议“记下不理解的术语,或者想问作者的问题”。如果我们是论文仲裁人,这些批注对写评审意见会有帮助,而且在项目委员会的会议上,它们会支撑我们的评审意见。

  1. 仔细查看论文中的图片、表格等其他展示元素,将注意力集中在图形图片上。坐标轴是否被正确标记?图片中是否显示误差线,结论是否具有统计显著性?这些小错误可以把匆忙完成的劣质论文与真正优秀的论文区分开来。
  2. 标记相关的未读参考文献以供进一步阅读,这有助于了解文章的背景。

对于有经验的读者来说,第二遍应该需要一个小时。第二遍阅读之后,我们能够掌握论文的主要内容,并且能够有足够的论据将论文主要内容总结给其他人。这对一篇我们感兴趣但并非自己研究领域的论文来说,已经够了。

有些时候,即使读了两遍文章,我们可能还不能完全理解文章的内容。可能的原因有:我们对论文的主题不了解;论文中使用了我们不熟悉的术语和首字母缩略词;作者可能使用了我们不理解的证明或实验技术;论文写的很烂,充斥着大量未经证明的断言和前向引用;也可能是我们比较疲惫,状态不好。这时候,我们可以(a)把论文放到一边,祈祷实现事业的成功并不需要理解这些内容,(b)以后再读,比如看过背景资料之后,(c)坚持并且去读第三遍。

1.3. The Third Pass

为了完全理解文章,尤其是我们是审稿人时,我们需要读第三遍。第三遍的核心是用虚拟的方法,重新实现这篇论文:与作者做出相同的假设,重造这篇论文。通过比较重造出来的结果和原文,我们不仅很容易地发现论文中的创新之处,而且还会看到背后隐藏的失败和假设。

这一遍需要我们极度关注细节,我们需要在每个声明中识别并挑战每个假设。而且,我们应该考虑自己如何向读者呈现一个特定的想法。通过现实与虚拟的对比,我们可以敏锐地洞察论文中的证明和表述技巧,这种能力很可能会成为我们的一种常用技能。在第三遍中,我们还应该记下关于未来工作的想法。

对于初学者来说,这个过程可能需要花费很多时间,对于有经验的读者来说可能需要1至2个小时。在一遍结束时,我们应该能够从记忆中重建论文的整个架构,并能够识别它的优点和缺点。特别地,我们应该能够确定隐含的假设,缺少的相关工作引用,以及实验或分析技术的潜在问题。

2. Doing a Literature Survey

撰写文献综述是检验论文阅读技巧的好方法。这需要我们阅读数十篇、上百篇论文,尤其是那些我们不了解的研究领域。下面我们使用三遍法,为文献综述的撰写提供帮助。

首先,我们使用学术搜索引擎和一些关键词找出3至5篇相关领域的高引论文。把每篇论文都过一遍,了解文章的大意,然后阅读每篇文章相关工作的小节。我们可以找到最近工作的缩略摘要,幸运的话还可能找到最近的综述文章。如果能找到相关的综述,直接读这篇综述就完事儿了。

如果没有找到相关的综述,那么进入第二步。我们在这些论文的参考文献中查找共同的引用文献和重复出现的作者姓名。这些就是该研究领域的关键论文和主要研究人员。下载这些关键论文并把它们放旁边,然后访问主要研究人员的个人主页,了解他们最近发表的内容。这有助于我们确定该领域的顶级会议,因为最好的研究人员通常会在顶级会议上发表他们的工作。

第三步是访问这些顶级会议的网站,并查看最近的会议记录。快速地过一遍会议记录,找出最近发表的高质量的相关论文。这些论文以及之前下载的关键论文构成文献综述的第一个版本。把这些文章读两遍,如果它们都引用了我们之前未找到的关键论文,下载该论文并按照三遍法进行阅读,这一过程可以根据需要进行多次迭代。

如果我们正在审阅一篇论文,那么还应该阅读Timothy Roscoe的论文Writing reviews for systems conferences。如果我们准备写一篇技术论文,那么可以参考Henning Schulzrinne的个人主页和George Whitesides的概述。最后,Simon Peyton Jones有一个涵盖整个研究技能范围的网站,这些研究技能都可以在他主页上面找到。

Iain H. McLean 在实验心理学领域内,使用三遍法整合了一套“评审模型”,可在此下载,少量修改后应该可以用于其他领域。