什么是科学

注：这一系列文章是多年以前为了让大众了解科学的基本概念而写的，曾经发表在我个人的知乎专栏中。在我看来，科学作为一个方法论，比起任何一条具体的知识都要重要得多。我希望更多人能理解这一点并有所思考，以增加自己面对信息时代巨量数据时的判断能力，避免一些悲剧的发生，因而写下了这些文章。水平有限，可能有很多辞不达意的地方。

科学归纳法

简单地说，科学的目的是建立可靠且有用的知识。有用意味着我们要能拿这些知识来预测些什么东西，而不是只是告诉你些现有事物的解释；可靠意味着我们希望这些知识是真的，不是50%的正确率还需要你拼人品或是诚心相信才能对的。

所以怎么建立可靠的知识，是科学最核心的问题之一。

要得到些什么结论，我们不可避免地要借助逻辑的力量。粗糙地讲，我们研究用到的逻辑推理方式有两种，演绎推理和归纳。演绎推理是从一些已知的结论得到另一些已知的结论的方法，最典型的莫过于三段论：

人有两条腿。

小明是人。

=>小明有两条腿。

如果我们能保证大前提和小前提是对的，那么三段论可以保证我们得到正确的结论。一般而言，演绎推理基本上不太会出错，除非是用了错误的三段论，或者错误的前提。

然而，只有演绎推理通常是不够的。演绎推理只能让你从已知的结论出发，那么最基本的那些结论，只能从归纳中来。归纳是从一系列事物中提取共性的方法，比如：

房间里有3个小孩：小明，小红，小强。

小明有2颗糖。

小红有3颗糖。

小强有1颗糖。

=>房间里的孩子们都有糖。

这种推理模式，即是归纳。如果我们列举了一个集合里所有元素的性质，那么这样的归纳是完全的，这样归纳得到的结果，正确性是有保证的，也足以作为推理的前提。然而，问题就出在很多时候，元素个数太多，我们无法检测所有的元素，或者有时候元素个数是趋于无穷的，不可能全部检测完，这种时候，怎么归纳才合适？

这个时候只好采用不完全归纳，即只是挑几个元素检查一下，然后得出结论。这种方法一般人总是会在有意无意之间使用，但很少有人能清醒地意识到，这种归纳是不可靠的。一些简单的例子就是：

3是质数。

5是质数。

7是质数。

=>所有的奇数都是质数。

我见过一只黑羊。

=>所有的羊都是黑的。

这样的归纳法的错误是很显然的，大家会觉得不以为然。但很多人却没能察觉到这样的推理也是不可靠的：

我认识一个人得癌症被中医治好了。

=>中医包治百病。

塔罗牌算对了我考试会合格！

=>算命太准了。

XX大学有个毕业生找不到工作。

=>现在的大学全都是XXX只知道浪费纳税人的钱毁人不倦一个人才都培养不出来……

解剖发现人的心脏长在左边。

=>所有人的心脏都长在左边。

等等，你可能已经发现了，最后一种推理方式，似乎正是科学很多分支都不断在做的。如果这不可靠，岂不是说明科学就是在胡扯？

当然，科学家在很早以前就发现了这个问题，所以我们用到的归纳法，和不完全归纳有一点不同，叫做科学归纳法。它的逻辑是这样的：

解剖了那么多人发现没有人的心脏长在右边。

=>所有人的心脏可能都长在左边。

就是说我们要意识到绝大多数的论断都是无法被证明的，你能找到的只能称之为支持性证据。我们将论断的正确性依托在做了大量实验却没有发现反例这一点上，但即使如此，我们也不敢说某个论断被证明了。因为逻辑上而言，你无法知道今后会不会出现反例推翻你的论断。比如

我们现在看到地球是圆的，会不会有一天突然发现它变方了？
我们现在发现人的心脏长在左边，是不是我们碰巧解剖的人的心脏都长在左边？

所以，怀疑从根本上贯彻于科学无处不在，也正因此，因为顶住了一次又一次地抽查，我们才有理由相信某些论断和理论是对的。

但事情还是没有那么简单。事实上，确实有人的心脏长在右边，但为什么我们还是看到很多地方在说“人的心脏长在左边”呢？这时我们需要特别小心，需要借助统计学的力量。我们继续打开人的胸腔，随机地打开，统计这些人的心脏的左右位置。这时候，人们发现这么多例子大约只有万分之一的人的心脏长在右边。于是我们得到了新的论断：

绝大多数（约99%）人的心脏长在左边。

当然，我们还是不能检查每个人的心脏，所以这个论断，会永远受到统计数字的检查。

当然，有时候我们并不从实验直接归纳得到结论，有时夹杂了一些其他的考虑，包括了很多不能直接测量的东西，才构建出完整的理论。但是，实验证伪这个机制是通用的。我们要求理论提供预测，要求它提供可验证的结论，然后不断地、无时无刻地使用实验来检查它。每一次使用理论都提供了一个检验理论的机会。虽然得到论断的方式不同，但保证它正确的逻辑是相似的：因为没有出过错，所以可能是对的。历史发展到现在，从牛顿力学到标准模型，每一个理论都有了充分的支持性依据，重要的是它们没有出错，所以这些成为了人类对世界认识的框架。

如果一个理论既没有证据支持，又没有证据反对，又怎么说呢？这时，这个理论或许说的是废话，或许是一种可能性。对与错都无从得知。所以，它不是可以令人言之凿凿的真实。

比如弦论。

科学理论如何运作

前一章说到如何从现象中科学地进行归纳，但留了一个很大的问题没有触及，那就是“理论”究竟是怎么建立的。诚然，化学、生物等众多学科几乎都是直接从实验结果进行归纳，更甚者生物学的很多传统领域还在做着以单纯描述现象为主的工作，这些学科建立的逻辑基本都采用了科学归纳法的方式。然而，很多读过某些“科普”著作的人，会有一种错觉，即物理学的理论是从形而上学或者说纯粹哲学的角度出发建立起来的，和实验没什么关系。更甚者，他们看到了有人这样做成功了，于是觉得似乎物理理论是如此容易，以至于自己随便想想就可以拿出个猜想，得到真理。这真是错得很离谱。

历史

我们先来回顾一下历史。一般认为，物理学真正的开始，是牛顿出版了著名的《自然哲学的数学原理》一书，正式确立了牛顿力学的框架。然而，他的力学理论是源自伽利略对惯性的诸多研究，他的引力理论是源自开普勒三定律。而开普勒三定律，正是开普勒在大量艰苦的天文观测中总结归纳出来的。

随后到十九世纪，经过库伦、毕奥、萨法尔、法拉第等人的大量实验总结，人们对电与磁的认识几乎完全。最终，麦克斯韦将前人的所有工作整合起来，又加入了自己对位移电流的一个假设，形成了电磁学的基本理论：麦克斯韦方程组。随后，麦克斯韦方程组所预言的电磁波被赫兹发现，再后来人们发现光实质上也是一种电磁波。

热学早期一直在讨论功与热的关系。随着热功当量的测定，人们终于意识到热无非是也是一种能量形式。对于气体的描述，人们建立起一系列实验定律，如玻意尔定律、亨利定律，最后被克拉伯龙总结形成理想气体状态方程。另一方面，玻尔兹曼从概率统计的角度出发，建立了统计力学。而统计力学给出了更为完备的热学理论。

人们常常津津乐道的19世纪的两朵乌云，即是两个实验的不吻合：黑体辐射实验与迈克尔逊莫雷实验。基于经典的牛顿物理和统计力学所给出的黑体辐射能谱全部与实验相差很远，此时普朗克无奈之下引入量子的概念，得到了完美吻合的黑体辐射能谱，开始了量子力学发展的进程。而麦克斯韦方程给出的真空光速，是一个不与参考系有关的常数，而MM实验验证了这一点，这有违牛顿力学中关于参考系变换的部分。以此为出发点，爱因斯坦建立了狭义相对论。

此后随着原子实验以至高能物理的发展，人们发现越来越多的新现象。随着早期量子论给出各种错误的结果，薛定谔、海森堡等人终于构建出完善的非相对论性量子力学的框架，但此时以Klein-Gordon方程为代表的相对论性量子力学还有着深刻的问题。随着狄拉克方程的提出，正则量子化的提出，重整化的使用，完美兼容狭义相对论的量子场论框架终于成熟。至此，我们有了描述物理世界的基本理论方法。而费曼提出路径积分使人们理解了量子物理是如何与经典物理相联系的。

自麦克斯韦方程之后，电磁理论就没有多少需要修改的地方了。将电磁场量子化，得到的量子电动力学可以精确计算出和实验高度吻合的电子反常磁矩。后来随着高能实验的发展，人们终于得以对弱力和强力进行系统的研究，经过四费米子理论和汤川理论，弱电统一理论和夸克模型，最后发展成为标准模型。而这些理论所预测的各种夸克、W波色子和Z波色子，以及最后最重要的Higgs波色子，最终都相继被高能实验发现。

另一方面，关于引力理论，爱因斯坦从等效原理的考虑出发，建立了广义相对论。随后广义相对论在水星进动、引力红移、引力波的直接观测等实验中得到证据支持。但是当人们发现无法基于广义相对论构建一个描述微观引力作用的量子场论时，便开始了量子引力的研究。虽然爱因斯坦本人也有尝试，但并不成功。经过几十年的发展，人们找到了几种候选理论，大众听得最多的便是弦论，此外还有圈量子引力、声学度规、熵力等等五花八门的理论。但因为引力过于弱小，难以在微观世界体现出作用，以至于实验难以实施，人们现在还没有办法特定出某个理论。

说到这里我想已经很清楚了，物理学的历史发展中无时无刻都离不开实验的影子。而且，事实上，实验和理论的突破总是难以分割的。

理论

不过说到底，物理理论指的是什么？

它是指一种基于数学的理论系统，通过对描述对象的适当抽象，建立起的一套数学化的系统。它用数学来表述所要研究的对象之间的关系，并对这些方程与现实观测的联系进行简单的诠释。

比如说，你如果可以用一堆数字来标记一个系统的状态，比如用x,y,z来标记一个质点的位置，用一个被称为拉格朗日量的函数来抓住这个系统运动的特征，你就可以通过解欧拉-拉格朗日方程极小化一个叫做作用量的东西，来描述这个系统的运动轨迹。这个被成为最小作用量原理的定理，便是理论物理实质上的根基。如果那个函数采用不同的形式，我们便得到了牛顿力学、狭义相对论。

如果你需要的数字数目（自由度）是无穷的，这时就过渡到场论来描述。麦克斯韦方程、爱因斯坦方程无非都是采用不同的作用量得出来的。如果我们考虑费曼路径积分，以作用量为权重，把所有这些运动路径的贡献都算进去，我们就得到了量子力学。而最终标准模型给出的，也正是这样一个长长的作用量，它包括了三项：弱电相互作用、量子色动力学以及Higgs机制。而大家总以为弦论如何如何，其实也是用同样的框架，给出了一个更复杂的作用量。

这套框架，自从被拉格朗日和哈密顿奠定一来，就没怎么变过。听起来有点奇葩，因为这个框架本身见不到任何实验的影子，似乎真的是神来的。但其实请仔细想，这个框架本身并没有告诉你任何信息，这只是一种表述。当然，这个框架是有用的，它给了我们一个通过对称性找守恒量（诸如能量、动量、角动量、电荷等等）的办法，从这个意义上它的结论仍然是可验证的。蕴含了全部物理信息的，正是那个被成为作用量的泛函，或者说那个拉格朗日量。而这个东西的来源，说不定可能真的是靠猜的。

然而我们并不认为随便一个拉格朗日量给出的动力学，就一定是真的。理论的可靠性还是必须建立在证伪风险之上，这依然是毫无疑问的。实验仍然是物理学的基石。正如前述，每一个理论都仍然将它能给出的预测，当做自己的成功。

预测和解释

正确与实验相符当然是物理理论必然的要求，但我在前一篇文章中提到过物理理论必须有用。一个理论要有用，意味着它必须做出有信息量的论断。比如这个论断是典型的没有信息量的：

明天或者下雨，或者不下雨。

这句话总是正确的，但你却仍然不知道明天的天气是什么。而一个有信息量的论断，应该是这样的：

明天下雨。

正因为它不一定正确，所以它将未来天气的可能性缩窄了，而不是呈现给人一句废话。而这样的一句话也正是提供了一个预测。

而物理学的威力，就在于它可以提供预测，比如：

如果你从10m高的真空中放下一个小球，它会在1.4秒后落地。
如果你用长1m的金属棒以1m/s的速度垂直地划过1T的磁场，你会在金属棒两段得到1V的电势差。
如果你测到一堆粒子的自旋朝向正z方向，你接下来会测到它们有一半的自旋朝向正x方向而另一半朝向负x方- 向。
…………………………

每一个论断都提供了足够多的信息，从而让人们在实验中进行对比。虽然实验总会有误差而不精确，但考虑了误差范围之后，我们总可以去检查这些论断，比如：

实验发现小球落地的时间大概在1.2-1.5秒之间。
实验发现电势差大概在0.995-1.003伏特之间。
实验发现正x方向的粒子数目和负x方向的比大概是1:0.99-1:1.01之间。

所以我们总可以很自信地拿着这些数据，去设计飞机，设计火箭，设计半导体，设计计算机。但如果有一天，经过细心的实验我们发现：

月球上小球落地的时间在3.3-3.7秒之间，离1.4秒差了很远。

我们会明白，之前的理论可能出了问题，这时我们不得不回过头检查，是不是有必要修改它，来符合新的实验事实，从而让它有能力预测新的实验。

所以可以想见，预测对于物理是如此重要，以至于它是保证物理的正确性和有用性的基础。而解释呢？说实话，解释并不是那么重要。

首先，要“解释”什么事情，其实是非常容易的。比如关于小球在1.4秒后落地的问题的解释：

小球受到重力做匀加速运动。
小球被10个掐着秒表的天使拉着掉下来。
一个挥着魔法棒的家伙用超能力控制着小球在1.4秒的时候落下来。
因为虚空和宇宙之间的万能场的作用，小球做超级测地线运动，于是1.4秒后落地了。
…………………………………………

当然，除了第一个，其他全是我编的。或许看到那些奇奇怪怪的解释，会有人觉得滑稽，但其实即使是第一种“正统”解释，不也是老师教你的么？那么你怎么知道这个解释是对的其他的都是错的呢？更隐蔽的情况就是神创论：

上帝是万能的，一切都是他创造的。

用这一条假设，你可以解释任何事物而不露出任何破绽：

为什么我们看不见上帝？因为他是万能的，他可以让我们看不见他。
为什么地球年龄有几十亿年可是上帝创世才是几千年前的事？因为上帝是万能的他可以创造任何年龄的物体。
上帝能不能创造一块他举不起来的石头？你预设有“上帝举不起来的石头”的存在是不对的。
……………………………………………………

这些解释很完美，但是毫无用途。它不会告诉你任何有信息量的论断，你依然无法从中知道诸如明天的天气、火箭升空需要的燃料、飞机最适合飞行的形状等事情。

再比如很多人以为量子引力的困难在于人不够聪明掌握不了那么高深的东西。真的是这样么？我曾与一位做理论物理的大牛同学做过一次简单的讨论，得到的回答差不多是这样的：

你以为这很难吗？这在理论上一点都不难。理论总有办法来解释东西的。

事实上也确实如此。处理量子引力我们并不是没有理论，弦论、圈量子等等都是可能的理论。但这个境地说白了，是因为我们还无法在实验室里在量子的尺度下让引力现象凸显出来，所以没办法验证这些理论。相应的，高温超导真的是没有理论吗？不，恰恰相反。高温超导理论太多了，这几百种互不相同的理论且不说能不能符合所有的实验结果，即使有50个符合现有所有实验的理论，一个个设计实验验证去区别它们也几乎不可能。

更极端的情况，就是量子力学的诠释问题。众所周知量子力学的解释实际上是个悬而未决的问题，自它诞生以来，从哥本哈根诠释到多重宇宙诠释，我们已经有十多种诠释量子力学的方法。具体可以参见wiki条目：Interpretations of quantum mechanics。这些诠释，除了个别的（比如局域隐变量理论）会给出可测量的差别以外，在公式上没有任何差别，差别只在于如何解释这些公式。但是，除了作为茶余饭后的谈资和刷牙洗脸时的随想，这个问题并不被物理学家关心。因为尽管解释不确定，如果我们没法在实验中分别它们，就没有任何作用，并不影响我们的使用。

所以，解释真的不是一件重要的事情。

当然，我也曾听过不同观点，比如UCI做Systems Biology的Arthur D. Lander教授，他在讲课时说起这样一个观点，他认为对于模型而言，预测也并不一定是最重要的，比如：

如果给你一个黑盒子，里面装着一台超级电脑。你想知道什么，你只需要问它，它就会告诉你正确答案。于是你得到你想要的预测了，但你明白了什么？什么也不明白。所以，尽管没有预测，能提供解释，也是模型的价值所在。

我不知道他说这样的观点是不是为了让自己更容易发表理论文章，但我想他的观点还是隐含了一个前提：

你的模型是基于已经验证成熟的理论建立起来的。

或者

你的方法论是可以验证的。

否则，还是避不开那个老问题：你的模型和上帝是万能的针尖上有10个天使在跳舞有什么区别呢？

何况我想，如果真有那样一个黑盒子，说不定我们真的能理解些什么呢。

什么是力学

力学

曾经有一个中科院的教授来HKU，零零散散大讲了一番“什么是物理”。室友觉得似乎这个问题该由一个诺奖级的人物来讲比较合适，仅仅是个普通的教授好像不够格谈这么高深的问题。不过大概身在其中，对这个问题没有点儿看法是不可能的。

此教授谈到一件很有意思的事情。他认为“力学（Mechanics）”一词，是一种误翻。因为Mechanics一词应当源于“机械”一词，所以似乎叫“机械学”或“机制学”更贴切一点。而事实上“力学”，诸如量子力学（Quantum Mechanics），和“力”并无关系，它们关心的，是内在的原理和机制。

这大概也是为何即使很少谈“力”，物理学也到处都是“力学”（虽然不一定是Mechanics，还有可能是Dynamics）。物理学，虽然大概没有绝对的定义，但它的研究范畴大体是物体的运动，以及运动的内在机制。这里的运动的涵义我采取的是广义的“运动”，即“变化”。在这个意义下，广义看来，自然界的万物几乎没什么不是物理。于是，近几十年来，大批的物理学家开始涌向天文、地理、化学、生物以至于经济学等等领域，去用“狭义”物理的方法论研究其中的“力学”。

运动学和动力学

既然说要研究“变化”，那么应该怎么着手呢？嗯，粗略想来，大体上应该可以分为3个部分：

什么东西变化；
怎么变化；
为什么变化。

为了回答前两个问题，我们需要一套体系，来描述研究对象的状态以及状态随时间的变化。而这个体系，通常是定量的，我们称之为运动学（Kinematics）。我们要求运动学可以精确地表示研究对象在某个时刻的状态，而不满足于自然语言模棱两可的描述。比如

小球跑得很快

小球在那里晃晃悠悠

这样的说法是不被接受的。我们要的是类似这样的说法：

一个半径2cm的小球，球心相对给定的参考系在(0,1m,3m)的位置上，球上所有点的速度相对此参考系均为(3m/s,2m/s,1m/s)

运动学仅仅描述运动，暂且不关心运动的原因。但有了运动学，我们可以在其中加上一些规律，来描述改变运动的原因，从而回答第三个问题。而这些描述，我们称为动力学（Dynamics）。于是有了运动学和动力学，我们就可以描述变化这件事了。比如：

经典物理中，我们用某个数学空间中的一组坐标，来描述粒子或粒子系在时间和空间中的位置（即粒子的状态），用系综来描述宏观多粒子系统对应的所有微观状态，用空间中的点到实数（或矢量、张量）的函数，来描述场。相应空间的性质和需要用到的数学对象（如矢量、张量）的性质，给出了我们想要的运动学。而动力学则由泊松括号配合哈密顿量的具体形式给出。
量子力学中，我们用希尔伯特空间中的矢量来描述粒子系统的状态，或者用Fock空间中的矢量来描述多粒子系统和场，而用算符来描述可以观测到的物理量。虽然我们很少提到运动学这一词，但这种描述所依托的复空间线性代数本身就是它的运动学。而动力学，则由海森堡方程配合哈密顿量的具体形式给出。

唯理与唯象

至今为止所能确认的绝大多数物质都是由粒子构成的（我们现在大概还没有证据表明现今最小的几种粒子还有更精细的结构），至今为止所发现的相互作用也只有四种。原则上，随便拿来一个系统，如果我们知道所有粒子和场的状态，记入所有粒子和场之间的相互作用，我们就知道这个系统如何运作了。这种考虑问题的方式可以称为唯理。

但当然，多数情况下这实际上是行不通的。不论是应用范围最广但最复杂的量子场论，还是应用范围最窄但是最简单的牛顿力学，都无法处理这其中复杂的数学。而我们也没有那么好的测量手段能测到每一个粒子的状态。我们现在只能在少数情况下完全用唯理的方式处理问题，比如粒子数极少（2个及以下），或粒子数极多（足够做统计）；比如粒子之间没有相互作用（如理想气体），或粒子之间相互作用极强（比如刚体和弹性体）；比如粒子排列完全不需要考虑（如均匀连续介质），或粒子排列非常有规律（比如晶体）。而且即使如此也仍然不可避免需要引入一些近似。

这种处理复杂系统的困难，使我们不可避免地需要唯象：从对现象的直接描述出发，来找出一些实验定律。比如热力学，并不从微观粒子的热运动出发来考虑宏观物体的热效应，而从宏观可以测量到的温度、压强、体积、化学势、形变等等物理量出发，通过实验确立状态方程，运用能量函数（内能、焓、自由能、自由焓）来得到一些有用的分析。再如波动光学中即使不去解麦克斯韦方程，仅仅用复振幅，也足以分析诸如干涉、衍射、全息等等现象。

诚然，理论物理可以把自己唯象的部分隐藏得越来越深，比如电磁势完全可以描述成拉格朗日量为满足\(U(1)\)规范不变性而在场的导数定义中所加入的联络，而电磁场无非是这个联络的曲率，把电磁相互作用描述成一个几何现象（见Dubrovin《现代几何学》第一卷41节）。但依然可以说所有的物理理论都是唯象的，只是唯象的部分不同、程度不同而已。毕竟物理需要描述自然世界，总得有什么规律是来自对现象的总结。

物理的唯象在某些人看来，是体现了物理对所谓“本原”问题的乏力，但我不并会因此而考虑神学或是其它什么。因为如果“本原”这个东西没有任何影响，我并不觉得我们会需要这么一个生造的概念。世界就是如此，又有何不可？