当前,实际的逻辑学只擅长处理确定的、不可能的或者完全可疑的事情.幸运的是,这三者都不需要我们推理.因此,这个世界真正的逻辑是概率演算的逻辑,它考虑的是一名理性思考者的大脑中已经或者应该存在的概率大小.
——詹姆斯·克拉克·麦克斯韦(James Clerk Maxwell,1850)
假设在某个黑夜,一名警察在空荡荡的街上巡逻.突然,他听到防盗报警器的响声.他立即向街对面看过去,发现一家珠宝店的窗户被砸破了,一名戴着面具的男子从破碎的窗户里爬了出来,身后还背着一个装满了昂贵珠宝的袋子.警察会毫不犹豫地判定这名男子是坏人.但他是通过什么推理过程得出这个结论的呢?让我们先来看看这类问题的一般性质.
只要稍微想一想,我们就会明白,警察的结论并非是依靠证据做演绎推理得出的.实际上,完全可能存在这名男子无辜的合理解释.比如,这名男子是珠宝店的老板,刚从化妆舞会回家,没有带钥匙.正当他经过自己的店面时,从一辆路过的卡车里甩出来的石头砸碎了窗玻璃.他为了保护自己的财产,才从窗户带走了珠宝.
尽管警察的推理过程并非逻辑演绎推理,我们仍然会认为它具有一定程度的有效性.已有的证据并不能使该男子是坏人这件事确信无疑(certain),但确实使这件事变得极其合理可信(plausible).在学习任何数学理论之前,我们或多或少已经精于此类推理.在现实生活中,我们经常会碰到这种情况:没有足够的信息来进行演绎推理,但是又不得不马上采取行动.例如,判断今天是否会下雨,然后采取相应的行动.
尽管我们对此并不陌生,但合情结论的形成是一个非常微妙的过程.虽然历史上对这个问题的讨论已经延续了24个世纪,但至今还没有人对该过程做出过完全令人满意的分析.我将阐述一些有用且激动人心的新进展,其中,明确的定理将取代相互矛盾的直觉判断,确定的规则将取代特定的处理流程——这些规则由一些几乎不可避免的基本的理性准则确定.
所有对这些问题的讨论都是从举例说明演绎推理与合情推理之间的区别开始的.归功于亚里士多德的《工具论》(公元前4世纪),演绎推理通常最终可以分解为以下两种强三段论的重复应用:
和它的逆
这是我们希望能一直使用的推理模式.但是,如上所述,在我们面临的几乎所有实际情况中,都没有适当的信息来进行这种推理.我们不得不依赖于以下弱三段论:
证据并不能证明A真,但验证其结果之一(B真)能让我们对A真更有信心.例如,我们定义:
A≡最迟在上午10点开始下雨;
B≡天空会在上午10点之前变得多云.
上午9:45观察到天空多云并不能从逻辑上保证随后一定会下雨.然而,我们的常识遵从弱三段论:如果乌云密布,可能会促使我们改变计划,并表现得好像我们相信随后会下雨.
这个例子还表明,大前提“A真则B真”只表示B是A的逻辑结果,两者并不一定存在物理上的因果关系(若是因果关系,B只能在A之后发生).上午10点下雨不是9:45多云的物理原因.然而,正确的逻辑关系也不是由B推出A这种并不确定的因果方向(多云=⇒下雨),而是由A推出B这种确定但非因果的逻辑方向(下雨=⇒多云).
我们在一开始就强调我们关注的是逻辑关系,原因是一些关于推理的讨论和应用由于未能看到逻辑蕴涵关系与物理因果关系之间的区别,而陷入了严重的错误.西蒙和雷舍尔(Simon & Rescher,1966)曾深入分析了这种区别,他们指出,所有试图将蕴涵关系解释为因果关系的行为都会导致第二种三段论(1.2)中的A与B之间产生不可置换性.也就是说,如果将大前提解释为“A是B的物理原因”,那么我们将很难接受“非B是非A的物理原因”.
另一种弱三段论使用了同样的大前提:
在这种情况下,证据并不能证明B假.但是,保证B真的一个可能的依据已经被排除了,所以我们对B真的信心会减少.科学家接受或拒绝某理论的推理过程几乎全部由第二或第三种三段论组成.
现在来看,前述警察的推理过程甚至不属于以上几种模式中的任何一种.它用一种更弱的三段论来描述最合适:
尽管抽象地用A和B来描述的这种论证模式看似存在明显的缺陷,但我们意识到警察的结论仍然有很强的说服力.有某种东西让我们相信,在这一特定情况下,警察的论证几乎与演绎推理有同样的效力.
这些例子表明,大脑在做合情推理的过程中不仅会判断某件事是变得更合情还是变得更不合情,而且会以某种方式来评估合情的程度.10点之前下雨的合情程度非常依赖天空在9:45是否乌云密布.大脑会同时使用旧信息与新数据来决定如何行动.我们会试图回忆关于云与雨的过往经验以及前一天晚上的天气预报来做判断.
为了说明警察也在使用过往经验来做判断,我们只需要改变这种经验即可.假设类似事件每天晚上都会发生多次,每个警察几乎都碰到过,但是那名男子每次都被证明是完全无辜的.很快,警察们将学会忽略这些无关紧要的事件.
因此,在推理过程中,我们非常依赖先验信息来评估新问题的合情程度.这种推理过程是无意识的,几乎是即时的.为了隐藏其复杂性,我们称之为常识.
数学家乔治·波利亚写了三本关于合情推理的书(George Pólya,1945,1954),举了一大批有意思的例子,表明我们在做合情推理时存在确定的规则(尽管在他的著作中,这些规则是以定性的形式给出的).以上弱三段论模式出现在《数学与猜想(第二卷):合情推理模式》中.强烈建议读者阅读波利亚的这部著作,它是我很多思想的最初来源.下面将展示波利亚的原则如何以定量的形式给出,并提供有用的应用.
显然,上面描述的演绎推理有一种性质,即我们可以用(1.1)和(1.2)进行一系列推理,所得结论和前提一样有说服力.对于另外的推理模式(1.3)~(1.5),在经过几步推理后,结论的可靠性可能发生改变.但是,在它们的定量形式中,我们发现结论的可靠性在很多情况下可能接近于演绎推理(就像警察的例子让我们相信的那样).波利亚向我们展示了,即使是纯数学家,在大多数时候其实也在使用这种弱三段论模式进行推理.当然,在发表一个新定理时,数学家将努力发明一种仅依赖于演绎推理的证明方式.然而,在得到该定理的推理过程中,难免使用弱三段论模式(比如,用类比的方法得到后续的猜测).斯特凡·巴拿赫也曾经表述过类似的想法(引自 S. Ulam,1957):
优秀的数学家在定理之间看到类比,伟大的数学家在类比之间看到类比.
作为出发点,我们先来看看与另一个领域非常有启发性的类比,它本身也是基于合情推理的.
在物理学中,我们很快就发现世界太过复杂,无法一次性地进行总体分析.只有“分而治之”,才能取得进展.有时候,我们可以发明一种数学模型来重现某一小部分的若干特征,每当发生这种情况时,我们就会感觉已经取得了进展.这些模型称为物理理论.随着知识的进步,我们能够发明越来越好的模型,这些模型能够越来越准确地再现现实世界中越来越多的特征.没有人知道这个过程是否存在自然的终点,是否将无限期继续下去.
在试图理解常识时,我们将采取类似的方法.我们不会试图一下子全部理解,但是如果能够构建可以再现其一些特征的理想化数学模型,我们就认为取得了进展.我们希望当前构建的所有模型在未来被更全面的模型取代,我们不知道这个过程是否存在自然的终点.
与物理理论做类比比与纯粹方法做类比更加深刻.通常,我们最熟悉的事情是最难以理解的.绝大多数人不知道的物理现象(例如铁和镍的紫外光谱的差异)能通过详尽的数学细节来解释,然而面对像一片草叶的生长这样的普通事实的复杂性,现代科学却显得无能为力.因此不应该对我们的模型期望太高.对于人们最熟悉的一些心理活动特征,我们可能会发觉很难构建适当的模型,必须对此做好心理准备.
还有更多类比.在物理学中,我们常常发现任何知识的进步都会带来巨大的实用价值,但是这些价值具有不可预测的性质.例如,伦琴发现的X射线带来了医学诊断的新方法;麦克斯韦发现了磁场旋度方程式的一个额外项,使得全球准实时通信成为可能.
我们关于常识的数学模型也表现出了实用的特征.任何成功的模型,即使只能重现常识的一小部分特征,也会在某个应用领域中被证明是常识的强大扩展.在这个领域内,模型使我们能够解决涉及复杂细节的推理问题.如果没有模型的帮助,我们永远不会试图解决这些问题.
(本文选自《概率论沉思录》)
《概率论沉思录》
点击图书封面可直接购买
出版社:人民邮电出版社
作者:埃德温·汤普森·杰恩斯,E.T.Jaynes
出版时间:2024年06月
内容简介
本书将概率论和统计推断融合在一起,用新的观点生动地描述了概率论在物理学、数学经济学、化学和生物学等领域中的广泛应用,特别阐述了贝叶斯理论的丰富应用,弥补了其他概率论和统计学教材的不足,全书分为两部分:第一部分包括10章,讲解抽样理论、假设检验、参数估计等概率论的原理及其初级应用;第二部分包括12章,讲解概率论的高级应用,如在物理测量、通信理论中的应用。本书还附有大量习题,内容全面,体例完整,本书内容不局限于某一特定领域,适合涉及数据分析的各领域工作者阅读,也可作为本科生和研究生相关课程的教材。
作者简介
埃德温.汤普森.杰恩斯(1922—1998),著名数学物理学家,曾任圣路易斯华盛顿大学和斯坦福大学教授,在统计力学和概率统计推断方面有杰出贡献。1957年发表了热力学的最大熵解释,1963年与弗雷德.卡明斯一起以完全量子化的方式模拟了电磁场中二能级原子的演化,该模型称为杰恩斯-卡明斯模型。杰恩斯大力提倡将概率论解释为逻辑的延伸。
廖海仁,本科毕业于清华大学物理系,北京大学空间物理学硕士。中国第22次南极科学考察队员,曾在南极中山站越冬14个月。目前从事机器学习算法研发工作,2013年全球RTB广告DSP算法大赛主要组织者之一。
发表评论前,请先[点此登录]