牛津通识读本:简明逻辑学 [11]
福尔摩斯很高兴地进行了解释。比如,关于写东西他是这样说的:
“还有别的什么更能说明问题吗?那就是:你右手袖子上足有五寸长的地方闪闪发光,而左手袖子靠近手腕经常贴在桌面上的地方打了个整洁的补丁。”
尽管福尔摩斯习惯把这样的推理称为一种演绎推理,这个推理实际上却是一种归纳推理。即使没有写什么东西,威尔逊的衣服也会呈现上述特征,这是完全有可能的事。比如说,这件衣服很可能是他从某个曾经写过东西的人那里偷来的。这个推理显然也很有道理。是什么使得这个推理以及类似的推理显得很有道理的呢?一种似乎可信的答案就是概率。下面我们就来谈一谈概率,之后再回到这个问题上来。
图11 福尔摩斯展示他高超的逻辑推理能力。
概率就是赋予一个句子的一个数字,用于测量在某种意义上这个句子正确的可能性有多大。我们用pr(a)来表示句子a的概率。按照惯例,我们用0到1之间的数值来测量概率。如果pr(a)=0,那么句子a肯定为假;随着pr(a)的增大,句子a正确的可能性就越大,直到pr(a)=1时,句子a肯定为真。
对这些数字我们还有什么要说的吗?让我们以一个简单的例子来阐述吧。假设我们来思考某一周内各天的天气情况。我们用w来表示一个句子(不管它的内容在每一天是正确的还是错误的——比如说“天很暖和”),用r表示另外一句话——比如说“天在下雨”。相关信息列于下表:
打勾表示这个句子在那一天为真,空白表示该句在那一天不为真。
如果我们谈论这一周的情况,那么在任意选择的某一天,天气暖和的概率为多少呢?有四天天气暖和,而一周共有七天。因此,概率为4/7。类似地,有三天是下雨的,因此下雨的概率为3/7:
pr(w)= 4/7
pr(r)= 3/7
一般地,如果我们用#a表示句子a为真的天数,用N表示总天数,那么:
pr(a)= #a/N
概率与否定、合取和析取之间的关系如何?我们先来看一下否定。﹁w的概率是多少?你看,共有三天不是很暖和,因此pr(﹁w)= 3/7。注意,pr(w)和pr(﹁w)之和等于1。这并不是什么偶然。我们有以下公式:
#w + #﹁w = N
将等式两边都除以N,我们便可得到:
即,pr(w)+ pr(﹁w)= 1。
合取和析取的情况如下:共有两天是既暖和又下雨的,因此,pr(w&r)= #(w&r)/N =2/7。共有五天是要么暖和要么下雨的,因此,pr(w V r)= #(w V r)/N = 5/7。这两个数字之间的关系如何呢?为了获得w V r为真的天数,我们可以用w为真的天数加上r为真的天数。但这样是行不通的,因为有些天被计算了两次:星期三和星期六。这两天既下雨又很暖和。因此,为了获得正确的数字,我们得减去既下雨又暖和的天数,即:
#(w V r)= #w + #r -#(w&r)
等式两边都除以N,我们便得到:
也就是说:
pr(w V r)= pr(w)+ pr(r)-pr(w&r)
这就是合取命题和析取命题的概率之间的总体关系。
我们在前一章中看到,真值的程度也可用0到1之间的数字进行测量,因此我们也许会自然而然地认为真值的程度和概率是一样的。其实它们并不一样。尤其是在进行合取和析取运算时,算法截然不同。对真值的程度来说,析取是一个真值函数。具体来说,∣w V r∣的真值是∣w∣和∣r∣真值中最大的那个;而pr(w V r)的概率却不只是由pr(w)和pr(r)决定的,我们刚才也看到了这一点。尤其在我们刚才所举的例子w和r中,pr(w)=4/7,pr(r)= 3/7,pr(w V r)=5/7。但是,如果∣w∣=4/7,且∣r∣=3/7的话,∣w V r∣的真值就应该是4/7,而不是5/7。
在我们回头讨论归纳推理以前,再谈一点我们需要知道的概率知识。还以我们所举的一周情况为例,任选某一天,下雨的概率为3/7。不过,假设你知道这一天很暖和,那么现在下雨的概率又是多少呢?共有四个暖天,但其中只有两天是雨天,因此,概率为2/4。这个数字被称为条件概率,写成:pr(r∣w),表示r在w条件下的概率。我们如果再多加思考一下,便可获得一个计算条件概率的一般公式。我们是如何得到2/4这个数字的呢?首先,我们把天数限制在w为真的那些日子上,然后再用r同时也为真的天数(当w和r都为真的天数)来除以这个数字。换言之:
pr(r∣w)= #(w&r)÷#w
根据代数运算法则,这也等于:
而这也就等于pr(w&r)÷pr(w)。
于是我们便得到条件概率的一般公式:
CP:pr(w∣r)= pr(w&r)/ pr(w)
在应用这个公式时要多加小心。用0来除的话就没有任何意义了。比如,3/0就没有意义了。数学家把这样的比例式称作未限定式。我们用pr(w)来除pr(w∣r)的公式,只有当前者不为0时该公式才有意义;也就是说,只有在w至少有时为真的情况下,该公式才有意义。否则,该条件概率就是未限定式。
最后,我们再回头讨论一下归纳推理。一个推理具有归纳效度的条件是什么?只要前提能使结论的肯定式更有可能即可。换言之,结论c的条件概率在前提p(如果存在多个前提,则为合取前提)下,要大于c的否定式:
pr(c∣p)﹥pr(﹁c∣p)
因此,如果我们要对一周情况进行推理的话,那么以下推理:
这是一个下雨天,因此天很暖和;
从归纳角度来看是有效的。这很容易核实,因为pr(w∣r)= 2/3,而pr(﹁w∣r)= 1/3。
这个分析可用于证明我们在本章一开始所提到的福尔摩斯的推理为何是有效的。福尔摩斯得出结论:杰贝兹·威尔逊写了大量的东西(c)。他前提的大致意思是,威尔逊夹克上有某些标记(p)。下面,假设我们回到福尔摩斯时代的伦敦,并集中所有有那样袖口的人,那么大部分人都会是职员,工作时间主要是写东西——或者我们也许可以假设他们是这样的人。因此,在衣服上有那些特征的情况下,杰贝兹一直做大量的书写工作的可能性要比他不是职员的可能性更大。福尔摩斯的推理从归纳角度来看实际上是有效的。
结束前我要请大家注意一下我们在使用这个方法时所遇到的一个疑问。如我们刚才所见,概率可以用一个比率来计算:我们采用某种基准组类,然后在这个范围内计算不同组别的数字,然后进行除法运算。但是,我们使用哪一个基准组类呢?在天气的例子中,我一开始就规定了基准组类:某个特定周的几天。不过,现实生活中的问题并不是以这样的方式提出来的。
我们再来看一看杰贝兹·威尔逊的例子。为了算出这一例子中的相关概率,我建议采用的基准组类包含了福尔摩斯时代住在伦敦的人。但为什么要采取这一基准组类?为什么不把范围扩大到福尔摩斯时代的所有英格兰人,或者所有欧洲人,或者缩小到只包括在伦敦居住的男人,或者那些能来拜见福尔摩斯的人?也许在上述一些情况下并无多大区别。但是,在其他一些情况下肯定会产生很大的差别。比如,来拜见福尔摩斯的人相对而言都很富有,不可能穿别人穿过的旧衣服。范围过大,情况也会截然不同。因此,什么样的标准才是恰当的基准组类呢?这是一个让保险精算师(为保险公司计算风险指数的人)彻夜不眠的问题。
在刚才的分析里,最精确的基准组类似乎是一个只包含威尔逊本人的组类。毕竟,其他人的事实最终与他又有多大关系呢?但是,如果那样的话,他要么一直做大量的书写工作,要么就不做书写工作。在第一种情况下,他有闪闪发亮的袖口表明他从事书写工作的概率为1,且这个推理是有效的;在第二种情况下,他从事书写工作的概率为0,推理是无效的。换言之,推理的效度完全要看结论的真实性。因此,你不能为了确定结论正确与否而使用这个推理。如果那样的话,所讲的效度的概念就毫无用处了。
本章要点
·一个陈述的概率等于它为真的情形的数量除以基准组类中的情形的数量。
·pr(﹁a)= 1-pr(a)
·pr(a V b)= pr(a)+ pr(b)-pr(a&b)
·pr(a∣b)= pr(a&b)/pr(b)
·只要结论在前提(合取前提)下的条件概率大于其在相同前提下否定式的条件概率,那么这个推理就是有效的。
第十二章 逆概率:你不会不偏不倚的!
前一章让我们对概率以及它在归纳推理中可能起到的作用有了一个基本的了解。在本章中,我们将会更深入地探讨这个问题。我们先来看一个非常著名的归纳推理。
宇宙物质并不是任意组合起来的一团糟。它呈现出非常特别的模式:物质按照一定的结构形成了星系,星系又形成恒星和行星体系,同时,在其中的一些行星上,物质又按照一定形式形成了你我一样的生物。人们对此会有什么样的解释呢?你也许会说,用物理学和生物学定理来解释。也许是吧。但是,为什么物理学和生物学定理就是那样的?毕竟,这些定理本来可以是另外一副样子。比如,引力本来可以是一种推斥力,而不是吸引力。那样的话,就永远不会再有稳定的物质块,我们所知道的生命在宇宙的任何地方也不会存在。这是否给了我们充足的理由去相信还存在着一个宇宙的创造者:一个智慧的存在物,他为了某种目的用物理学和生物学定理创造了宇宙?简言之,难道宇宙物质按照现在这样的方式有序排列不能让我们有理由相信存在某种神灵吗?
图12 物质具有非常显著的结构。一个漩涡状的星系。
这一论证常被称作“根据设计论证”(为证明上帝的存在)。也许称作“设计论证”更好些,但这并不重要。让我们更深入地思考一下这个问题。此论证的前提o为一个陈述,大致的意思是说宇宙是按一定顺序组合起来的。结论g则断言存在一个宇宙创造者——神。除非g正确,否则o是最不可能的事;因此,该论证进一步推理可得:倘若o正确,则g是有可能的。
我们知道,肯定为真的是,o在g为真时的条件概率大大高于g为假时的概率,即:
1.pr(o∣g)﹥pr(o∣﹁g)
但这并不是我们想要的结果。因为,要让o成为g的一个很好的归纳理由,我们