牛津通识读本:选择理论 [4]
100美元wp0.3,一无所获wp0.5,熏肉wp0.1,奶酪wp0.1
如下图所示:
图6复合赌局
在预先设定这些条件之后,我们可以转向赌局中的选择。我们可以直接利用第二章的讨论:只需把菜单选项的名称从芦笋换成“以概率0.5得到100美元,其余情况则一无所获”,这样的转换不会改变第二章的任何结论。尽管如此,还存在其他影响因素。例如,如果你偏好100美元胜过一无所有,那么很自然,你偏好赌局“以概率0.9得到100美元,其余情况则一无所获”胜过“以概率0.1得到100美元,其余情况则一无所获”。但是,在第二章中所研究的理性的概念无法说明这一点:在理性的概念范围内,要求你对这两个赌局有所偏好,相当于仅仅因为你偏好鳄鱼肉胜过牛肉就要求你偏好鸡肉胜过鸭肉。
之所以可能有更多的影响因素,是因为在确定性条件下菜单选项没有内部结构:芦笋只是芦笋。而不确定性条件下的菜单选项则有某种内部结构:它们涉及回报和概率。这意味着在确定性条件下偏好序列就是问题的最终结果:它们无所谓理性或非理性。但我们有理由质疑在不确定性条件下的偏好序列是否是理性的。例如,我们可以考察那些回报相同但概率不同的赌局中所体现的偏好模式,比如上面提到的要么得到100美元,要么一无所获。
概率赌局
基于上述讨论,我将假定出自赌局的选择可以由偏好序列解释,并且来研究这一序列怎样才算是理性的。因为我将不会涉及无法排序(即不具备传递性)的偏好关系,从现在起我将把偏好序列简称为偏好。
试考虑下面这个有问题的例子。
蔬菜的例子
你喜欢茄子胜过花椰菜,但是你知道餐厅服务不太可靠,无论你点什么,都有0.1的概率得到菜花,于是你点了花椰菜:也就是说,你喜欢赌局“以概率0.9得到花椰菜,其他情况则得到菜花”胜过赌局“以概率0.9得到茄子,其他情况则得到菜花”。
本例中你的选择有问题:在第二种情况中结果C对于每个赌局来说都是一样的,但你却让它影响了你的决定。如果在比较两个赌局的时候,你忽略它们相同的方面而专注于不同点,这似乎显得更加自然。当然,你可能喜欢赌局“以0.9的概率得到B,以0.1的概率得到C”胜过赌局“以0.9的概率得到A,以0.1的概率得到C”,尽管你喜欢单选A胜过单选B(也许是因为C和B搭配比和A搭配要好)。但是,这两个选项都没有。你要么得到你点的,要么得到C。如果你得到你点的蔬菜,那么C无关紧要;如果你得到C,那么你点了什么菜就无关紧要。为了确保这样的无关情况不影响整个分析,我们可以要求:如果你喜欢第一个赌局胜过第二个,那么对于把这两个赌局分别和第三个赌局按同样权重进行组合得到的两个混合赌局,你喜欢第一个混合赌局胜过第二个。这一要求被称为替换条件。
替换条件有个直接推论:如果你喜欢100美元胜过一无所有,那么你就会喜欢赌局“以概率0.9获得100美元,其余则一无所有”胜过“以概率0.1获得100美元,其余情况则一无所有”。更一般地,如果你喜欢一个赌局胜过另一个,那么当且仅当你更喜欢的那个赌局在第一个混合赌局中的比重大于它在第二个混合赌局中的比重时,你选择第一个混合赌局。
下面的例子里出现另一类问题。
水果的例子
你喜欢苹果胜过香蕉,喜欢香蕉胜过樱桃(既然你是理性的,当然喜欢苹果胜过樱桃)。但是,你喜欢香蕉胜过每个或得到苹果、或得到讨厌的樱桃的赌局,不管得到后者的概率有多低。
在本例中你的选择有问题:你的偏好出现跳跃。试考虑你对B和赌局X(以概率p得到A,其余情况得到C)的偏好。如果p小于1,不管它多接近1,你选择B;但当p等于1,也就是说当赌局X变成A,你选择X。因此在某一点上你从偏好某一项变成偏好另一项,却没有经过中间无差异的过渡阶段。如下表所示:
如果你的选择平稳变化而不是像这样突然跳跃,可能更容易接受。要明白在实践中这究竟意味着什么,让我们重新解释这三个选项,设A为一百万美元,B为一无所有,C为你的死亡。可以认为存在足够高的概率p,使得你愿意接受这样的赌局:以概率p获得一百万,否则就失去性命。如果这显得不太可能,那就问问你自己是否愿意穿过一条交通繁忙的街道,冒着极其微小的丧命概率,来挣得一百万。典型的答案是愿意。为了避免偏好的跳跃变化,我们要求:如果你喜欢第一个赌局胜过第二个,喜欢第二个胜过第三个,那么必然存在第一个和第三个赌局的某种混合,使得你认为它和第二个赌局无差异。这一要求被称为连续条件,又被称为阿基米德条件,得名于希腊数学家阿基米德(前287—前212)。
(补充说明:我们可能注意到连续条件要求允许概率以连续的方式变化,因为如果概率只以0.1的幅度发生变化,那么很可能出现你喜欢赌局“以概率0.9得到A,其余情况下得到C”胜过选项B,并且喜欢B胜过赌局“以概率0.8得到A,其余情况下得到C”。这一点又反过来要求有无穷多的赌局。)
我们应该再次来检查这两个条件是否一致且独立。为避免重复,我只考虑一致性;独立性可以直接看出来。下面的例子显示了一致性。
坚果的例子
考虑由杏仁、巴西坚果和腰果组成的所有可能赌局,只要在第一个赌局中得到杏仁的概率的两倍加上得到巴西坚果的概率大于在第二个赌局中的相应数字,你就喜欢第一个赌局胜过第二个。
在本例中,只要2p+q大于2r+s,你就喜欢赌局“A wp p,B wp q,其余概率得到C”胜过赌局“A wp r,B wp s,其余概率得到C”。注意这个条件规定了你对于所有涉及A、B、C的赌局的偏好。很容易证明替换条件和连续条件都成立。
因为替换条件和连续条件是一致且独立的,并且看起来至少排除了我已经指出的问题,我会说如果你的偏好满足这两个条件,那么你对相关赌局具有理性偏好。
要概括理性的特点,我们需要用到期望效用的概念。回想一下,我们已经假定赌局中的选择可以由偏好序列来解释,也就是说,是效用最大化的(参见第二章的讨论)。那么既然我们可以给所有的赌局指派效用,我们当然可以给简化赌局(即回报)指派效用。假定我们已经这样做了。那么一个赌局的期望效用可以通过以下方式计算:将每个回报的效用乘以该回报出现的概率,再将所有结果相加。例如,你的效用指派方式如下:
那么赌局“X wp 0.2,Y wp 0.3,Z wp 0.5”的期望效用就是:(1×0.2)+(3×0.3)+(2×0.5),即2.1。
回想一下,我们有多种方式来指派效用:唯一的要求就是更好的回报具有更高效用。为给后面的讨论作个准备,请注意如果我们把所有效用翻倍,那么我们也把任何赌局的期望效用翻倍。如果我们把所有效用加上7,那么我们也把任何赌局的期望效用加上7。例如,如果我们把上例中的效用依次进行这两项变换,那么新的期望效用就是11.2,等于原来的期望效用乘以2,再加上7。但是,如果我们用所有效用的平方来代替它们,那么新的期望效用并非原来数字的平方:新的期望效用等于4.9,而原来的效用平方后等于4.41。
如果有某种效用指派方式,使得我们可以基于赌局的期望效用对它们作出判断,那么问题就会变得很方便。也就是说,当且仅当一个赌局相比另一个具有更高效用时,你更喜欢该赌局。这就意味着,你将喜欢上文提到的那个赌局胜过下面这个新的赌局:
X wp 0.5,Y wp 0.3,Z wp 0.2因为正如我们所说,原来那个赌局的期望效用(2.1),超过了新赌局的期望效用(1.8)。如果效用可以通过这种方式指派,那么由此得到的效用称为基数效用,或者又称为“伯努利效用”,得名于数学家丹尼尔·伯努利(1700—1782)。并且我们称偏好具有期望效用属性。
如果我们可以指派基数效用,那么我们有多种指派方式。假设我们已经采用某种方式指派了基数效用,那么当且仅当赌局X在该效用指派方式下具有更高的期望效用时,赌局X比赌局Y要好。现在我们换种方式来指派效用,指派给每个回报的新的效用数值等于原来的效用乘以2再加7。正如我们已经看到的,这意味着任何一个赌局的新期望效用等于原来的数值乘以2再加7。此时,当且仅当X原来具有更高的期望效用时(也就是当且仅当X好于Y时),X具有更高的新期望效用。因此,当基数效用翻倍并加7时,它们的代表属性保持不变。更一般地,当基数效用以线性方式变换时(也就是说,当它们乘以或除以任何正数,或者加上或减去任何数字),它们的代表属性保持不变。一个常见的线性变换的例子是测量温度的两种方式之间的变换:华氏温度等于摄氏温度乘以1.8再加上32。
然而,基数效用在进行非线性变换时,其代表属性将发生变化。因为对效用进行其他变化无法保证期望效用以同样方式变化。比如,如果效用指派如下:
那么你喜欢Y(也就是说,简化赌局让你以概率1得到Y)胜过另一个赌局(以概率0.5得到X,其余则得到Z):两个赌局的期望效用分别为3和2.5。但如果这些效用被它们各自的平方数代替,那么新的期望效用分别为9和12.5。这两个数字说明你喜欢后一个赌局胜过Y,但这是错误的。
假设我们以下列方式指派基数效用:回报X得到效用v,而更好的回报Y则得到效用u;显然u一定大于v。如果我们从这两个效用中都减去v,再除以u-v(这应该是个正数),那么我们得到如下基数效用:Y的效用为1,而X的效用为0。这意味着如果我们可以指派基数效用,那么我们可以这样来进行:为某个回报指派效用0,为其他更好的回报指派效用1。
在坚果的例子里,期望效用属性成立。对任意两个赌局,只要在第一个赌局中得到A的概率乘以2再加上得到B的概率大于第二个赌局中的相应数字,你就喜欢第一个赌局胜过第二个。如果我们指派效用如下:
那么赌局“A wp p,B wp q,其余得到C”的期望效用为2p+q,而赌局“A wp r,B wp s,其余得到C”的期望效用为2r+s