Reader's Club

Home Category

牛津通识读本:选择理论 [9]

By Root 1314 0
此,在其他条件不变的情况下,你会为某个使我得到更多收益的结果指派更高效用。或者你也可能希望我过得不好,或者根本就不关心我。第二,既然我们指派的是基数效用,它就已经包含了对于风险的态度。因此,如果你选择一个赌局,以各占一半的概率得到结果“2美元,2美元”和“4美元,0美元”,那么在上述效用分配方式下,这个赌局和确定得到结果“3美元,3美元”对你来说是无差异的,因为你的(期望)效用在每种情况下都是2。第三,没有任何说法证明你的效用和我的效用能够以任何方式作比较:我们各自独立指派效用。

我们可以将这两个表格中的信息结合在一起得到一个拍卖问题的收益矩阵。与以往不同的是,我们用一对效用来代替与之相关的结果“2美元,2美元”,也就是说,你的效用是1,我的效用也是1,依此类推。收益矩阵的行对应你可能的行为,列对应我的行为。如果你选择行的行为,我选择列的行为,我们行为的结果就是每一个行和列组合在一起的条目。条目的格式是:你的效用在前,我的效用在后。现在我们可以将拍卖的例子改写如下。

拍卖的例子

在某次封闭报价拍卖会上,你和我各自决定报极高或者极低的价格。收益矩阵如下:

图12《国际跳棋比赛》:奖品坐在正中(马蒂亚·普雷第,约1635)

这个拍卖问题和著名的“囚徒困境”难题实质上是一样的。在囚徒问题里,你和我都被指控犯下罪行。我们被告知如果我们都否认罪行,那么我们各自将被判较轻的罪名,并且接受很轻的惩罚。如果我们都坦白,那么我们各自接受中等程度的惩罚。如果我们两人中只有一个人坦白,那么他就会被释放,并且成为证人指控另一个人。被指控的人将受到严厉惩罚。在我们可以沟通之前,我们被关在隔离的牢房里。你必须选择究竟是坦白还是否认。假定我们每个人只关心自己的惩罚,我们各自为严厉的惩罚指派效用0,为中等程度的惩罚指派效用1,为很轻的惩罚指派效用2,为无罪释放指派效用3。显而易见,这个问题的收益矩阵和刚才的拍卖问题是一样的,只不过把几个名称换了而已。

理性行为

来考虑下面的例子(我将不再为这个例子以及随后的其他一些例子来编故事)。

树的例子

你和我各自选择一种树:你可以选白蜡树、山毛榉或栗子,我可以选白蜡树或山毛榉。收益矩阵如下:

当然,你不会知道我将选择哪个或哪些行为,甚至不知道我将以什么样的概率来选择每个行为。但是,如果你知道这些概率,你的选择就很简单:你将在给定这些概率的情况下,选择能够将你的期望效用最大化的行为。这一行为被称为你对于这些概率的最佳反应。假设在本例中,你被告知我将以概率0.5选择A(否则选B),那么如果你选择A,你的期望效用就是:(0×0.5)+(3×0.5),等于1.5。如果你选择B,那么期望效用就等于2。如果你选择C,期望效用等于1.5。于是你选择B,也就是说B是你对于这些概率的最佳反应。

现在假设你仅仅被告知我的潜在行为,即我可能选择的行为。总的来说,把这些行为和不同概率联系在一起,就会得到不同的最佳反应。比如,如果在上例中,你被告知我将以概率0.2而不是0.5选择A,那么你的最佳反应将变为A;如果你被告知我将以概率0.8选择A,那么你的最佳反应就将变为C。对于我的潜在行为,你的可信反应是对于其中一些概率的最佳反应。在本例中,对于我的潜在反应A或B,你的可信反应是A、B和C。

最佳反应和可信反应可以用来研究理性。不妨举个例子说明看似有违理性的选择,比如在拍卖的例子中你如果选择B。B的问题出在对于我的任何潜在行为,它都不是最佳反应。不管你是否被告知我将选择A,或选择B,或者可能随机选择其中之一,你的唯一的可信反应都是A。

下面的例子提供了一个更为复杂的案例来说明有违理性的选择。

花的例子

你和我各自选择一种花:我们可以各自选择乌头、毛茛或连香报春花。收益矩阵如下:

假设在本例中你选择B。这里的问题不太明显。表面看来,你的选择无可挑剔:不管我选A或B,你选B都是一个可信反应。但是你必须问自己,我是否会选择A或B。显然,我不会选择A,因为对于你的任何选择,A都不是我的可信反应。那么我可能选择B吗?如果我这么做,那么我不得不相信你将选C,因为对于你选A或B,我选B都不是可信反应。但我知道你不会选C,因为对于我的任何选择,你选C都不是可信反应。结果是,你知道我会排除A与B来选C。但是你选B不是我选C的可信反应。因此,你选择B看起来违背理性。

理性行为是可以通过一连串可信反应论证来检验其合理性的行为,正如在上例中那样。在策略问题里,你不知道我将选择什么。但是,你可以推断出关于我的行为的一些信息,因为你知道我只会选择一个可信反应。特别是,你可以推断,我的任何选择将是我在推断出你的选择之后所作出的可信反应。更进一步,因为你知道我知道你只会选择一个可信反应,你会预期我将作出类似的推断。确实,你应该预期到我会预期到你将作出类似推断,依此类推。理性行为是从这条推理链中产生的行为:你的行为是理性的,如果它是你针对我的可信反应所作出的可信反应;而我的可信反应又是针对你的可信反应所作出的;你的可信反应又是针对我的可信反应所作出的……注意理性本质上是和个人相关的概念。在拍卖的例子里,如果我们各自选择B而不是A,那么我们将各自变得更好:对于个人来说是理性的选择,可能对于集体来说并非理性。

在花的例子里,我们可以用一张表来说明这一推理链。表中每一行给出选择者、他所面对的另一个人的潜在行为,以及选择者对此的可信反应。

直到你我的可信反应都不再随着推理的进行而改变,这一推理链宣告结束。如果我们到达某一点时,都只选择一个行为,如上例所示,那么很显然这就是推理链的终点。我们应该注意到,我们是从你的而不是我的反应开始推理的:但是显而易见,如果我们从我的反应开始也会得到同样的结果。因此你的理性行为是A(而我的是C)。

显然,你将总能作出某个理性行为。但是,如下例(这个例子是“在纽约见面”的原始版本)所示,你可能有不止一个理性行为。

见面的例子

你和我约好见面,但忘了确定究竟是在A点还是在B点见面。因为我们各自都想见面,但不在乎在哪里见面,我们的收益矩阵可以写成下面的形式:

如果你被告知我选A的概率大于0.5,那么你的最佳反应就是A。如果你被告知这一概率低于0.5,你的最佳反应就是B。因此,因为你的可信反应是你对于某些概率所作的最佳反应,对于我的潜在行为A或B,你的可信反应就是A和B。因为我的可信反应也是一样,所以对于我们每个人来说,理性行为一定是A和B两者(其实,我们应该已经从本例的对称性上判断出这一点)。

非劣势行为

为了概括理性的特征,我们需要“优势”这一概念。在你的两个行为中,如果不管我选择什么,你都偏好第一个,那么该行为对第二个占优势。相应地,你的第一个行为所带来的效用大于第二个。例如,在拍卖的例子里,你的行为A相比B占优势。优势行为还有更为复杂的一种形式。试想,你不再选择某个特定行为,而是能够选择多个行为的组合,或者说,针对你行为的一个赌局。这意味着,除了单选X或Y之外,你还可以选赌局“以概率0.5得到X,以概率0.5得到Y”。如果无论我选择什么,你从赌局得到的期望效用都大于你从特定行为所得到的期望效用,那么涉及多个行为的赌局相比某个特定行为就占优势。考虑下面的例子。

昆虫的例子

你和我各自必须选择一种昆虫:你可以选蚂蚁、蜜蜂或者毛虫;而我可以选蚂蚁或蜜蜂。收益矩阵如下:

在本例中,你的赌局“以概率0.5选A,否则选C”相比行为B占优势:无论我选择什么行为,你从赌局获得的期望效用都是1.5,而你从B获得的期望效用是1。如本例所示,一个行为可能相比一个行为组合占劣势,即使相比组合中的任何一个行为,它都不占劣势:你的行为B和A或C相比,都不占劣势。

如果一个行为和任何组合(包括任何简化组合,即任何行为)相比都不占劣势,那么该行为是非劣势的。换句话说,如果无论我选择什么行为(或行为组合),没有任何行为能给你更高的(期待)效用,你所选的行为就是非劣势的。如你所料,一个行为如果是最佳反应,它一定是非劣势的。既然要成为理性行为必须是最佳反应,这就意味着理性行为必须是非劣势的。但是,反之则不一定成立:一个行为可能是非劣势的,但却不是理性的。

要明白这一点,让我们回到树的例子。收益矩阵如下:

本例中你的行为C是非劣势的,但它显然不是理性的。

在树的例子中,你的行为C不是理性行为,因为尽管它是非劣势的,但是(1)如果我的行为A从矩阵中被删除,它就变成劣势行为;(2)删除A很合理,因为它是劣势的(和我的行为B相比)。这就是说,你的行为C逃不过对劣势行为的反复删除,或者说它并非反复非劣势的:换句话说,你的行为相比我的任何行为,不占劣势;同样,我的行为相比你的任何行为,不占劣势……依此类推,反复检验。

要说明反复删除法,让我们回到花的例子。收益矩阵如下:

在本例中,我们可以如下表所示,反复删除行为。表中每行给出选择者、选择者所面对的对方行为,以及在该阶段选择者删除的行为。

当我们都不能再继续删除任何一个行为时,整个过程宣告结束。在本例中,你唯一剩下的行为是A(而我的是C)。注意第一次我选择删除A和B。显然如果我在这一步只删除A或B,我们也会取得同样的结果,尽管可能花费更多步骤。显而易见,和获取理性行为的过程一样,如果我们从我开始而不是从你开始进行删除,还是会取得同样的结果。

反复删除劣势行为的过程显然和获取理性行为的过程有很多共同点。在花的例子里这两个过程得到同样结果,这并非偶然:这适用于一般情况。因此我们可以有完整的概述:当且仅当选择是反复非劣势时,它是理性的。

尽管颇有吸引力,我们在使用被称为“弱优势”的概念来代替“优势”概念时,还是要小心。如果对于你的两个行为,(1)不管我选择什么行为,你从第一个行为得到的效用不少于从第二个得到的效用;(

Return Main Page Previous Page Next Page

®Reader's Club