Reader's Club

Home Category

牛津通识读本:选择理论 [10]

By Root 1303 0
2)对于我的至少一个行为,你从第一个行为得到的效用大于从第二个得到的效用,那么你的第一个行为和第二个行为相比就占弱优势。考虑下例。

鸟的例子

你和我各自必须选择一种鸟:你可以选反嘴鹬、乌鸫或乌鸦,我可以选反嘴鹬或乌鸫。收益矩阵如下:

在本例中,你的行为B相对于你的行为A和C都是占弱优势(但不占优势)。

我们在反复删去弱劣势行为时,就不像反复删除劣势行为时那么有自信。我们对理性的概述告诉我们,反复弱非劣势行为和理性行为不一样。而且,删除的顺序也会影响结果。如果在上例中,你删除A,那么我将删除A:你将单选B或C,并得到效用2。但是,如果你删除C而不是A,那么我将删除B:你将单选B或C,并得到效用1。尽管如此,如果我们已经删除所有劣势行为,那么避免弱劣势行为的做法就有一定道理。

稳定行为

在此出现一个问题:以理性方式行事和以稳定方式行事,这两者之间究竟有没有联系?如果我们各自以理性方式行事,我们的行为是否稳定?如果我们的行为稳定,它们必须是理性的吗?

要继续研究,我们需要考虑我们的行为究竟怎样才算是稳定的。如果你的行为是你对我的行为的最佳反应,同时我的行为也是我对你的行为的最佳反应,我们的行为就是稳定的。(对一个行为的最佳反应就是在给定该行为的情况下,对简化概率的反应。)如果是这样,那么当我们二人都没有单方面动机去作出改变时,我们的一对行为就是稳定的。一对稳定行为也被称为“纳什均衡”,得名于约翰·纳什(生于1928年),他是诺贝尔经济学奖获得者、经济学家和数学家(同时也是电影《美丽心灵》的主人公)。注意,尽管我们可以问你的单个行为在孤立情况下是否具有理性,我们却不能问你的单个行为是否稳定:稳定性是只属于成对行为(你的一个行为和我的一个行为)的属性。

要说明稳定行为,让我们回到拍卖的例子。收益矩阵如下:

在本例中我们各自选择A是稳定的,因为如果你知道我将选A,那么你就会选A;并且如果我知道你选A,我就会选A。

如拍卖的例子所示,且几乎可以由定义直接得出,稳定行为是理性的。但是,反之则不成立:并非所有成对的理性行为都是稳定的。下例将说明这一点。

动物的例子

你和我各自选择一种动物:我们可以各自选择驴子、野猪或者母牛。收益矩阵如下:

显而易见,在本例中唯一的稳定行为是你选择B,我选择B,但是每个可能的行为对你来说(同时对我来说)都是理性的。

理性、优势和稳定性之间的联系如图13所示。

图13战略选择示意图:双箭头代表对等,单箭头代表隐含

在讨论稳定性时,我的主要目的是查明以理性行事和以稳定方式行事之间的联系,而不是具体研究稳定性。但是,我要简单提一下和稳定性概念相关的两个问题。

第一个问题是可能存在许多互不兼容的稳定行为。见面的例子可以说明这一点。收益矩阵如下:

在本例中,你选择A且我选择A是稳定的,因为我们中没有人会选择B,如果他知道另外一人将选择A。同样,你选B且我选B是稳定的。因此,我们有多对稳定行为。如果你选择某一对行为中你的部分,而我选择另一对中我的部分,如果我们这样的选择也是稳定的,那么存在多对稳定行为这一现象就无关紧要。但事实并非如此:你选A且我选B,这一对行为并不稳定。

见面例子的另一种阐释强调了这一点。A可以重新解释为靠左行驶,B可以解释为靠右行驶;收益矩阵保持不变。如果我们每个人都靠左行驶,这是稳定的;每个人都靠右行驶,也是稳定的;但如果我靠左而你靠右行驶,我们可能都活不久。

注意:在本例中每个稳定配对都不涉及弱劣势行为:如果存在弱劣势行为,或许合理的做法是避免选择它们。还要注意:在理性行为中不可能出现不兼容的问题:你可能有多于一个理性行为,我也一样,但是多对行为在整个过程中不会产生影响。

稳定性概念的第二个问题在于,可能不存在稳定行为。下面的例子可以说明这一点(这个例子最早被称为“便士配对”。)

配对例子

你和我各自选择一张牌,然后给对方看,牌上画着天使或野兽。如果我们牌上的画是一样的,我付你100美元,如果不一样,你付我100美元。因为我们都喜欢钱,我们可以把收益矩阵写成:

显然,我们都选择同样的行为不可能是稳定的,因为如果我知道你的行为,我将改变我的;同样的,我们各自选择不同的行为也不可能是稳定的,因为如果你知道我的行为,你将改变你的。因此,不存在稳定行为。这一问题不可能在理性行为中出现:如我们所见,你总是有着某种理性行为。

但是在一定程度上,可以通过允许选择个人行为和赌局(正如我们在讨论优势的时候所做的)来得到稳定行为。在这种情况下,一对稳定的行为(有时在混合策略里被称为“纳什均衡”)具备像以前那样的属性:如果你的行为是你针对我的行为的最佳反应,且我的行为是我针对你的行为的最佳反应,那么我们的行为就是稳定的。如果我们允许选择赌局,那么在配对的例子中就会出现一对稳定行为。显而易见,你和我各自选择赌局“以概率0.5选A,其余选B”是稳定的,实际上也是唯一的一对稳定行为。事实上,如果我们允许选择赌局,那么所有的策略问题都有稳定行为。

不仅是原先没有稳定行为的地方出现了稳定行为,而且现在新的稳定行为可以在原有的基础上继续出现。回想一下,在见面的例子里,可以把A重新解释为靠左行驶,把B重新解释为靠右行驶,存在两对稳定行为:我们都靠左行驶和我们都靠右行驶。但如果我们允许选择赌局,那么还有第三对稳定行为:即我们各自独立掷硬币,如果正面向上就靠左驾驶,如果反面向上就靠右驾驶:这是避免车祸的另一个解决办法。

如果在此新的意义上重新阐释稳定性,情况依然是:稳定行为是理性的。同样,这几乎可以直接从定义中推导得出。而且,并非所有成对理性行为都是稳定的。要明白这一点,回到动物的例子。收益矩阵如下:

显而易见,你和我都选择B是唯一的稳定配对,即使在我们都可以选择赌局的情况下。但是,如我们所见,每个可能的行为都是理性的。

因此,稳定性的概念可能是有歧义的,比如可能存在多个稳定配对;或者是空洞的,比如可能不存在稳定配对,且我们不允许选择赌局;或者有些晦涩,比如唯一的稳定行为需要使用赌局。

一些扩展

如果把时间纳入考虑,情况就会有所改变。再次回到拍卖的例子。收益矩阵如下:

假设现在我们必须各自连续两天而不是一次性作出选择。在第二天我们各自都知道对方在第一天所作的选择。现在你是从下列八个行为中进行选择:

如果我今天选A,你今天选A 且明天选A

如果我今天选B,你今天选A 且明天选A

如果我今天选A,你今天选A 且明天选B

依此类推。(我的行为是类似的。)显而易见,你仅有的两个(对等的)理性行为是“如果我今天选A,那么你今天选A且明天选A”和“如果我今天选B,那么你今天选A且明天选A”。也就是说,不管我选什么,你都是今天选A且明天选A。因此,没有重大变化。

现在假设我们各自连续一百天作出选择。你可能会觉得,在前面某一天值得选B,寄希望于这样可以培养我们之间的信任,从而我将开始选B,这对我们两人都有利。但是,你这么做完全是错误的。在最后一天,不存在培养信任的问题,所以我们各自将像我们只选一次那样作出选择,也就是说,我们各自选A。那么在第99天,也不存在培养信任的问题,因为我们各自都知道对方在最后一天的选择:再次,我们各自选A。重复这样的推论,每天我们将各自选A。同样没有任何改变。如果我们在任意有限的天数内作出选择,同样的逻辑都适用。

但是,如果我们在无限多的天数内作出选择,这样的逻辑就不成立,因为现在不存在开始推理过程的最后一天。事实上,如果我们无限地选择,我们每天各自选B,不仅对个人是理性的,而且对双方也是稳定的(尽管可能有其他稳定结果)。情况与有限重复时(因此也是与时间无关时)有了巨大改变。在有限重复时,我们每天各自选A是唯一的理性结果。

从这个结果中得出一般推论,我们可以说,虽然在有限重复的场景中,个人的理性行为不一定是集体理性的,但在无限重复的场景中,这种情况可能(尽管并非必要)成立。因此,无限重复可能将竞争转化为合作。这一结果是民俗的重要部分,因此它被称为“民间定理”。大卫·休谟(我们在第一章中已经提到过他)注意到:

我学着为另一个人服务,并非因为我对他好,而是因为我预见到,他将会回报我,以期得到另一次同类服务,并且保持与我及他人之间的良好沟通。相应地,在我为他服务之后,他从我的行为中得利,他在预见到拒绝的后果之后,也将尽他的义务。

个体理性与集体理性之间的张力产生了许多混淆。其中一些体现在双胞胎的明显悖论中。有人声称,因为拍卖例子是对称的,你和我可以被看做是双胞胎以同样方式进行选择。因为你知道这一点,所以你报低价:你知道我总是会做和你一样的事,并且我们都报低价好于我们都报高价。为对称性理论辩护的尝试常常是基于所谓的海萨尼信条,得名于诺贝尔经济学奖得主、哲学家约翰·海萨尼(生于1920年)。这一信条声称具有相同信息和经验的两个人将必然以同样方式行事。如果把经验界定为包括一切使人与众不同的特点,那么这一看似正确的信条(我将在下一章继续讨论)就是同义反复的。但这一信条意义有多重要呢?你对这一信条以及上面提到的明显悖论应该有自己的观点。

在第四章里,我考虑了是否我们能借助无知面纱的设想对分配公平有所了解。我现在将借助一个类似的设想:不确定性面纱。无知面纱指假装不了解已经决定的事实,比如你是谁;而不确定性面纱指对尚未发生的事件真的缺乏了解,比如谁将会找到石油。假设你和我各自在寻找石油。我们都从零财富水平开始。如果我们都找到石油,或者都没有找到,我们各自得到同样的财富:在这两种情况下,财富分配的问题都不那么吸引人。试考虑只有一个人找到石油的情况。我们不知道谁发现石油,在这种情况下,发现的人将得到200万美元,而另一个人则一无所获。

我将假定我们各自只关心自己的所得,且都是风险厌恶的。为了作具体讨论,我将假定我

Return Main Page Previous Page Next Page

®Reader's Club