第六章 可检验度
理论是或多或少可以严格地检验的;这就是说,或多或少可以容易地证伪的。
它们的可检验性的程度对于理论的选择是有意义的。
有这一章里,我要通过比较理论的潜在证伪者类来比较它们不同的可检验度或
可证伪度。这个考察完全独立于是否有可能在绝对意义上区别可证伪的和不可证伪
的理论这一问题。人们的确可以说,这一章通过表明可证伪性是一个程度问题而把
可证伪性的要求“相对化”。
31.纲领和例证
就如我们在第23节中看到的,假如至少存在一个同型基础陈述的非空类,而这
些基础陈述为一个理论所禁止;就是说,假如这理论的潜在证伪者类不是空的,这
个理论就是可证伪的。第23节中也说到,假如我们用一圆面积代表所有可能的基础
陈述类,用圆的半径代表可能的事情,那么我们可以说,至少有一条半径——也许
更确切地说,一条窄的扇形,它的宽度可以代表事件应是“可观察的”这一事实—
—必须是和这理论不相容的,是为这理论所排除的。因此,人们可以用不同宽度的
扇形代表各种理论的潜在证伪者。按照这些理论排除的扇形宽度的大小,可以表明
理论具有或多或少的潜在证伪者(暂时不谈这个“或多”“或少”是否可能精确测
定的问题)。因此可以进一步说,假如一个理论的潜在证伪者类比另一个理论的潜
在证伪者类“大”,那么第一个理论就有更多的机会为经验所反驳;因此,和第二
个理论相比较,第一个理论可以说具有“更高的可证伪度”。这也就意味着,第一
个理论关于经验世界比第二个理论说得更多,因为它排除的基础陈述类较大。虽然
允许的陈述类因而变得更小,这并不影响我们的论证;因为我们已经看到,理论对
于这个类并不断言任何东西。因此可以说,一个理论传达的经验信息量,或者它的
经验内容,随着它的可证伪度的增加而增加。
现在我们设想:给我们一个理论,代表这理论禁止的基础陈述的扇形变得越来
越宽,最后只留下一条窄的扇形代表着不为这理论所禁止的基础陈述(假如这理论
是无矛盾的,就必定会有这样的扇形留下)。像这样的理论显然很容易证伪,因为
它只允许经验世界有一个很小范围的可能性;因为它排除了几乎所有可设想的,即
逻辑上可能的事件。它对经验世界断言如此之多。它的经验内容如此之大,以至可
以说很少有逃脱被证伪的机会。
确切地说,理论科学的目的就在于获得在上述意义上易于证伪的理论。它的目
的在于限制允许的事件到最小的范围,假如能够做到的话,小到这样的程度,任何
进一步的限制就会导致这理论的实际的经验的证伪。假如我们能成功地获得这样一
个理论,那么这个理论就能描述“我们的特殊世界’精确到理论描述所可能达到的
程度;因为它会用理论科学所可能达到的最大的精确性,来从所有在逻辑上可能的
经验世界类中挑选出“我们的经验”世界来。所有我们实际遭遇到和观察到的所有
事件或偶发事件类,而且只有这些,才称作“被允许的”。
32.如何比较潜在证伪者类
潜在证伪者类是无限类。直觉的“较多”和“较少”,不要任何特殊保证条件
就可应用于有限类,却不能同样地应用于无限类。
我们不容易躲开这个困难。即使我们为作比较而考虑被禁止的事件类,而不考
虑被禁止的基础陈述或偶发事件,为了弄清其中哪一个含有“更多的”被禁止的事
件,也不易躲开上述困难。因为某一经验理论所禁止的事件数也是无限的,这点可
以从下列事实中看出:一个被禁止的事件和任何其他事件(不管它是否是被禁止的)
的合取又是一个被禁止的事件。
我将考虑三种方法,即使在无限类的情况下,也给予这直觉的“较多”或“较
少”一个精确的意义,以便找出其中哪一种可用来比较被禁止的事件类。
(1)类的基数(或幂)的概念。这个概念不能帮助我们解决我们的问题,因为
很容易看出,潜在证伪者类对所有的理论有着同一的基数。
(2)维的概念。立方体以某种方式包含比直线更多的点,这个模糊的直观的观
念,能够通过集合论的“维”概念以逻辑上无懈可击的术语清楚地表述。这种概念
对点的类或集是按照在它们的元素之间的“邻域关系”的丰度加以区别的:更高维
的集具有更丰富的领域关系。维的概念,使我们能比较“较高”和“较低”维的类,
这里将被用来处理比较可检验度的问题。这是可能的,因为基础陈述通过和其他基
础陈述的合取结合起来又产生基础陈述,这个新产生的基础陈述比它们的组成部分
“具有更高的复合度”;而基础陈述的这个复合度可以和维的概念联系起来。不过,
必须使用被允许的事件的复合而不是被禁止的事件的复合。理由是,一个理论禁止
的事件可以有任何复合度;另一方面,某些被允许的陈述之所以被允许,只是因为
它们的形式,或者更确切地说,因为它们的复合度太低,以致使它们不能和该理论
相矛盾;可以利用这个事实来比较维。
(3)子类关系。设类α的所有元素也是类β的元素,因而α是β的子类(符号
表示:αβ)。那么,或者β的所有元素也是α的元素——在这种情况下,我们说
这两类具有相同的外延或者说它们是等同的——或者β的有些元素不属于a。在后一
种情况下,不属于α的β的元素形成“余类”或称为α对于β的补类,α是β的一
个真子类。子类关系和直觉的“较多”和“较少”非常对应,但是,它的不利之处
是,这种关系只能用来比较两个互相包含的类。所以,假如两个潜在证伪者类不是
互相包含,而是互相交叉,或者它们没有共同的元素,那么,相应的理论的可证伪
度就不能用子类关系来比较;它们对于这种关系来说,是不可比的。
33.用子类关系比较可证伪度
暂时引进下列定义,以后在讨论理论的维数时将加以改进。
(1)说陈述x比陈述y“更高度可证伪”或“更可检验”,或用符号表示:Fsb
(x)>Fsb(y),当且仅当x的潜在证伪者类包含作为一个真子类的y的潜在证伪者
类。
(2)如果两个陈述x和y的潜在证伪者类同一,则它们有相同的可证伪度,即:
Fsb(x)=Fab(y)。
(3)如果这两个陈述的潜在证伪者类并不作为真子类相互包含,则这两个陈述
没有可比的可证伪度(Fsb(x)‖Fsb(y))。
假如(1)适用,总是有一个非空的补类。在全称陈述的情况下,这个补类必定
是无限的。因此,两个(严格全称)理论不可能有这样的区别:其中一个理论禁止
为另一个理论所允许的有限数量的单个偶发事件。
所有重言的和形而上学的陈述的潜在证伪者类都是空的。所以,按照(2),它
们是同一的。(因为,空类是所有类的子类,因而也是空类的子类,所以,所有空
类是同一的;这一点可以表示为:只存在一个空类。)如果我们用‘e’表示经验陈
述,用‘t’或‘m’分别表示重言的或形而上学的陈述(例如,纯粹存在陈述),
那么我们可以给重言的或形而上学的陈述一个零可证伪度,我们写作:Fsb(t)=
Fsb(m)=0Fsb(e)>0。
自相矛盾的陈述(可以用(c)来表示),可以说是具有所有在逻辑上可能的基
础陈述作为它的潜在证伪者类。这个意思就是说,任何陈述,就其可证伪度而言,
都是和自相矛盾陈述可比的。我们得出:Fsb(c)>Fsb(e)>0。如果我们任意地
设Fsb(c)=1,即任意地把1赋予某一目相矛盾的陈述的可证伪度,那么我们甚至
可以用条件1>Fsb(e)>0来定义经验陈述e。按照这个公式,Fsb(e)总是在0和
1之间的间隔内,不包括两端,即在以这两个数字为界的“开放间隔”内。由于把矛
盾陈述和重言陈述(形而上学陈述也一样)排除在外,这个公式同时表达了无矛盾
性的要求和可证伪性的要求。
34.子类关系的结构 逻辑概率我们已经用子类关系对两个陈述的可证伪度的
比较下了定义。因此,可证伪度的比较就具有子类关系的所有结构性质。可比较性
问题可以用一个图(图1)来说明。在这个图中,左边画的是某些子类关系,右边画
的是相应的可检验性关系。右边的阿拉伯数字对应于左边的罗马数字,某一罗马数
字表示相应的阿拉伯数字所表示的那个陈述的潜在证伪者类。在这个图里表示可检
验度的箭头,从具有更可检验的或更可证伪的陈述走向不那么可检验的陈述(因此
它们相当准确地与可推导性箭头相当:参看第35节)。
从图中可以看出,各种子类序列可加以区别和追溯,例如,序列Ⅰ-Ⅱ-Ⅳ或
Ⅰ-Ⅲ-Ⅴ;并且可以看出,引进新的中间类,可以使得这些序列更加“密集”。
所有这些序列在这个特殊情况下都始于1和终于空类,因为空类被包含在每一个类里
(在左面的图里,不可能画出空类,只是因为它是每一个类的子类,因此可以说必
须出现在每一个地方)。如果我们选择类Ⅰ作为所有可能的基础陈述类,那么Ⅰ就
变成矛盾陈述(c),而0(相当于空类)就可以表示重言陈述(t)。从Ⅰ到空类,
或者从(c)到(t),可能通过各种途径;从右边的图中可以看出,某些途径可以
互相交叉。因此我们可以说,这种关系的结构是一种网络结构(由箭头或子类关系
排列成的“序列的网络”)。在节结点(例如,陈述4和5)网络部分地联结起来。
只有在普遍类和空类里,对应于矛盾陈述c和重言陈述t;关系才完全联结起来。
是否可能把各种陈述的可证伪度排列在一个标尺上,即把按照它们的可证伪度
排列的数字同各种陈述相关起来?显然,我们不可能用这种方法把所有的陈述排列
起来,因为,如果能够的话,我们就会随意地使得那些不可比的陈述成为可比的。
但是,我们完全可以从网络中挑选出某个序列,用数字来表示该序列陈述的次序。
这样做时,我们必须给离矛盾陈述c较近的陈述的数字,比给离重言陈述t较近的陈
述高。由于我们已经分别以0和1赋予重言陈述和矛盾陈述,我们就必须以真分数赋
予所挑选的序列中的经验陈述。
然而,我并不真正想挑选出某一个序列来。赋予这序列中的陈述以数字也是完
全任意的。不过,可能给以分数这一事实有很大意义,特别是因为它说明了在可证
伪度和概率观念之间的联系。每当我们能比较两个陈述的可证伪度时,我们就能说,
可证伪度较小的陈述由于它的逻辑形式,也是概率较大的,这种概率我称为“逻辑
概率”。不可把它和在博奕论和统计学中使用的数值概率相混淆。陈述的逻辑概率
和它的可证伪度是互补的:它随可证伪度的减少而增加。逻辑概率1相当于可证伪度
0,反过来也是如此。具有更可检验度的陈述,即具有更高可证伪度的陈述,是在逻
辑上更少可几的陈述;而可检验性较差的陈述是在逻辑上更可几的陈述。
在第72节中将看到,数值概率能和逻辑概率联结起来,因而也能和可证伪度联
结起来。有可能把数值概率解释为适用于(从逻辑概率关系中挑选出来的)子系列
的东西,可以在频率估计的基础上为这子系列规定一种测量系统。
这些对可证伪度比较的考察不仅适用于全称陈述或理论系统;它们也可推广应
用于单称陈述。例如,它们适用于和初始条件合取的理论。在这种情况下,潜在证
伪者类不可被误认为事件类——同型的基础陈述类——,因为它是偶发事件类(这
点和将在第72节中分析的逻辑概率和数值概率之间的联系有某种关系)。
35.经验内容、衍推和可证伪度
在第31节中说到,我称之为陈述的经验内容的东西随着它的可证伪度而增加:
陈述禁止越多,它对经验世界所说越多(参看第6节)。我称为“经验内容”的东西
和比如,Carnap定义的“内容”概念有密切的关系,但不是同一的。对于后者,我
使用术语“逻辑内容”,以与经验内容相区别。
我定义陈述p的经验内容为它的潜在证伪者类(参看第31节)。逻辑内容,借可
推导性概念之助,被定义为从该陈述中可推导出的所有非重言陈述类(可以称作它
的“后承类”)。所以,p的逻辑内容至少等于(即大于或等于)陈述q的逻辑内容,
如q可从p中推导出来(符号表示:如‘p→ q’)。如果可推导性是相互的(符号
‘p←→q’),则说p和q有相同的内容如q可从p中推导出,而p不能从q中推导出,
则q的后承类,一定是p的后承类的一个真子集;则p具有更大的后承类,并且从而具
有更大的逻辑内容(或者逻辑力)。
我的经验内容的定义的一个推断是,两个陈述p和q的逻辑内容和经验内容的比
较导致相同的结果,假如作比较的陈述不包含形而上学要素的话。因此我们要求:
(a)有着相等的逻辑内容的两个陈述也必定具有相等的经验内容;(b)陈述p的逻
辑内容大于陈述q的逻辑内容,也必定具有更大的经验内容,或者至少相等的经验内
容;最后(c)假如陈述p的经验内容大于陈述q的经验内容,那么它的逻辑内容必定
更大,否则就是不可比的。在(b)里必须加上“或者至少相等的经验内容”,这个
限制因为p例如可能是q和某个纯粹存在陈述或其他某类形而上学陈述(我们必经赋
以一定的逻辑内容)的合取;因为在这种情况下,p的经验内容将不大于q的经验内
容。相应的考虑使得在(c)上加上“否则就是不可比的”这条限制成为必要。
因此,在比较可检验度或经验内容度时,我们通常——就是说,在纯粹经验陈
述的情况下——达到和比较逻辑内容或可推导性关系时所达到的相同的结果。因此,
可能把可证伪度的比较在很大程度上建立在可推导性关系的基础之上。两种关系都
表明网络的形式,这网络在自相矛盾陈述和重言陈述里完全地联结起来(参看第34
节)。这一点可以下列说法表示:自相矛盾陈述衍推每一个陈述,而重言陈述为每
一个陈述所衍推。而且,我们已经看到,经验陈述可被描述成这样的陈述:它们的
可证伪度落在以自相矛盾陈述的可证伪度为一端,以重言陈述的可证伪度为另一端
的开放间隔中间。相同地,一般的综合陈述(包括非经验的陈述)也由于衍推关系,
被放置在自相矛盾陈述和重言陈述之间的开放间隔中间。
因此,和所有非经验的(形而上学的)陈述都是“无意义的”实证主义命题相
对应的就会是这样的命题:我在经验的陈述和综合的陈述之间,或在经验内容和逻
辑内容之间所作的区别是多余的;因为所有综合陈述必须是经验的——即所有都是
真正的而不只是伪陈述。但是,我认为,这种使用词的方式,虽然是可行的,并不
能把问题澄清,反而把问题混淆了。
因此,我把对两个陈述的经验内容所作的比较,看作等同于对它们的可证伪度
所作的比较。这就使得我们的方法论规则,即应该选择那些能经受最严格的检验的
理论(参看第20节中反约定主义的规则),等同于这样的规则:选择具有最大可能
的经验内容的理论。
36.普遍性水平和精确度还有其他的方法论要求,可以还原为对最大可能的经
验内容的要求。其中两个要求是突出的:对可能达到的最高水平(或程度)的普遍
性的要求,和对可能达到的最高精确度的要求。
考虑到这些要求,我们来考察下列可设想的自然律:
p:所有在封闭轨道中运行的天体作圆形运动,或者更简洁地说,所有天体轨道
是圆。
q:所有行星轨道是圆。
r:所有天体轨道是椭圆。
s:所有行星轨道是椭圆。
在这四个陈述中存在的可推导性关系在我的图中用箭头表示。从p可以得出所有
其他的陈述,从q可以得出s,s也可从r得出;所以s可以从所有其他陈述得出。
从p移动到q,普遍性程度减少,q表达的比p少,因为行星轨道形成天体轨道的
一个真子类。因此,p比q更易于被证伪:如q被证伪,p也被证伪,但是反之不然。
从p移动到r,(谓语的)精确度减少:圆是椭圆的其子类;如r被证伪,p也被证伪,
但是反之不然。相应的话可以应用到其他的移动上:从p移动到s,普遍性程度和精
确度二者都减少;从q到s,精确度减少;而从r到s,普遍性程度减少。和较高程度
的普遍性或精确度相对应的是较大的(逻辑的,或)经验的内容,因而有较高的可
证伪度。
全称陈述和单称陈述二者都可以写成“全称条件陈述”的形式(或者经常称作
“一般蕴涵”)。假如我们把我们的四个定律写成这个形式,那么我们也许能更容
易和更准确地看到两个陈述的普遍性程度和精确度是如何进行比较的。
全称条件陈述(参看第14节注)可以写成下列形式:‘(x)(φx→fx)’,
或者读为:“所有x的值,满足陈述函项φx的,也满足陈述函项fx”。我们的图中
的陈述s产生下列例子:“(x)(x是一颗行星的轨道→x是一个椭圆)”的意思是:
“不论x是什么,如果x是一颗行星的轨道,则x是一个椭圆”。设p和q是写成这种
“标准”形式的两个陈述;那么我们可以说,p比q有着更大的普遍性,如果p的前件
陈述函项(可以用‘φpx’来表示)是重言地蕴含于(或可合乎逻辑地推导于),
但是不等同于q的相应的陈述函项(可以用‘φqx’来表示);或换言之,如果‘
(x)φqx→φpx’是重言的(或逻辑上真的)。同样,我们说,p比q有着更大的精
确性,如果‘(x)(fpx→fqx)’是重言的。即如果p的谓词(或者后件陈述函项)
比q的谓词更窄,这就意味着:p的谓词衍推q的谓词。
这个定义可以推广到有着不止一个变量的陈述函项中。基本的逻辑变换从它导
致我们已断言过的可推导性关系,这种关系可以用下列规则来表示:如果两个陈述
的普遍性和精确性都是可比的,那么,较不普遍或较不精确的陈述可以从较普遍或
较精确的陈述中推导出来;当然,除非一个更普遍而另一个更精确(如在我的图中
q和r的情况)。
现在我们可以说,我们的方法论决定——有时被形而上学地解释成因果性原理
——应不让任何事情得不到解释,即总是试图从其他具有更高普遍性的陈述中推导
出陈述来。这个决定是从可达到的最高普遍性程度和精确度的要求中推导出来的,
而这个要求可以还原成这样的要求或规则:应该选择能经受最严格检验的理论。
37.逻辑域 略论测量理论
如果陈述p,由于具有更高水平的普遍性或精确性,比陈述q更易于证伪,那么,
为p所允许的基础陈述类是为q所允许的基础陈述类的一个真子类。适用于被允许的
陈述类之间的子类关系,是适用于被禁止的陈述(潜在证伪者)类之间的子类关系
的对立物:这两个关系可以说是相反的(也许可以说是互补的)。为一个陈述所允
许的基础陈述类,可以称作它的“域”。一个陈述允许实在有的“域”,可以说是
它允许实在“自由活动”的范围(或者自由度)。域和经验内容(参看第35节)是
相反(或互补)的概念。因此,两个陈述的域的相互关系和它们的逻辑概率的相互
关系一样(参看第34、72节)。
我引进域概念,因为它帮助我们处理和测量的精确度相联系的某些问题。假定
两个理论的推断在所有的应用领域里区别是如此之小,以至在计算可观察事件之间
的细微差别,由于在我们的测量中可达到的精确度不够高而不能检测到。因此,不
首先改进我们的测量技术,就不可能用实验在这两个理论中作出判定。这表明,现
行的测量技术决定了一定的域——一个范围,在这个范围内观察其间的差别为理论
所允许。
因此,理论应该有可达到的最高可检验度(因此只允许最窄的域),这一规则
衍推这样的要求:测量的精确度应尽可能提高。
人们经常说,所有测量都在于确定点的重合。但是任何这种确定只能在某些限
度内才是正确的。在严格的意义上,不存在点的重合。两个物理“点”——比如,
在量杆上的一个标记,在被测量物体上的另一个标记——它们至多能做到靠得很近;
但不能重合,即不能合并成一点。不管在其他场合这个说法是如何的平凡,它对测
量的精确性来说是重要的。因为它使我们想到,测量应该用下列术语来描述。我们
发现,被测量的物体的点落在量杆的两个级别或标记之间,或者比方说,我们的测
量仪器的指针落在刻度的两级之间。然后我们可以或者把这些级别或标记看作我们
误差的两个最佳界限,或者去估计(比方说)指针在刻度间隔内的位置,因而得到
一个比较准确的结果。人们可以这样描述这后一情况:我们使指针落在两个想象中
的分级标记之间。因此,一个间隔、一个域总是存留着。物理学家的习惯是每一次
测量都要估计这个间隔。(因此,例如他们效法Milliken用静电单位测量电子的基
本电荷,得出e=4.774·10-10,加上:不精确范围是±O.005·10-10。)但是
这里发生一个问题。人们用两个标记——即间隔的两个边界——来代替刻度上的一
个标记的目的究竟是什么,对于这两个边界的每一个,又一定会提出同样的问题:
对于这间隔的边界,什么是准确性的界限呢?
给出间隔的边界显然是无用的,除非这两个边界本身能以大大超过我们对原来
的测量所希望达到的精确度确定下来;即在它们不精确的间隔内确定下来,这些间
隔因此应该比它们为原来的测量值确定的间隔小几个数量级。换句话说,间隔的边
界不是截然分明的,而实际上是很小的间隔,这个间隔的边界本身仍然是更小得多
的间隔,等等。就这样我们达到了可以称为间隔的“不分明的边界”或“缩聚边界”
的观念。
这些考虑并不以误差的数学理论和概率论为前提。这走的是另一条迂迴的路;
通过分析测量间隔的观念,这些考虑提供了一个背景,如果没有这个背景,误差的
统计理论就没有什么意义。如果我们测量一个量许多次,我们得到的数值以不同的
密度分布在某一间隔——精确性的间隔依赖现行的测量技术。仅当我们知道我们追
求什么——即这个间隙的缩聚边界——我们才能把误差理论应用到这些数值上,并
确定间隔的边界。
现在我想所有这些多少说明了使用测量方法对于纯定性方法的优越性。即使在
定性估计的情况下,例如对一个乐音的音高的估计,有时也可能为这种估计给出一
个准确性的间隔,这是正确的;但是,没有测量,任何这样的间隔只能是很模糊的,
因为在这种情况下,不能应用缩聚边界的概念。这个概念只能在我们可以谈到数量
级的地方因而只能在规定了测量方法的地方才适用。我将在第68节中,联系到概率
论,进一步运用精确性间隔的缩聚边界这一概念。
38.联系维来比较可检验度
直到现在为止,我们仅在理论可以借助子类关系来作比较的范围内来比较它们
的可检验度。在某些情况下,这个方法在指导我们选择理论方面很成功。因此现在
我们可以说,在第20节中举例说到的Pauli的不相容原理的确证明是一个令人满意的
辅助假说。因为它极大地增加了旧的量子论的精确度,因而增加了可检验度(如新
量子论的相应的陈述断言:电子具有反对称状态,而不带电粒子和某些带大量电荷
的粒子具有对称状态)。
然而,对于很多目的来说,用于类关系的方法来进行比较是不够的。因此,例
如Frank指出,具有高水平的普遍性的陈述——例如Planck公式里的能量守恒原理—
—易于变成重言的,失去它们的经验内容,除非初始条件可以“……用少数测量,……
即依靠系统状态特有的很少几个量值”来确定。关于必须确定和代入公式的参量的
数目的问题是不能借助子类关系的帮助来阐明的,尽管它是显然与可检验性和可证
伪性以及它们的程度密切联系着的。确定初始条件需要的量值越少,足以使理论被
证伪的基础陈述就越不是复合的;因为起证伪作用的基础陈述,是由初始条件和推
导出的预见的否定二者的合取组成的(参看第28节)。因此,通过弄清一个基础陈
述必须有的最小复合度(如果它能够与理论矛盾的话),就有可能比较理论的可检
验度;只要我们能找到一种方法来比较基础陈述以弄清它们是否更(或不那么)复
合的,即是否是大量(或小量)比较简单的一种基础陈述的复合物。所有复合度没
有达到必要的最低限度的基础陈述,不管它们内容如何,只是由于它们的低复合度,
就都是为理论所允许的。
但是,任何这样的纲领都面临着困难。因为一般地说,单靠检查,是不容易说
出一个陈述是否是复合的,即是否等于更简单的陈述的合取。在所有的陈述里,都
出现普遍名称,通过分析它们,人们往往能把陈述分解为合取的组分(例如,陈述:
“在k地有一玻璃杯水”也许可以被分析和分解成两个陈述:“在k地有一玻璃杯盛
着一种液体”和“在k地有水”)。用这种方法来分解陈述,没有希望找到任何自然
的终点,特别是因为,我们为了使进一步分解成为可能,总能引进新的已定义的普
遍名称。
为了使得所有基础陈述的复合度成为可比的,可以建议:我们必须选择一定的
陈述类作为基本的或原子的陈述,然后通过合取和其他的逻辑运算就能够从这些基
本或原子陈述中得到所有其他陈述。如果成功,我们就应用这种方法来定义复合的
“绝对零度”,然后可以把任何陈述的复合表示为可以说是绝对复合——度。但是
由于上面已经说过的理由,这样一种程序必须被认为是非常不适当的;因为它会给
科学语言的自由使用施加苛刻的限制。
然而,比较基础陈述的复合度,因而也比较其他陈述的复合度,仍然是可能的。
可以这样做:任意选择一个相对的原子陈述类,我们把它作为进行比较的基础。这
样一种相对原子陈述类可以用生成的图式或母式来定义(例如,“在……地方为了……
有一个量器,它的指针指在刻度……和……之间”)。然后,我们可以把通过代入
确定值,从这种母式(或者陈述函项)中得到的所有陈述类定义为相对原子的,因
而定义为等复合的。这些陈述类,与所有可从这些陈述形成的合取一起,可以称之
为一个“场”。一个场的n个不同的相对原子陈述的合取,可以称之为“这场的n组
复合”,并且我们可以说,它的复合度等于数n。
如果对一个理论t,存在这样一个单称(但是不一定是基础)陈述场:对某个数
目d,理论t不能为这场的任何d组复合所证伪,虽然它能为某些d+1组复合所证伪,
那么我们称d为理论对于那个场的特性数。因此,这场的复合度低于d或等于d的所有
陈述是同这理论相容的,是为这理论所允许的,不管这些陈述的内容是什么。
现在就有可能把对理论的可检验度的比较建立在这个特性数d的基础之上。但是
为了避免在使用不同的场时可能造成的不一贯,有必要使用一个比场这一概念更窄
的概念,就是应用场的概念,如果已知理论t,我们说一个场是这理论t的一个应用
场,假如对于这个场,存在理论t的一个特征性数字d,而且假如它满足其他一些条
件。
一个理论t对于一个应用场的特性数d,我称之为t对于这个应用场的维。“维”
这个词本身就说明了问题,因为我们可以把场的所有可能的n组复合看作有空间结构
的(在无限维的构型空间中)。例如,若d=3,则那些可允许的陈述(因为它们的
复合度太低)形成这个构型的一个三维的子空间。从d=3过渡到变为d=2,相应于
从立体过渡到为平面。维数d越小,容许的陈述类(这些陈述由于它们的复合度低,
不管内容如何,不能与这理论矛盾)受到的限制就越严格,这理论的可证伪度就越
高。
应用场的概念不限于基础陈述,但各种单称陈述都被容许作为属于一个应用场
的陈述。但是通过借助场比较它们的维,我们能估计基础陈述的复合度(我们假定,
与高度复合的单称陈述相应的是高度复合的基础陈述)。因此可以假定,与较高维
的理论相应的是一个较高维的基础陈述类,这个类的所有陈述为这理论所容许,不
管它们断言的是什么。
这回答了两种比较可检验度的方法如何联系的问题——一种方法通过理论的维,
另一种方法通过子类关系。有这样一些情况:这两种方法都不适用,或者只有其中
一种方法适用。在这种情况下,在这两种方法之间当然没有发生冲突的余地。但是
如果在一种特殊情况下,这两种方法都适用,那么可以想象会发生这种的事:两个
理论有相同的维,但是,假如用建基于子类关系的方法来评价,可能有不同的可证
伪度。在这种情况下,从后一种方法得出的判断应该被接受,因为这一种方法证明
是比较灵敏的方法。在这两种方法都适用的所有其他情况下,它们一定会导致相同
的结果;因为,借助维理论的一条简单定理可以表明:一个类的维一定大于或等于
它的子类的维。
39.曲线集的维
有时我们可把我所说的一个理论的“应用场”很简单地等同于它的图形表示场,
即图纸上的一块面积,我们在这张图纸上用图形表示理论:可认为这个图形表示场
的每一点相应于一个相对原子陈述。因此理论相对于这个场的维,就等于相应于这
理论的曲线集的维。我将用第36节中的两个陈述q和s来讨论这些关系(我们用维作
比较适用于具有不同谓词的陈述)。假说q——所有行星轨道都是圆——是三维的:
要证伪它,至少需要这场的四个单称陈述,相应于它的图形表示的四个点。假说s:
所有行星轨道都是椭圆,是五维的,因为要证伪它,至少需要六个单称陈述,相应
于图形上的六个点。我们在第36节里看到: q比s更易证伪:因为所有圆都是椭圆,
所以有可能把比较建基于子类关系之上。但是使用维使我们能比较以前不能比较的
理论。例如,我们现在可以比较一个圆假说和一个抛物线假说(它是四维的)。
“圆”、“椭圆”,“抛物线”,每一个词表示一个曲线类或集;这些集中的每一
个集有d个维,假如挑选出这集中的一条特定曲线,或者给以特征描述,d点是必要
和充分的话。在代数表示式里,这曲线集的维依赖于参量的数目,这些参量的值我
们可以自由选择。所以我们可以说,用以表示一个理论的一个曲线集的、可以自由
测定的参量的数目,是那个理论的可证伪(或可检验)度的特性数。
与我的例子中的陈述q和s相联系,我愿意对Kepler发现他的定律作一些方法论
的评论。
我并不想提出这样的看法:完美的信念——指导Kepler作出发现的助发现原理
——是有意或无意地由对可证伪度的方法论考虑所引起的。但是,我的确认为,Ke
pler取得成功部分地由于这一事实:作为他出发点的圆假说,相对地说是易于证伪
的。假如Kepler从由于其逻辑形式不是如圆假说那样易于检验的假说出发,考虑到
计算的困难,这种计算的基础是“在空中”——可以说,漂浮在天空中,以不知道
的方式在运动,他很可能得不到任何结果。Kepler通过证伪他的圆假说达到的毫不
含糊的否定结果,事实上是他的第一个真正的成功。他的方法也被证明完全正确,
因而他可以继续进行下去;特别是因为,即使这第一步尝试也已经产生一些近似值。
无疑,Kepler定律可以用另外的方法找到。但是我想,这是引致成功的方法,
这一点不仅是偶然的。这相当于消去法,仅当理论足够易于证伪——足够精确,能
够和观察经验相冲突时,这种方法才是可应用的。
40.两种减少曲线集维数的方法非常不同的曲线集可以有相同的维。例如,所
有圆的集是三维的;但是所有通过一个给定点的圆的集是一个二维集(和直线集一
样)。如果我们要求圆应该都通过两个给定点,则我们得一个一维集,如此等等。
每一个添加的要求,即一个集的所有曲线必须通过多一个给定点,减少这个集的一
个维。零维类
一维类
二维类
三维类
四维类
直线
圆
抛物线
通过一个给定点的直线
通过一个给定点的圆
通过一个给定点的抛物线
通过一个给定点的圆锥曲线
通过两个给定点的直线
通过两个给定点的圆
通过两个给定点的抛物线
通过两个给定点的圆锥曲线
通过三个给定点的圆
通过三个给定点的抛物线
通过三个给定点的圆锥曲线
除增加给定点数的方法以外,还有其他方法也可以减少维数。例如,给定长短
轴比的椭圆集是四维的(和抛物线集一样),已知偏心率数值的椭圆集也是这样。
从椭圆过渡到圆,当然等于指定一个偏心率(0)或者一个特定的长短轴比(1)。
因为我们对评价理论的可证伪度感兴趣,现在我们要问:这些减少维数的种种
方法对于我们的目的来说是否是等价的,或者我们是否应该更仔细地考察它们的相
对价值。一条曲线必须通过一定的单一点(或小区域),这样的规定常常是联接于
或相应于某一单称陈述即一个初始条件的接受。另一方面,比方说从一个椭圆假说
过渡到一个圆假说,显然相应于理论本身的维的减少。但是,如何区别清楚这两种
减少维的方法?一种减少维的方法并不根据有关曲线的“形式”或“形状”的规定
来进行;即例如通过指定一个或更多的点,或者通过某种等价的规定来减少维,我
们可以给这种方法一个名称:“内容的减少”。在另一个方法里,曲线的形式或形
状规定得更窄,例如,我们从椭圆到圆或从圆到直线等等,我称之为维数的“形式
的减少”的方法。
然而,要使得这个区别截然分明是不很容易的。这一点可以这样来看:减少理
论的维用代数术语来说意味着以常数代替参数。现在,我们如何能区别不同的以常
数代替参数的方法,是不大清楚的。从椭圆的一般方程过渡到圆的方程这种形式的
减少,可以被描述为使一个参数等于0,使第二个参数等于1。但是,如果另一个参
数(绝对项)等于0,那么这就意味着内容的减少,就是规定椭圆的一个点。但是,
我想,如果我们看到它和普遍名称问题的联系,就有可能使得区别清楚起来。因为
内容的减少引进一个个别名称到有关曲线集的定义中,而形式的减少则引进一个普
遍的名称。
让我们设想,也许根据“直指定义”,给予我们某一个别的平面。在这个平面
上的所有椭圆集可以用椭圆的一般方程来定义;圆集可以用圆的一般方程来定义。
这些定义不依赖于我们在这平面的什么地方画与它们有关的(Descartes)坐标;因
此,它们不依赖于坐标的原点和方向的选择。特定的坐标系统只能由个别名称来决
定;比方说由直接指定它的原点和方向来决定。由于椭圆(或圆)集的定义对于所
有Descartes坐标是相同的,它不依赖于这些个别名称的规定:它对Euclid群的所有
坐标变换(位移和相似变换)是不变的。
另一方面,假如人们想定义共同的在平面上有着一个特殊个别点的椭圆(或圆)
集,那么我们就必须运用一个方程,它对于Euclid群的变换不是不变的,而是和一
个单称的,即个别地或直指地规定的坐标系统相联系的。因此,它是和个别名称相
联系的。
可以把这种变换安排在一个等级系统里。对于比较一般的变换群是不变的一个
定义,对于比较特殊的变换群也是不变的。对于一个曲线集的每一个定义,有一个
它特有的(最一般的)变换群。现在我们可以说:一个曲线集的定义D1与一个曲线
集的定义D2“同样一般”(或比它更一般),假如D1和D2(或一个更一般的定义)
对于同一个变换群都是不变的话。一个曲线集的维的减少现在可以被称为形式的,
假如这个减少并不减弱定义的一般性;否则它可以被称为内容的。
如果我们通过考虑它们的维来比较两个理论的可证伪度,显然我们必须在考虑
它们的维的同时考虑它们的一般性,就是它们对于坐标变换的不变性。
按照理论(如Kepler理论)事实上是否作出了关于世界的几何陈述,或理论是
否只是在它可以用图形来表示的意义上是“几何的”——例如,表示压力依赖温度
的图形,上述程序当然必定是不同的。对后一种理论,或相应的曲线集提出这样的
要求:它的定义必须对于比方说坐标系统的旋转是不变的,这是不适当的;因为在
这些情况下,不同的坐标可以表示完全不同的东西(一个是压力,另一个是温度)。
这就是我对用以比较可证伪度的方法的阐述的结论。我相信这些方法能帮助我
们阐明认识论问题,例如简单性问题,我们接着就要讨论这个问题。但是,我们将
要看到,还有其他问题通过我们对可证伪度的考察而得到新的说明;特别是所谓
“假说的概率”或验证的问题。
追记(1972)
这本书的比较重要的思想之一是关于理论的(经验的或信息的)内容的思想
(我们称自然律为“律”不是没有道理的:“它们禁止越多,它们说得越多”。比
较:上面第41页和第112页以后)。
在前一章里我强调两点:(1)理论的内容或可检验性(或简单性:参看第七章)
可以有度,因此可以说这度使得可证伪性概念相对化了(它的逻辑基础仍然是否定
后件假言推理)。(2)科学的目的——知识的增长——可以是和我们的理论的内容
的增长完全一致的。(参看我的论文:‘The Aim of Science’,载Ratio Ⅰ,19
57 PP.24-35,〔经过修改〕重载Contempo-rary Philosophy.ed R.Klibansk
y 1969,PP.129-142;现又为我的书Objectiue Knowledge:An Euolutionary A
pproach的第5章,这书即将由Clarendon Press出版。)最近我进一步发展了这些思
想;特别参看我的Conjec-tures,and Refutatinns第10章,1963年版和以后的版本。
两个新观点是:(3)内容或可检验性概念联系到正在讨论的问题或问题集而进一步
相对化(在1934年我已经把这些概念联系到应用场而相对化了)。(4)引进理论的
真性内容和它对真理的近似或接近(“逼真性”)的概念。
第七章 简单性
关于所谓“简单性问题”的重要性几乎没有一致意见。Weyl在不久前说:“简
单性问题对于自然科学的认识论是最重要的”。然而,近来对于这个问题的兴趣低
落了;也许是因为似乎很少有机会来解释这问题,特别是在Weyl进行透彻的分析之
后。
直到最近,简单性观念一直在无批判地使用,仿佛简单性是什么,为什么它应
该是有价值的,是很明显的。不少科学哲学家在他们的理论里给予简单性概念一个
关键性的重要地位,甚至没有注意到它引起的困难,例如,Mach,Kirchhoff,Ave
narius的追随者试图用“最简单的描述”这一观念来代替因果解释的观念。没有形
容词“最简单的”或者类似的词,这个学说就什么也没有说。当应该解释为什么我
们认为用理论对世界进行的描述,优于用单称陈述对世界进行的描述时,就似乎预
先假定,理论比单称陈述更简单。然而很少有人曾经尝试解释过,为什么理论应该
是更简单的,或者更确切地说,简单性是什么意思。
而且,如果我们假定,使用理论是由于简单性,那么显然,我们应该使用最简
单的理论。Poincare(他认为理论的选择是一个约定的问题)就是这样来表述他的
理论选择原理的:他选择可能的约定中最简单的。但是,哪一个是最简单的?
41.排除美学的和实用的简单性概念
“简单性”这个词用于很多不同的意义。例如Schr odinger理论在方法论意义
上具有很大的简单性,但是在另外一种意义上,完全可以说它是“复杂的”。我们
可以说,一个问题的解决不是简单的而是困难的,或者说,一个描述或一个说明不
是简单的而是难以理解的。
首先,我要从我们的讨论中排除简单性这一术语应用于任何像描述或说明这类
东西。有时,我们说到同一个数学证明的两种说明,其中一个比另一个更简单或更
优美。从知识理论的观点看来,这种区别意义很小;它不在逻辑的范围之内,只是
表示一种美学性质或实用性质的选择。当人们说,一项工作比另一项工作可以“用
更简单的办法完成”时,意思是,它可更容易地完成,或者,为了完成它,需要较
少的训练或较少的知识,这情况是类似的。在所有这些情况下,很容易排除“简单”
这个词;这一词的使用是逻辑外的。
42.简单性的方法论问题
在我们排除了美学的和实用的简单性观念以后,如果有什么东西余留下,那是
什么呢?是否有对于逻辑学家是重要的简单性概念?是否可能按照它们的简单度来
区别在逻辑上不等同的理论?
对这个问题的回答似乎是很可疑的,因为大部分想定义这个概念的尝试得到很
小的成功。例如,Schlick给了一个否定的回答。他说:“简单性是……一个概念,
它表示的选择性质上,部分地是实用的,部分地是美学的”。值得注意的是,他给
出了这个回答,是在他写到这里使我们感兴趣的概念,我称之为简单性的认识论概
念的时候;因为他继续说道:“即使我们不能解释简单性在这里的真正意思是什么,
我们仍然必须认识到这样的事实:任何科学家成功地用一个非常简单的公式(例如:
一个线性的,二次的,或指数的函数)来描述一系列观察,他就立即确信,他已发
现了一条定律。”
Schlick讨论了用简单性概念来定义似定律的规律性概念,特别是“定律”和
“机遇”区别的可能性。他最后排除了这个可能性,说道:“简单性显然是一个完
全相对和模糊的概念;用它不能得到因果性的严格定义,定律和机遇也不能精确地
区别开”。从这一段话中真正期待简单性概念完成什么就很清楚了:它要提供一种
事件的似律性或规律性程度的量度,Feigl说出了同样的看法,他说到“用简单性概
念来定义规律性或似律性的程度”。
简单性的认识论观念在归纳逻辑理论里起着特殊的作用,比如联系到“最简单
曲线”问题。归纳逻辑的信仰者假定,我们通过概括特殊的观察到达自然律。如果
我们设想在一系列观察中的各种结果,作为在一个坐标系统中标绘的点。那么定律
的图形表示就将是一条通过所有这些点的曲线。但是,通过有限数目的点,我们总
能画出形式极为多样的数目无限的曲线。因此,由于定律不是单单由观察决定的,
归纳逻辑面临在所有这些可能的曲线中决定选择哪一条曲线的问题。
通常的回答是:“选择最简单的曲线”。例如,Wittgenstein说:“归纳过程
在于发现可以使之和我们的经验相协调的最简单的定律”。在选择最简单的定律时,
通常不言而喻地假定,比方说,线性函数比二次函数简单,圆比椭圆简单,等等。
但是,没有给出任何理由,或说明选择这个特殊的简单性等级,而不是任何其他的
等级,或说明相信“简单的”定律优于比较不简单的定律——除了美学的实用的理
由以外Schlick和Feigl提到Natkin的一篇未出版的论文,按照Schlick的叙述,Nat
kin建议称一条曲线比另一条更简单,如果它的平均曲率更小的话,或者按照Feigl
的叙述,如果它偏离一条直线更小的话(这两种叙述是不等价的)。这个定义似乎
和我们的直觉符合得相当好;但是,它没有抓住关键之处,例如,它使得双曲线的
一部分(渐近线部分)比圆简单得多,等等。实在说,我不认为,问题能为这样的
“技巧”(Schlick这样称呼它们)所解决。而且,为什么我们应该给予简单性(如
果用这个特殊方法来定义它)以优先权,这仍然是个谜。
Weyl讨论了并否定了一个非常有趣的把简单性置于概率基础之上的尝试。“例
如,假定同一函数y=f(x)的20对坐标值(x,y),当标绘在方格图解纸上时,落
在一条直线上(在预期的精确度内)。因此我们推测,我们在这里面对一条严格的
自然律,y线性地依赖于x。我们所以这样推测是由于直线的简单性,或者因为,如
果该定律是一条不同的定律,这20对任意选择的观察正好非常接近地落在一条直线
上,是极端不可几的。假如,现在我们用这条直线来进行内插和外推,我们会得到
超出观察告诉我们的东西之外的预见,然而,这个分析是可以批判的。总有可能来
定义……会被这20项观察所满足的各种数学函数;而这些函数中的某些会相当大地
偏离直线。对这些函数中的每一个,我们都可以说,除非它代表真的定律。这20项
观察正好落在这条曲线上,是极端不可几的。因此,函数,更确切地说,函数类,
由于它的数学简单性,必定是先验地由数学提供给我们的,这毕竟是必不可少的。
应该注意,这个函数项不必依赖与应满足的观察数一样多的参数”。Weyl关于“函
数类,由于它的数学简单性,必定是先验地由数学提供给我们的”这段话以及他提
到的参数的数目,和我的观点(在第43节中展开)是一致的。但是,Weyl没有说
“数学的简单性”是什么,而且,最重要的,他没有说较简单的定律,与较复杂的
定律相比较,应该具有什么逻辑的或认识论的优点。
以上引证的几段话是很重要的,因为它们和我们现在的目的有关,这目的是分
析简单性的认识论概念。因为这个概念尚未精确地加以确定。所以有可能摈弃任何
想通过下述办法使这个概念精确化的尝试(比如我的尝试)而说:认识论家感兴趣
的这个简单性概念,实际上是一个完全不同的概念。对于这种反对意见,我可以这
样回答:我不赋予“简单性”这个词丝毫重要性。这个术语不是我引进的,我也知
道它的缺点。我所要说的只是,如我的引证所表明的,我要澄清的这个简单性概念
帮助我们回答的问题,正好就是科学哲学家常常提出的与他们的“简单性问题”相
联系的问题。
43.简单性和可证伪度
与简单性概念相联系而产生的认识论问题都可得到解答,只要我们把这个概念
等同于可证伪度。这个断言可能遭到反对;所以我首先试图使它在直觉上更易于为
人所接受。
我已经说明,具有低维的理论比高维理论更易于证伪。例如,具有一次函数形
式的定律比用二次函数表示的定律更易于证伪。但是后者在具有代数函数的数学形
式定律中间,仍然属于最可证伪的定律之列的。这一点和Schlick对简单性的评论完
全一致:“我们当然应该倾向于认为一次函数比二次函数简单,虽然后者无疑地也
描述一条很好的定律……”。
我们已经看到,理论的普遍度和精确度和它的可证伪度一起增加。因此我们也
许可以把理论的严格度——可以说理论把定律的严格性加于自然的程度——等同于
它的可证伪度;这一点表明,可证伪度正是做的Schlick和Feigl期望简单性概念做
的事情。我还可以说,Schlick希望在定律和机遇之间作出的区别,也能借可证伪度
概念之助弄清楚。关于具有似机遇特征的序列的概率陈述,证明具有无限的维(参
看第65节);不是简单的而是复杂的(参看第58节和第59节的后半部分);而且只
是在特殊的保证条件下才是可证伪的(第68节)。
可检验度的比较已经在第31到40节里详细地讨论过。那里提供的某些例子和其
他细节可以容易地转用到简单性问题上来。这一点特别适用于理论的普遍度,一个
比较普遍的陈述能代替许多较不普遍的陈述,并由于这个理由时常被称作为“比较
简单”。理论的维的概念可以说是使得Weyl的用参量的数目来确定简单性概念的思
想精确化了。通过我们在理论的维的形式的减少和内容的减少之间所作出的区别
(参看第40节),可以对付对Weyl理论的某些可能的反对意见。这些反对意见之一
是,轴比和偏心率数值给定的椭圆集虽然它显然不是那么“简单的”,具有和圆集
正好一样多的参数。
最重要的是,我们的理论解释了为什么简单性是如此高度的合乎需要。为了理
解这一点,我们不需要假定“思维经济原理”或者任何这类原理。假如知识是我们
的目的,简单的陈述就比不那么简单的陈述得到更高的评价,因为它们告诉我们更
多东西;因为它们的经验内容更多,因为它们更可检验。
44.几何形状和函数形式
我们关于简单性概念的观点使我们能够解决了一些矛盾,直到现在这些矛盾曾
使得这个概念是否有任何用处成为疑问。
很少人会认为,比方说对数曲线的几何形状是特别简单的;但是一个由对数函
数表示的定律常常被认为是简单的定律。同样地,一个正弦函数通常被说成是简单
的,纵然正弦曲线的几何形状也许不是很简单的。
假如我们记住在参数数目和可证伪度之间的联系。假如我们又在维的形式减少
和内容减少之间加以区别,像这样的困难可以得到解决。(找们也必须记住对于坐
标系统的变换的不变性的作用。)如果我们说到一条曲线的几何形式或形状,那么
我们所要求的是,对于所有归属位移群的变换的不变性,我们还可以要求对相似变
换的不变性;因为我们并没有想把几何图形或形状和一定的位置联结起来。因此,
如果我们把一条单参数对数曲线(y=logax)的形状看作置于一个平面的任何地方,
那么它就有五个参数(假如我们允许相似变换)。因此它就完全不是一个特别简单
的曲线。另一方面,如果用一条对数曲线来表示一个理论或定律。那么描述过的那
种坐标变换是无关的。在这种情况下,进行旋转、平移或相似变换,都是没有意义
的。因为一条对数曲线通常是一种坐标不能互变的图形表示(例如,x轴可以表示大
气压力,y轴表示海拔高度)。由于这个理由,相似变换在这里同样没有任何意义。
类似的考虑适用于沿着一根特殊的轴,例如时间轴的正弦振荡;还有许多其他情况
都是如此。
45.Euclid几何学的简单性
在相对论的大部分讨论中起着主要作用的问题之一是,Euclid几何学的简单性。
从未有人怀疑过,Euclid几何学本身是比任何有一定曲率的非Euclid几何学更简单
些——更不要说具有随地方而变化的曲率的非Euclid几何学了。
乍一看来,这里涉及的这种简单性似乎和可证伪性很少关系。但是,如果讨论
中的陈述被表述为经验的假说,那么我们发现,在这种情况下这两个概念,简单性
和可证伪性,也是重合的。
让我们考虑什么实验可以帮助我们检验这样的假说:“在我们的世界里,我们
必须运用具有某一曲率半径的一种度量几何学”。仅当我们把一定的几何学实体和
一定的物理客体——例如直线和光线、点和几根线的交点——等同起来时,检验才
是可能的。如果采取了这样的等同(一个相关定义,或者也许是一个直指定义;参
看第17节),那么可以看出,Euclid光线几何学的正确性假说的可证伪度,比任何
断言某种非Euclid几何学的正确性的与前者相匹敌的假说的可证伪度高。因为如果
我们测量一个光线三角形的角度之和,那么对180度任何显著偏离都将证伪Euclid假
说。另一方面,具有给定曲率的Bolyai-Lobatschewski几何学的假说是和任何不超
过180度的特定测量相容的。而且,为了伪证这个假说,必须不仅测量角度之和,而
且还要测量三角形的(绝对)大小;这意味着,在角度之外,必须再定义一个测量
单位,例如面积单位。因此我们看到,证伪需要更多的测量;假说和测量结果的更
大的变化相容;因此更难于证伪:它的可证伪度较小。换句话说,Eu-clid几何是
惟一的具有确定曲率的,在其中可能进行相似变换的度量几何学。因此,Euclid几
何图形能对比较多的变换保持不变;即它们可能是维数较少的:它们可能是较简单
的。
46.约定主义和简单性概念
约定主义者所说的“简单性”并不对应于我所说的“简单性”。任何理论都不
是为经验所毫不含糊地决定的,这是约定主义者的中心思想,也是他们的出发点;
这一点我同意。他们相信,他们因此必须选择“最简单的”理论。但是,由于约定
主义者并不把他们的理论当作可证伪的系统,而是当作约定的规定,显然他们认为
“简单性”的意义是和可证伪度不同的。
约定主义者的简单性概念证明确实是部分地美学的和部分地实用的。因此,下
列Schlick的评论(参看第42节)适用于约定主义者的简单性概念,而不适用于我的:
“人们只能用约定来定义简单性概念,这约定必定总是任意的,这一点是确定无疑
的”,奇怪的是,约定主义者自己没有看到他们自己的基本概念——简单性概念的
约定性质。他们必须是忽略了这一点,这是明显的,因为否则他们本来会注意到,
一旦他们已选择了任意约定的方法,他们求助于简单性决不可能使他们避免任意性。
从我的观点看来,假如有人按照约定主义者的实践,坚持某一系统是一个永远
确立了的系统,每当它处于危险中时,他就决意引进辅助假说去挽救它,那么必须
说这个系统是最高度复杂的。因为,这样保护起来的系统的可证伪度等于零。这样
我们就被我们的简单性概念引回到第20节的方法论规则;特别是也引回到限制我们
过度使用特设性假说和辅助假说的规则或原理:使用假说的节约原理。
追记(1972)
在这一章里,我试图表明简单度能够和可检验度等同到什么程度。没有什么东
西依赖于“简单性”这个词:我从不就词进行争论,我也不设法揭示简单性的本质。
我所试图说明的只是这样:
有些大科学家和大哲学家已经论述了简单性和它对科学的价值。我认为,假如
我们假定,当说到简单性时,他们有时在心里想的是可检验性,就能够更好地理解
其中一些论述。这一点甚至说明了Poincare的某些例子,虽然这些例子和他的观点
是冲突的。现在我应该进一步强调两点:(1)我们能在可检验性方面比较理论,仅
当在这些理论应该解决的问题中,至少有一些是重合的。(2)不能用这种方法比较
特设性假说。
第八章 概率
在这一章,我将只讨论事件的概率以及它引起的问题。这些问题的产生同博奕
论和物理学的概率定律有关。我将什么可称之为假说的概率问题——例如一个经常
受到检验的假说是否比一个很少受到检验的假说更可几等问题——留到第79至85节
在“验证”题目下进行讨论。
与概率论有关的观念在现代物理学中起着决定性的作用。然而我们仍然缺乏一
个满意的、前后一致的概率定义;也就是说,我们仍然缺乏一个满意的概率计算的
公理系统。概率和经验之间的关系也仍然需要澄清。在研究这个问题时,我们将发
现对我的方法论观点几乎不能克服的反对意见最初是什么。因为虽然概率陈述在经
验科学中起着如此重要的作用,可是结果它们却在原则上不受严格证伪的影响。然
而,这块绊脚石将成为检验我的理论,以便查明它有什么价值的试金石。
因此我们面临两项任务。第一项任务是为概率计算提供新的基础。我将试图通
过把概率论发展为频率理论做到这一点,沿着Richard von Mises所遵循的路线,但
不用他称之为的“收敛公理”(或“极限公理”),而使用有点削弱了的“随机公
理”。第二项任务是阐明概率和经验之间的关系。这是指解决我所说的概率陈述的
可判定性问题。
我希望这些研究将有助于减轻目前的不满意的情况,物理学家在这种情况下大
量使用概率,而未能前后一致地说明他们所说的“概率”是什么。
47.概率陈述的解释问题
我将从区别两类概率陈述开始:相数字表示某一概率的陈述——我称之为数值
概率陈述——以及不用数字表示的概率陈述。
例如,“用两颗骰子掷11的概率为1/18”,这种陈述就是数值概率陈述一个例
子。非数值概率陈述可以有各种各样。“把水和酒精混合获得均匀的混合物是十分
可几的”,这类陈述如得到适当阐明,就能转变为数值概率陈述(例如,“获得……
的概率很接近1”)。另一种很不同的数值概率陈述例如“发现一种与量子论相矛盾
的物理效应是高度不可几的”;我认为这种陈述不可能转变为数值概率陈述,或者
与某种数值概率陈述等价,而不歪曲它的意义。我将首先讨论数值概率陈述;非数
值概率陈述,我认为不那么重要,容后再考虑。
与每一个数值概率陈述有联系的是这样一个问题:“我们应如何解释这类陈述,
特别是这类陈述所作出的数值方面的断言?”
48.主观解释和客观解释
古典的(Laplace的)概率理论把某一概率的数值定义为用同样可能的情况数除
有利的情况数所得的商。我们可以不理会已经提出来的反对这个定义的逻辑上的异
议,如“同样可能的”不过是“同样可几的”另一种说法。但是甚至在那时我们也
很难承认这个定义提供了一个可毫不含糊地应用的解释。因为其中隐含着若干种不
同的解释,我要把这些解释分为主观的和客观的两类。
概率论的主观解释常常使用的带有心理学味道的说法,如“数学期望”,或者
比方说,“误差的正态定律”等等,使人想起概率论的主观解释;其最初的形式是
心理学主义的。它把概率的大小看作为确定或不确定、相信或怀疑的感觉的量度,
这些感觉可由某些断言或推测在我们心中引起。关于某些非数值陈述,“可几的”
一词可用这种方法颇为满意地加以转译;但是我认为沿着这些路线对数值概率陈述
所作的阐释是十分不能令人满意的。
然而,主观解释的较新变种应该在这里给予更认真的考虑。还不是在心理学上,
而是在逻辑上把概率陈述解释为关于可称之为陈述“逻辑近似”的断言。正如我们
全都知道的那样,陈述能互相处于各种逻辑关系中,如可推演性、不相容性或相互
依赖性;而逻辑-主观理论(Keynes是它的主要阐述者)把概率关系看作是两个陈
述之间的特种逻辑关系。这种概率关系的两个极端情况是可推演性和矛盾:有人说,
如陈述p从陈述q推导出,则q把概率1“给予”p。如p和q相互矛盾,则q给p的概率为
0。在这两个极端之间有其他概率关系,大概可以下列方法解释:陈述声(给定q)
的数值概率越大,则它的内容超出陈述q已包含的内容越少,p的概率依赖q(并且q
把某种概率“给予”p)。
从Keynes把概念定义为“理性信仰程度”这一事实可看出这个理论与心理学主
义理论之间的密切关系。他的“理性信仰程度”是指信赖量,可以根据我们从”给
予”陈述p概率的那个陈述q中得到的信息或知识赋予p以信任量。
第三种解释,客观解释,把每一个数值概率陈述看作为一种相对频率的陈述,
某一种类事件在一偶发事件序列内以这种频率发生。
根据这种解释,“用这颗骰子下一次掷五的概率等于1/6”这陈述实际上不是
一个关于下一次掷骰子的断言;宁可说,它是一个关于整个一类掷骰子的断言,下
一次掷骰子不过是其中一个元素。这个陈述所说的不过是在这类掷骰子中得5的相对
频率等于1/6。
按照这个观点,如果我们能够对数值概率陈述作出濒率阐述,这些陈述才是可
接受的。不能作出频率解释的那些概率陈述,尤其是非数值概率陈述,常常被频率
理论家回避。
下面我将尝试重新把概率理论作为一种(经过修改的)频率理论建立起来。因
此我宣布我信仰客观解释;主要是因为我相信只有客观理论才能解释概率计算在经
验科学中的应用。大家承认,主观理论能够给如何判定概率陈述的问题提供一个前
后一致的解决办法;并且一般地说,它面临的逻辑困难比客观理论少。但是它的解
决办法是:概率陈述是非常经验的;它们是重言的。当我们想起物理学利用概率论
时,这种解决办法就证明是完全不能接受的了。(我摈弃主观理论的这种变种:认
为客观频率理论应从主观假定中推导出来——也许利用Bernoulli定理作为“桥梁”;
由于逻辑上的理由我认为这种纲领是不能实现的。)
49.机遇理论的基本问题
概率理论的最重要应用是用于我们可称之为“似相遇的”(chance-like)或
“随机的”事件,或偶发事件。它们的特征是一种特殊的不可计算性,这使得人们
经过许多次不成功的尝试后倾向于相信,一切已知的理性预测方法用于这些事件必
定失败。可以说,我们感觉到除了先知以外没有一个科学家能够预测它们。然而正
是这种不可计算性使我们得出这样的结论:概率的计算能够应用于这些事件。
如果我们接受主观理论,那么从不可计算性达到可计算性(即达到某种计算的
可应用性)这个有点悖论性质的结论,确实不再具有悖论性质了。但是这种避免悖
论的方法是极不令人满意的。因为它包含着这样的观点:概率计算与经验科学的所
有其他方法相反,不是一种计算预测的方法。按照主观理论,它不过是一种使我们
已知的东西或者更确切地说,使我们未知的东西实行逻辑变换的方法;因为正是在
我们缺乏知识时我们实行这些变换。这种观念确实使悖论消解,但它不能解释被解
释为频率陈述的无知陈述如何能够在经验上受到检验和得到验证。然而这正好是我
们的问题。我们如何能够解释这个事实:我们可从不可计算性——即从无知——中
作出能够解释为经验频率陈述的结论,并且尔后我们发现它们在实践中得到光辉的
验证呢?
甚至频率理论直到现在还不能对这个问题——我将称之为机遇理论的基本问题
——提供一个令人满意的解答。在第67节将表明这个问题与“收敛公理”有联系,
后者是目前形式的这个理论的一个组成部分。但是在这个公理消除后,在频率理论
框架内找到一个令人满意的解决办法是可能的。通过分析这样一些假定就会找到这
种解答,这些假定使我们能够从单个偶发事件不规则序列推论到它们频率的规则性
或稳定性。
50.von Mises 的频率理论
为概率计算的所有主要定理提供基础的频率理论首先由Richard von Mises提出
的。他的基本思想如下。
概率计算是似机遇的或随机的事件或偶发事件序列,即例如连续掷骰子那种重
复性事件序列的理论。借助两个公理条件把这些序列定义为“似机遇的”或“随机
的”:收敛公理(或极限公理),和随机公理。如果一个事件序列满足这两个条件,
von Mises就称它为一个“集合”(collective)。
大体上说,一个集会就是一个事件或偶发事件的序列,它在原则上可以无限地
延续下去;例如掷骰子序列。假设骰子是破坏不了的。在这些事件中,每一个都有
一定的特性和性质;例如可以掷个5,因而具有性质5。如果我们选取直到序列某一
元素以前已出现的所有具有性质5的掷骰子次数,除以直到那个元素以前掷骰子的总
数(即序列中它的基数),那么我们就获得直到那个元素以前的5的相对频率。如果
我们确定了直到这个序列每个元素以前5的相对频率,我们就用这种方法获得一个新
的序列——5的相对频率序列。这种频率序列不同于它与之相应的原先的事件序列,
后者可称为“事件序列”或“性质序列”。
我选取我们称之为“二择一”(alternative)作为一个集合的简单例子。我们
用这个词指假定只有两种性质的事件序列——例如掷一个钱币猜正反面的序列。一
种性质(正面)用“1”表示,另一种性质(反面)用“0”来表示。于是事件序列
(或性质序列)可用下式表示:
(A) 0 1 1 0 0 0 1 1 1 0 1 0 1 0……与这种“二择一”相应
——或更精确地说,与这种二择一的性质“1”相关——的是下列“相对频率序列”,
或“频率序列”: (A’)0 ……
收敛公理(或“极限公理”)假定,随着事件序列越来越长。频率序列将趋向
一个确定的极限值。von Mises使用这个公理是因为我们必须弄清楚我们能够借以工
作的某个固定的频率值(即使实际的频率值有一些波动)。在任何集合中至少有两
种性质;如果我们得到与某个集合所有性质相应的频率极限值,那么我们就得到集
合的“分布”。
随机公理或有时称之为“排除赌博系统原理” (the principle of the excl
uded gambling system),是打算用来为序列的似机遇性质提供数学表现。显然,
如果掷硬币的序列有规律性,比方说在每三次掷正面后就出现反面相当有规律,那
么一个赌徒就会用某种赌博系统来改善他的运气。随机公理就一切集合假定,不存
在能够成功地应用于这种集合的赌博系统。它假定,不管我们可以选取何种赌博系
统以选择认为有利的掷猜(tosses),我们将发现,如果赌博有足够长的时间继续
下去,认为有利的掷猜序列中的相对频率接近的极限值与所有掷猜序列的极限值是
一样的。因此存在着一种赌徒能借以改善他运气的赌博系统的序列不是von Mises意
义上的集合。
对于von Mises来说,概率是“集合中相对频率极限度”的另一个术语。所以概
率概念仅应用于事件序列;从Keynes等人的观点看来,这样的限定大概是完全不能
接受的。对于批评他的解释太窄的人,von Mises的回答是强调科学的使用概率(例
如在物理学中)与一般的使用概率之间的不同。他指出要求定义恰当的科学术语非
要在一切方面去适应不确切的、前科学的用法是个错误。
按照von Mises的意见,概率计算的任务只不过在于此:从具有某些给定“初始
分布”(initial distributions)的某些给定“初始集合”(initial collectiv
es)推论出具有“导出分布”(derived distributions)的“导出集合”(deriv
ed collectives);简言之,根据给定的概率计算出那些没有给定的概率。
von Mises把他的理论的独特特点概括为四点:集合概念先于概率概念;定义概
率概念为相对频率的极限值;提出随机公理;以及规定概率计算的任务。
51.新的概率理论计划
von Mises提出的两条公理或公设以定义集合概念曾遇到强烈的批评——我认为
这个批评不是没有道理的。特别是反对把收政公理和随机公理结合起来,理由是不
允许把极限或收敛的数学概念应用于按照定义(即由于随机公理)必定不服从任何
数学规则或定律的序列。因为数学极限值不过是决定序列的数学规则或定律的特有
性质。数学极限值不过是这种数学规则或定律的一种性质,如果任意选定一个接近
于零的分数,序列中都有一个元素,使得在它之后的所有元素与某个一定的值的差
小于这个分数——于是这个值称为它们的极限值。
为了对付这些反对意见,有人建议不要把收敛公理和随机公理结合起来,仅假
定收敛,即被限值的存在。至于随机公理,建议或者全然放弃它(Kamke),或者用
较弱的要求代替它(Reichenbach)。这些意见的前提是认为引起麻烦的是随机公理。
与这些观点相对照,我倾向于责怪收敛公理不亚于责怪随机公理。因此我认为
有两项任务要做:改进随机公理——主要是一个数学问题;以及完全消除收敛公理
——认识论家特别关心的一个问题(参阅第66节)。
下面我首先讨论数学问题,然后讨论认识论问题。
这两项任务中的第一项,即数学理论的重建,其主要目的是从一个修改了的随
机公理推导出Bernoulli定理——第一个“大数定律”;修改为实现这个目的所需,
不要求更多。更确切地说,我的目的是推导出二项式公式(Binomial Formula,有
时称为“Newton公式”),我称为“第三式”。因为能用通常的方法从这个公式中
获得Bernoulli定理和概率论的其他极限定理。
我的计划是首先制定一个有穷类(finite class)的频率理论,并且尽量在这
个框架内发展这个理论——即直至推导出(“第一”)二项式。这个有穷类频率理
论原来是类理论(thetheory of classes)一个十分基本的部分。它之得到发展只
是为了获得讨论随机公理的基础。
接着我将通过引入收敛公理的老方法进而到无穷序列,即能够无限延续的事件
序列,因为我们需要它来讨论随机公理。在推导出和考察Bernoulli定理之后,我将
考虑如何能消除收敛公理,以及哪一类公理系统我们应该作为结果保留下来。
在数学推导的过程中,我将使用三个不同的频率符号:F”示有穷类的相对频率;
F’示无穷频率-序列相对频率的极限值;最后F示客观额率,即在“不规则”或“随
机”或“似机遇”序列中的相对频率。
52.有穷类内的相对频率
让我们考虑一类α的有穷数目的偶发事件,例如昨天用这粒特定的骰子掷猜这
类偶发事件。设这类α为非空类(non-empty),可以说它起着参考系的作用,将
称之为(有穷的)参考类(reference-class)。属于α的元素数目,即它的基数,
用“N(α)”表示,读作“α数”。另一类β,可以是有穷的,也可以不是有穷的。
我们称β为性质类(property-class)。例如它可以是所有掷5的类,或(如我们
将要说的)所有具有性质5的掷猜类。
属于α又属于β的那些元素类,例如昨天用这粒特定的骰子掷并有性质5的掷类
被称为α和β的乘积类(product- class),用“α·β”表示,读作“α和β”。
由于α·β是α的子类,它至多能含有有穷的元素数(它可以是空类)。α·β中
的元素数用“N(α·β)”表示。
当我们用N表示(有穷)的元素数时,用F”示相对频率。例如,“在有穷参考
类α内性质β的相对频率”写作“αF”(β)”,可读作“β的α频率”。我们现
在能定义
(定义1) αF”(β)=N(α·β)/N(α)
根据我们的例子这意味着:“昨天用这骰子掷时出现5的相对频率,按照定义等
于昨天用这骰子掷5的数被昨天用这骰子掷的总数来除所得的商。”
从这个颇为平凡的定义中,能够十分容易地推导出有穷类中频率计算的定理
(更具体地说,一般乘法定理;加法定理;以及除法定理,即Bayes规则)。在这种
频率计算的定理中,以及在一般的概率计算中,其特征是基数(N数)从不在其中出
现,出现的是相对频率,即比值,或F数。N数仅发生在一些基本定理的证明中,这
些基本定理是直接从这个定义中演绎出来的;但N数并不发生在定理自身中。
在这里用一个十分简单的例子来说明对此应作如何理解。让我们用“”(读作
“β的补数”或简单地读作:“非β”)来表示不属于β的一切元素类。于是我们
可写出:αF”(β)+αF”( )=1虽然这个定理仅包含F数,它的证明要利用N
数。因为这定理认定义(1)中得出,借助于来自断言N(α·β)十N(α·β)=
N(α)的类的计算的一个简单定理。
53.选择、独立、无影响、无关
在能够用有穷类相对频率作的运算中,选择(selection)的运算对以下所述有
特殊重要性。
设给定一个有穷参考类α,例如一只匣子中的钮扣类,以及两个性质类,β
(比方说,红钮扣)和γ(比方说,大钮扣)。我们现在可把乘积类α·β看作一
个新的参考类,并提出α·βF”(γ)值的问题,即在新的参考类内γ的频率的问
题。新的参考类α·β可称为“从α中选择β元素的结果”或“按照性质β从α中
选择”;因为我们可以想到它是通过从α中选择那些具有性质β(红)的一切元素
(钮扣)。
γ发生在新的参考类α·β中的频率与发生在原先的参考类α中的频率相同,
这恰恰是可能的;即
α·βF”(γ)=αF”(γ)是正确的。在这种情况下,我们(遵循Hausdo
rff)说性质β和γ“在参考类a内是相互独立的”。独立关系是三项关系,在性质
β和γ上是对称的。如果两种性质α和β在参考类α内是(相互)独立的,我们也
可说性质γ在α内不受β元素的选择的影响;也许可说参考类α,就性质γ而言,
不受按照性质β所作的选择的影响。
β和γ在α内相互独立或不受影响也可——按照主观理论的观点——解释如下:
如果我们被告知类α的某一特定元素具有性质β,那么这个信息是无关的,如果β
和γ在α内是相互独立的话;也就是对于这个元素是否也有性质γ这个问题是无关
的。如果另一方面我们知道,γ更经常(或不那么经常)发生在子类α·β(已根
据β从α中选择出来)中,那么某个元素有性质β的信息对于这个元素是否也有性
质γ的问题便是有关的了。
54.有穷序列、顺序选择和邻域选择
设有穷参考类α的元素是编了号的(例如盒子中的每一个钮扣都写上一个数目),
并且把它们按照序数排列成序列。在这种序列中我们可以区分出两类具有特殊重要
性的选择,即按照元素的序数进行选择,或简称顺序选择,以及按照它的邻域进行
选择。
顺序选择是根据依赖于元素序数的性质β从序列α中进行选择,元素的选择必
须根据序数决定。例如β可以是性质偶数(even),因此我们从a中选择的一切元素,
其序数是偶数。因此选择出来的元素形成一个所选子序列(selected sub-sequenc
e)。如果性质γ独立于根据β的顺序选择,那么我们也可说,顺序选择对γ而言是
独立的;或者我们也可说序列α就γ而言,不受β元素的选择的影响。
邻域选择之有可能是由于这个事实:在把元素排列为编号序列时,某些邻域关
系就形成了。这使我们例如有可能选择那些其直接先行者具有性质γ的所有成员;
或者比方说,选择那些其第一和第一个先行者,或其第一个后续者具有性质Y的所有
成员,如此等等。
因此如果我们有一个事件序列——比方说掷钱币猜正反面——,我们就必须区
分两类性质:如“正面”或“反面”那样一些的主要性质,这些性质属于与其在序
列中位置无关的每一个元素;以及如“偶数”或“反面的后续者”等那样一些次要
性质,这些性质是一个元素由于它在序列中的地位而获得的。
具有两个主要性质的序列称为“二择一”。正如von Mises业已表明的(如果我
们小心仔细),有可能把概率论的基本点发展为二择一理论,而不牺牲普遍性。用
“1”和“0”表示二择一的两种主要性质,每一种二择一可表示为许多1和0的序列。
一种二择一的结构可以是有规律的,或者它也可能是多少不规则的。下面我将
更周密地研究某些有穷二择一的这种规律性或不规则性。
55.有穷序列的n-自由度
让我们以有穷二择一α为例,它由一个个1和0组成,有规律地排列如下:
(α) 1 1 0 0 1 1 0 0 1 1 0 0 1 1 0 0……在这种二择一中,我们有均等
的分布,即1和0的相对频率是均等的。如果我们用“F”(1)”示性质1的相对频率,
用“F”(0)”示性质0的相对频率,我们可写:(1)αF”(1)=αF”(0)=
1/2现在我们从α中选择(在α序列内)具有直接接在1后面的邻域性质的所有项。
如果我们用“β”表示这种性质,我们可称为所选子序列“α·β“。它有这样的
结构:
(α·β) 1 0 1 0 1 0 1 0 1 0……
这个序列又是具有均等分布的一种二择一。而且,1和0的相对频率都没有变化;
即(2)α·βF”(1)=αF”(1);α·βF”(0)=αF”(0)用第53节采用
的术语,我们可以说二择一α的主要性质不受根据性质β作的选择的影响;简言之,
α不受根据β作的选择的影响。
由于α的每一个元素或具有性质β(即是1的后续者)或是0的后续者,我们可
用“”表示后一性质。如果我们现在选择具有性质的元素,我们得到这样的二择一:
(α·) 0 1 0 1 0 1 0 1 0 1 0……这个序列离均等分布稍有偏差,因为它的始
末都是0(因为均等分布a本身以“0’0”结尾)。如果a有2000个元素,那么α·将
有500个0,只有499个1。这些离均等分布(或其他分布)的偏差只是因第一个元素
或最后一个元素而引起的,可通过使序列足够长而使这些离差变得如我们喜欢的那
么小。由于这个理由在下面我们将置这些偏差于不顾;尤其是我们研究的是无穷序
列,在那里这些离差就消失了。因此,我们说,二择一α·β有均等的分布,并且
二择一α不受有性质的元素的选择的影响。结果,α,或更确切地说,α的主要性
质的相对频率都不受根据β和根据作的选择的影响;所以我们可以说,α都不受根
据直接先行者的性质所作的每一种选择的影响。
显然,这种无影响是由于二择一α结构的某些方面所致;这些方面可把α与其
他二择一区分开来。例如,二择一α.β和α.并非不受根据先行者的性质所作的
选择的影响。
现在我们可以研究二择一α,看看它是否也不受其他选择,尤其是根据一对先
行者的性质所作的选择的影响。例如,我们可从α中选择那些是一对1,1的后续者
的所有元素。并且我们马上看到α并非不受四种可能的对即1,1;1,0;01;0,0
中任何一对后续者的选择的影响。在这些情况下,得到的子序列都没有均等分布;
反之,它们全都由不间断的块(blocks,或“反复”iterations)组成,即只由1,
或只由0组成。
α不受根据单个先行者作的选择的影响,但是并非不受根据成对先行者的选择
的影响,这个事实可用主观理论的观点表述如下。关于α中任何元素一个先行者性
质的信息,对于这个元素的性质问题是无关的。另一方面,关于元素的成对先行者
的性质的信息则是高度有关的;因为给定α据以建立的定律,它使我们能够预测所
讨论的元素的性质:关于元素成对先行者性质的信息,可以说给我们提供演绎出预
测所需的初始条件。(a据以建立的定律要求一对性质作为初始条件;因此就这些性
质而言,它是“二维的”。详细说明一种性质仅是在成为复合时作为初始条件不充
分时才是“无关的”。参阅第38节。)
我没有忘记因果性——原因和结果——概念与预测的演绎的关系是多么密切,
同时我要利用下列术语。以前作出的关于二择一α的断言:“α不受根据单个先行
者作的选择的影响”,我现在用下列说法来表示:“α不受单个先行者任何后效的
约束”,或简言之,“α的自由度为1(1-free)”。不像以前那么说α“不受
(或受)根据成对先行者所作的选择的影响”,我现在说:“a不受(或受)成对先
行者后效的约束”,或简言之,“α的自由度是(不是)2”。
用自由度为1的二择一作为我们的原型,我们现在能够容易地建立也具有均等分
布的其他序列,这些序列不仅不受一个先行者的后效约束,即(像α一样)自由度
为1,而且还不受一对先行者后效的约束,即自由度为2;此后,我们可以继续达到
自由度为3等等的序列。这样把我们引导到对下述是基本的一般概念。这就是不受直
至某个数n的一切先行者后效约束的自由度概念;或者如我们将要说的,n-自白度概
念。更精确地说,我们称一个序列“自由度为n”,当且仅当它的主要性质的相对频
率是“n重无影响”,即不受根据单个先行者和根据成对先行者和根据三个一组的先
行者……和根据n个一组先行者作的选择的影响。
自由度为1的二择一α可以用重复任何倍数的生成周期(generating period)。
(A) 1 1 0 0……来建立。同样我们获得具有均等分布的自由度为2的二择
一,如果我们把(B) 1 0 1 1 1 0 0 0……作为它的生成周期,自由度为
3的二择一从生成周期(C) 1 0 1 1 0 0 0 0 1 1 1 1 0 1 0 0……中获得,
而自由度为4的二择一从生成周期(D) 0 1 1 0 0 0 1 1 1 0 1 0 1 0 0 1 0
0 0 0 0 1 0 1 1 1 1 1 0 0 1 1……中获得。将会看到:面临一个不规则序列的
直觉印象随它n自由度的数n的增长而越强烈。
具有均等分布的一个具n自由度的二择一的生成周期必须包含至少2n+1个元素,
作为例子给定的周期,当然可以开始于不同的位置;(C)例如可从它的第四个元素
开始,于是我们获得的不是(C),而是(C’) 1 0 0 0 0 1 1 1 1 0 1 0 0
1 0 1……
有使序列的n-自由度不变的其他变换。为每一个数目n建立n-自由度序列生成周
期的方法则在别处描述。
如果我们把下一生成周期的最初的n个元素加在一个自由度为n的二择一上,于
是我们得到一个长度为2[n+1]+n的序列。除了其他性质外,这个序列还有以下的
性质:n+1个0和1的每一种排列,即每一个可能的n+1个组,至少在其中发生过一
次。
56.节段序列 二项式的第一形式
给定一个有穷的序列α,我们称由n个连续元素组成的α的子系列为‘’α的n
长度节段”;或更简单地说,“α的n-节段”。如果除了序列α以外,还给定某个
定数n,那么我们能够把α的n-节段排列在一个序列中——α的n-节段序列。给定一
个序列α,我们就可以从α的最初的n个元素的节段开始这种方式,建立一个新的序
列,即α的n-节段序列。其次是α的2到n+1的元素的节段。一般地说,我们把α的
从x到x+n-1的诸元素组成的节段看作新序列的第x个元素。如此获得的新序列可称
为“α的交迭n-节段(overlapping n一segments)序列”。这个名称表示,新序列
的任何两个连续元素(即节段)以这种方式交迭;使它们共有原先序列α的n-1元
素。
现在我们通过选择可以从一个交迭节段的序列中,获得其他序列,尤其是毗邻
n-节段(adjoining n-segments)的序列。
一个毗邻n-节段序列只含这样一些n-节段,它们在不交迭的α中,互相直接接
续。例如开始也许是原先序列α的编号为1至n的元素的n-节段,续在后面的是n+1
至2n,2n+1至3n如此等等的元素的n-节段。一般来说,一个毗邻节段的序列将以α
的第k个元素开始,而它的节段将包含α的编号为直至n+k-1,n+k至2n+k-1,
2n+k至3n+k-1如此等等的元素。
下面将用“α(n)”示α的交迭n-节段的序列,用“αn”示毗邻n-节段序列。
现在让我们更详细一点考虑交迭节段α(n)的诸序列。这样一种节段的每一个
元素是α的一个n-节段。我们可以把例如组成节段的n个一组的有序的0和1看作是
α(n)一个元素的主要性质。或者我们可以更为简单地把它的1的数目看作是这个
元素(不管1和0的次序)的主要性质。如果我们用“m”表示1的数目,则显然m≤n。
现在我们又从每一个序列α(n)得到一个二择一。如果我们选择一个特定的m
(m≤n),并将性质“m”赋予序列α(n)的正好有m个1(所以有n-m个0)的每一
个元素,并且把性质“”(非m)赋予α(n)的所有其他元素的话。因此α(n)的
每一个元素必定有这两个性质中的一个或另一个。
现在让我们再次设想,给定一个具有主要性质“1”和“0”的一个有穷二择一。
设1的频率αF”(1)等于p,0的频率αF”(0)等于q。(我们设分布是不均等的,
即p≠q。)
现在让这个二择一α至少有n-1个自由度(n是任意挑选的自然数)。于是我们
可向下列的问题:性质m在序列α(n)中出现的频率是多少?换言之,α(n)F”
(m)的值是多少?
除了α至少有n-1个自由度外,我们什么也不假定,我们就能用初等算术解决
这个问题。答案包含在下列公式中:(1)α(n)F”(m)=
“二项”式(1)的右边是由Newton在论述有关别的问题时提出的(有时称为N
ewton公式)。我将称它为“二项式的第一形式”。
由于推导出了这个公式我就不再在有穷参考类内考察频率理论。这个公式将提
供给我们一个基础来讨论随机公理。
57 无穷序列 频率的假说性估计
把为n-自由度有穷序列获得的结果推广到用生成周期(参阅第55节)定义的n
-自由度无穷序列是十分容易的。起着参考类(我们的相对频率与此有关)作用的
一个无穷的元素序列可称为“参考序列”。它多少与von Mises意义上的“集合”相
对应。
n-自由度的概念以相对频率的概念为前提;因为n-自由度的定义要求不受影
响——不受根据一定的先行者所作的选择的影响——的是一种性质在其中发生的相
对频率。在我们讨论有穷序列的定理中,我将暂时使用(直到第64节)相对频率极
限值(用F’表示)概念代替有穷类的相对频率(F”)。只要我们把自己限于根据
某个数学规则建立的参考序列,这个概念的使用就不会发生问题。对于这些序列我
们总可以确定相应的相对频率序列是否是收敛的。相对频率极限值概念只是在没有
数学规则只有经验规则(与例如钱卜序列有关的)的序列的情况下才会引起麻烦;
因为在这些情况下,极限值概念是未定义的(参阅第51节)。建立序列的数学规则
的一个例子如下:“序列α的第n个元素应该是0,当且仅当n可被4除”。它定义的
无穷二择一是 (α) 1 1 1 0 1 1 1 0……
其相对频率的极限值αF’(1)=3/4; αF’(0)=1/4。借助数学规则用
这种方法定义的序列我简称为“数学序列”。
与之相对照,建立经验序列的规则是例如“序列α的第n个元素将是0,当且仅
当硬币c的第n次掷猜出现反面时”。但是经验规则不一定总是定义随机性质的序列。
例如,我应该把下列规则称为经验规则:“序列的第n个元素将是1,当且仅当第n秒
(从某个零时算起)时,发现摆p摆到这标记的左方时”。
这个例子表明有时——例如根据与摆有关的一些假说和测量——可用数学规则
代替经验规则。用这种方法我们会找到一个数学序列,它以按我们的目的也许使我
们满意,也许不能使我们满意的精确度接近于我们的经验序列。有可能(我们的例
子可用来建立这种可能)获得一个其各种频率接近于那些经验序列的频率,在我们
目前的情况下具有特殊的意义。我把序列分为数学序列和经验序列时,我利用的是
“内包”上的差别,不是“外延”上的差别。因为如果用“外延”方法,即用一个
接一个地列举其元素的方法使我们得一个序列--因此我们就只能知道它的一个有
穷的片段,一个有穷的节段,不管它有多长——,那么就不可能根据这个节段的性
质确定其一部分的序列是学序列还是经验序列。仅当给定一个建构规则——即“内
包”规则—一时,我们就能判定一个序列是否是数学的还是经验数的。由于我们希
望借极限值(相对频率)概念之助处理我们的无穷序列,我们必须把我们的研究限
于数学序列,实际上就是限于相应的相对频率序列是收敛的那些数学序列。这种限
制等于引入收敛公理。(与这公理有关的问题到第63-66节再讨论,因为与“大数
定律”一起讨论它们比较方便。)因此我们将只谈数学序列。然而我们将只谈那些
数学序列:我们期望或推测它们就频率而言接近于具有似机遇或随机性质的经验序
列,因为它们是我们的主要兴趣所在。但是期望或推测一个数学序列,就频率而言
它接近于经验序列,不过是提出一个假说——一个关于经验序列频率的假说。我们
对经验随机序列的频率的估计是假说这一事实,对我们用以计算这些频率的方法没
有任何影响。显然,在有穷类方面,它对我们如何获得我们的计算由此开始的频率,
丝毫没有关系。这些频率可借实际计算获得,或根据一条数学规则,或根据某种假
说获得。或者我们简直可以虚构一些频率。在计算频率时我们接受某些频率作为给
定的,并从中推导出其他频率。无穷序列中的概率估计同样如此。因此关于我们频
率估计的来源问题不是一个频率计算问题;然而这并不是说把这个问题从我们关于
概率论问题的讨论中排除出去。在无穷经验序列的情况中,我们能区分出我们假说
性频率估计的两种主要“来源”——就是说两种方法,我们用这两种方法就可估计
出频率。一是基于“均等-机遇假说”(equal chance hypothesis),(或等概率
假说equi-probability hypothesis)的估计,另一是基于统计结果的外推(extr
apolation of statisticalfndings)。我用“均筹-机遇假说”,是指这样一种假
说,它断言各种主要性质的概率是均等的:它是断言均等分布的假说。均等-机遇假
说常常基于对称性的考虑。最典型的例子是掷骰子时均等频率的推测,其根据是立
方体六面的对称性和几何等值。至于基于统计学外推的频率假说,死亡率的估计提
供一个很好的例子。在这里关于死亡率的统计资料是用经验查明的,并且根据过去
的趋势将继续足十分接近稳定的,或者它们不会有很大变化——至少在最近时期内
——的假说从已知事例,即从已用经验加以分类和计算的偶发事件外推到未知事例。
具有归纳主义倾向的人容易忽视这些估计的假说性质,他们会把假说性估计,即基
于统计外推的频率预测同它们的经验“来源”之——过去的偶发事件和偶发事件序
列的分类与实际计算混为一谈。往往提出这样的主张;我们从已加以分类和计算的
过去的偶发事件(如死亡统计)中“推导出”概率估计——即频率预测。但是从逻
辑观点看,这个主张并没有得到证明。我们根本没有作什么逻辑推导。我们已经做
的是提出一个不可证实的假说,这个假说在逻辑上是永远得不到证明的,这个假说
就是推测频率仍将稳定不变,因此允许外推。甚至均等-机遇假说也被一些相信归纳
逻辑的人认为是“经验上可推导的”,或“经验上可说明的”,他们认为这些假说
基于统计经验,即基于经验上观察到的频率。然而就我来说,我相信,我们在作出
这种假说性估计时,往往单独爱关于对称意义的想法以及类似的考虑的引导。我看
不出有任何理由为什么这些推测应该只是由于积累大量归纳观察而产生的。然而,
我并不赋于我们估计的起源或“来源”这些问题以很大意义(参阅第2节)。我认为,
更重要的是对这个事实要十分清晰,即频率的一切预测性估计,包括我们从统计外
推中得到的频率——当然还有所有与无穷经验序列有关的频率——总是纯粹的推测,
因为它总是超出我们有权根据观察肯定的任何东西。
我对均等-机遇假说和统计外推的区分与“先验”和“后验”概率的经典区分
是完全符合的。但是由于这些术语是用于如此多的不同意义。而且由于这些术语因
哲学上的联想而被严重玷污,最好还是避免用它们。
我在下面考察随机公理时,将试图寻找逼近随机经验序列的数学序列;这就是
说我将考察频率假说。
58 随机公理的考察
顺序选择(即按位置选择)的概念和邻域选择的概念均已在第55节中引入和说
明。我现在将借助这些概念检查vonMises的随机公理——排除赌博系统原理——以
希望找到一个能代替这个公理的较弱的要求。在von Mises的理论中,这个公理是他
的集合概念的定义的一部分:他要求一个集合中频率的极限一定要对任何种类的系
统选择(systematic Selection)不敏感(他指出,赌博系统总是可被认为是一种
系统选择。)。
对这个公理提出的大多数批评集中于它的表述的相对不重要的和表面的方面。
这与下列事实有关,即在各种可能的选择中,会有这样的选择:比方说选择那些接
近5的掷;显然在这种选择内,5的频率会与在原先序列内5的频率迥然不同。这就是
为什么von Mises在他的随机公理表述中谈到他所说的“选择”或“选取”是“独立
于”掷的“结果”,因而不用所选元素的性质去定义。但是只要指出我们可以根本
不用成问题的措词来表述von Mises的随机公理,就可以完全答复针对这种表述的许
多非难。因为例如我们可以表述如下:在一个集合中频率的极限一定都不受顺序选
择和邻域选择的影响,而且也不受可用作赌博系统的这两种选择方法的所有组合的
影响。
上述困难随这个表述而消失。然而其他困难仍保留。因此也许不可能证明,借
助如此强的随机公理定义的一个集合概念,不是自相矛盾的;换言之,不可能证明
“集合”的类不是空的。(Kamke曾强调证明这一点的必要)至少,建构某个集合的
例子,并用这种方式说明集合的存在,这似乎是不可能的。这是因为满足一定条件
的某一无穷序列的例子只可能由数学规则来提供。但是对于von Mises意义上的集合,
根据定义不可能有这种规则,因为能够把任何规则都用作一种赌博系统或选择系统。
如果所有可能的赌博系统都被排除,这种批评确实是无法驳斥的。
然而也可提出另外的异议来反对排除所有赌博系统的概念:它的要求实在太多
了。如果我们要使某个陈述系统公理化——在这个场合是概率计算定理,尤其是特
殊的乘法定理或Bernoulli定理——,那么所选的公理不仅应该对系统定理的推导是
充分的,而且也是(如果我们能这样推导出定理)必要的。然而可以表明排除所有
选择系统对Bernoulli定理及其系统定理是不必要的。要求排除特殊类的邻域选择是
十分充分的:它是以要求序列应该不受根据任意选取的n个一组的先行者所作的选择
的影响;也就是说,它应该有n个自由度,不受每个n的后效的约束,或简言之,它
应该是“绝对自由的。”
所以我建议用不那么严格的“绝对自由”的要求(对每一个n有n-自由度的意义
上)来代替von Mises的排除赌博系统原理,并且相应地把似机遇的数学序列定义为
满足这个要求的序列。其主要优点是不排除所有赌博系统,因此有可能提供建构在
我们的意义上“绝对自由的”序列的数学规则,从而有可能建构实例。因此也就满
足了上面讨论的Kamke的异议。因为我们现在能够证明似机遇数学序列的概念不是空
的,所以是前后一致。
也许有点奇怪:我们应该试图借助必须符合最严格规则的数学序列来勾划机遇
序列极不规则的特点。von Mises的随机公理起初似乎使我们的直觉更为满意。一个
机遇序列必定是完全不规则的,因此只要我们继续努力试图通过把这个序列延伸得
足够长来证伪这个推测的话,任何推测的规则性一定会在序列的后面部分遇到失败,
知道这一点是颇为令人满意的。但是这个直觉的论证也有利于我的建议。因为如果
机遇序列是不规则的,那么,不容置疑,它们就不会是某种特殊类型的规则序列。
而我们的“绝对自由”要求不过是排除一种特殊类型的规则序列,尽管是一种重要
的类型。
它是一种重要的类型这一点可以从这个事实中看出,即根据我们的要求不言而
喻地排除下述三种典型的赌博系统(参阅下一节)。首先我们排除“正态的”或
“纯粹的”邻域选择,在其中我们根据邻域的某种恒定的特征进行选择。其次,我
们排除“正态的”顺序选择,这种选择选取的元素,它们的间距是恒定的,例如标
号为是k,n+k,2n+k……等等的元素;最后,我们排除这两种类型选择的许多组
合(例如一切第n个元素的选择,假如它的邻域具有某种具体的恒定特征)。所有这
些选择的独特性质是,它们与序列的绝对的第一元素无关;如果原先的序列从另一
个(相应的)元素开始标号,它们就可产生同样的所选的子序列。因此被我的要求
排除的赌博系统是那些无需知道序列的第一元素而可使用的赌博系统。被排除的系
统总涉及某些(线性)变换。它们是简单的赌博系统。(参阅第43节)。我的要求
不予排除的只是涉及诸元素与绝对的(初始的)元素间有绝对距离的赌博系统。
对一切n有自由度n——“绝对自由”——的要求也与我们大多数自觉地或不自
觉地认为对机遇序列也适用的东西完全一致;例如一粒骰子下一次掷的结果不依赖
以前几次掷的结果(掷以前摇摇骰子的做法就是想要保证这种“独立性”)。
59.似机遇序列 客观概率
鉴于我已说过的那些东西,我现在提出下列定义。
我们说一个事件序列或性质序列,尤其是一个二择一,是“似机遇”或“随机
的”,当且仅当它的主要性质的频率极限是“绝对自由的”,即不受根据任何n个一
组的先行者的性质所作的一切选择的影响。与随机的序列相应的频率极限被称为在
有关序列内该性质的客观概率;用F表示。这也可表述如下。设α为具有主要性质B
的似机遇或似随机序列;这时下式成立:
αF(β)=αF’(β)
现在我们必须证明我们的定义足以推导出数学概率论的主要定理,尤其是Bern
oulli定理。随后——在第64节——这里给定的定义将予以修改使之独立于频率极限
的概念。
60.Bernoulli问题
在第56节提到的第一个二项式公式,即 (1)α(n)F”(m)=适用于交
迭节段的有限序列。它可根据这样的假定推导出来,即有限序列α至少有n-1个自
由度。根据同样的假定,我们直接获得一个有限序列的正好相应的公式;那就是说,
如果α是有限的,并且至少有n-1个自由度,那么(2)α(n)F’(m)=
由于似机遇序列是绝对自由的,即对于每一个n有n个自由度,公式(2),即第
二个二项式公式也必须适用于那些序列;并且确实它必须适用于它们,不管我们选
择的n的值是多少。
下面我们将只涉及似机遇序列,或随机序列(如在前节中定义的那样)。我们
就要证明,对于似机遇序列,除了公式(2),第三个二项式公式(3)也必定适用;
这个公式是(3)αnF(m)=
公式(3)在两个方面不同于公式(2):第一,它所断言的涉及毗邻节段αn的
序列,不是交迭节段α(n)的序列。第二,它不包含符号F’,而包含符号F。这意
味着,根据蕴涵它断言邻近节段序列也是似机遇或随机的;因为从F,即客观概率的
定义仅涉及似机遇序列。
(3)所回答的在邻近节段序列中性质m的客观概率问题——即αnF(m)的值的
问题——,我效法von Mises,称之为“Bernoulli问题。对于这个问题的解决,从
而对于第三个二项式公式(3)的推导,假定α是似机遇或随机的也就够了。(我们
的任务等于说明特殊的乘法定理适用于一个随机序列α的毗邻节段序列。)
公式(3)的证明可用两步实现。首先,我们证明公式(2)不仅适用于交迭节
段α(n)的序列,而且也适用于毗邻序列αn的序列。第二,我们证明后者是“绝
对自由的”。(这两步的次序可以颠倒,因为交迭节段α的序列肯定不是“绝对自
由的”;事实上,这种序列提供了一个可称之为“具有后效的序列”的典型例子。)
第一步。毗邻节段αn的序列是α(n)的子序列,它们可通过正态顺序选择从
α(n)中获得。因此如果我们能证明在交迭序列α(n)F’(m)中频率的极限不
受正态顺序选择的影响,我们就是已经采取了第一步(以及甚至走得更远一点);
因为我们将证明这个公式:(4) αnF’(m)=α(n)F’(m)我将首先以n
=2为例概述这个证明;即我将证明(4a) α2F’(m)=α(2)F’(m)
(m≤2)为真;因此很容易概括这个公式以适用于一切n。
从交迭节段α(2)的序列中,我们能够选择毗邻节段的两个以及仅仅两个不同
的节段α(2);一个用(A)表示,包含α(2)的第一,第三,第五……节段,即
由数1,2;3,4;5,6;……组成的α的元素对另一个用(β)表示,包含α(2)
的第二,第四,第六,……,节段,即由数2,3;4,5;6,7;……等组成α的元
素对。现在假定公式(4a)不适用于两个序列中的一个,(A)或(B),结果节段
(即对)0,0太经常出现在比方说序列(A)中;于是在序列(B)中必须出现一个
余离差(complementary deviation);即节段0, 0将不很经常出现(“太经常”,
或“不很经常”是与二项式公式相比较而言的)。但是这与所假定的α的“绝对自
由”是矛盾的。因为如果0,0对在(A)中出现比在(B)中更经常,那么在α的足
够长的节段中,0,0对在某些表示特征的间距内出现比在其他间距内出现更经常。
如果0,0对属于两个α2序列中的一个,更为经常出现的间距就是那些占优势的间距,
如果0,0对均属于两个α2-序列,不那么经常出现的序列就是那些占优势的序列。
但是这与所假定的α的“绝对自由度”是矛盾的;因为根据第二个二项式公式,α
的“绝对自由度”意味着,在任何α(n)序列中一个特定的长度为n的序列出现的
频率只依赖在该序列中出现的1和0的数目,而不是依赖它们在序列中的排列。
这证明(4a);由于这个证明能容易推广到任何n,(4)也就得到证明;这就
完成了证明的第一步。
第二步。αn序列是绝对自由的这一事实可用一个类似的论据来说明。我们仍可
以首先只考虑α2序列;而就这些序列而言,开始只会证明它们的自由度为1。设两
个α2序列中的一个,即节段(A)并不是自由度为1。那么在(A)中,在至少由两
个元素(一个特定的α对)组成的一个节段之后,比方说在0,0节段之后,另一个
节段比方说1,1,必须比如果(A)是“绝对自由的”时更为经常地跟随着;这就是
说,节段1,1出现在根据先行节段0,0从(A)中选择的子序列中的频率比二项式公
式使我们期望更大。
然而,这个假定与序列α的“绝对自由度”是矛盾的。因为如果节段1,1在
(A)中跟随节段0,0过分经常,那么通过补整(compensation),相反情况也必须
出现在(B)中;因为否则四个一组0,0,1,1在α的一个足够长的节段中,会太经
常地出现在某些特征性间距内——即在如果所说的两对属于同一α2序列就会占优势
的那些间距内。此外,在其他特征性间距内,四个一组会不那么经常地出现——即
在那些如果它们均属于两个α2序列就会占优势的间距内。因此我们面临的正好是与
以前同样的情况;而且我们能用类似的考虑证明,假定事件在一些特有的间距内优
先发生,是所假定的α的“绝对自由度”是不相容的。
这个证明又可加以推广,结果我们可以说α序列不仅自由度为1,而且对每一个
n,自由度为n,因而它们是似机遇的,或随机的。
这就完成了我们对这两步的概述。因此我们现在有权在(4)中用F代替F’;这
就是说,我们可以同意这个主张:第三个二项式公式解决了Bernoulli问题。
顺便说一句,我们已证明交迭节段的序列α(n)不受正态顺序选择的影响,只
要α是“绝对自由”时。
这同样适用于毗邻节段序列αn,因为从αn中作的任何一个正态顺序选择可被
认为是从α(n)中作正态顺序选择;所以它必须应用于序列α本身,因为α与α
(1)和α1都是等同的。
因此我们也还证明了,不受正态顺序选择的影响是从“绝对自由度”——它意
指不受某一特殊类型的邻域选择的影响——中得出的必然结论。容易看出,更进一
步的结论是不受任何“纯”邻域选择(即根据它的邻域的某个恒定的特征——不随
元素序数而变化的特征——进行选择)的影响。最后它的必然结论是“绝对自由度”
蕴含着不受这两类选择的所有组合的影响。
61.大数定律(Bernoulli定理)
在假定我们能使n趋向极限。即n→∞的条件下,Bernoulli定理,或(第一)
“大数定律”可以用纯粹数学的推理从第三个二项式方式中推导出来。所以它能断
言的只是无限的序列α;因为正是仅仅在这些序列中αn-序列的n-节段长度能无限
增加。并且它能断言的只是这些“绝对自由”的序列,因为正是仅在假定对每一个
n自由度为n的条件下,我们能使n趋向极限,n→∞。
Bernoulli定理提供了十分类似我曾(效法von Mises)称为“Bernoulli问题”
的一个问题,即αnF(m)的值的问题的解。正如第56节所表明的,一个n-节段可说
具有性质“m”,当它正好含有m个1时;因此在这个(有穷)节段内1的相对频率当
然是m/n。我们现在可定义:α的一个n-节段有性质“△p”当且仅当它的1的相对
频率与αF(1)=p的值,即1在序列α中的概率的离散不超过δ;这里δ是我们任
意选取的接近于0的任何小的分数(但不同于0)。我们能用下列说法表示这个条件:
一个n节段有性质“△p”,当且仅当[-p]<δ时;换言之,节段具有性质‘△p’。
现在Bernoulli定理回答了频率或概率值的问题,在αn序列内这种节段——具有性
质△p的节段的值的问题;因此它回答了αnF(△p)值的问题。
人们在直观上可以猜测:如果值δ(δ>0)是固定的,如果n增加,那么具有
性质△p的这些节段的值,因此αnF(△P)的值,也将增加(并且它的增加将是千
篇一律的)。Bernoulli的证明(在任何一本概率计算教科书中都可以找到这种证明)
接着下去便是借助二项式公式来评价这种增加。他发现如果n的增加没有极限,αn
F(△P)值便逼近最大值1,不管&的固定值有多少。这可用下式来表示。
(1) F(△p)=1 (对任何△p值)
这个公式从改变毗邻节段序列的第三个二项式公式而来。对于交迭节段的序列,
类似的第二个二项式公式用同样的方法直接导附相应的公式。
(2) F’(△p)=1 这个公式对于交迭节段序列以及从它们之中作正态顺
序选择是正确的,因此对于具有后效的序列(Smoluchowski曾研究过这些序列)也
是正确的。公式(2)本身产生(1),假如所选的序列不交迭,所以自由度为n。
(2)可描述为Bernoulli定理的一种变式;而我在这里将要就Bemoulli定理所说的
话经过必要的修正(mutatis mutandis)以适用于这种变式。
Bernoulli定理,即公式(1),可用下面的话表示。让我们称从一随机序列α
中选择的长度固定的一个长的有穷节段为一“中等样本”(fair sample),当且仅
当在这个节段内1的概率,即在随机序列内1的概率值与p的离差只有某一小的固定的
分数(我们可以自由挑选这个分数)。因此我们可以说,只要我们使这些节段有足
够长,偶然碰到一个中等样本的概率如我们所喜欢的那样逼近于1。
在这个表述中,“概率”(或“概率值”)一词出现两次。在这里如何解释或
翻译它?在我的频率定义的意义上,这词不得不翻译如下(我将“概率”一词译为
频率语言的两种译法用黑体表示):所有足够长的有限节段中绝大多数有“中等样
本”;即它们的相对频率与该随机序列频率值p的离差为一任意固定的很小的量;或
简言之:频率p近似地实现在几乎所有足够长的节段中。(我们如何达到p值与我们
现在的讨论是无关的;比方说它可以是一种假说性估计的结果。)
记住Bernoulli频率αnF(△p)一成不变地随节段的长度n的增加而增加,一成
不变地随n的减少而减少,所以,相对频率值在短的节段中实现是比较罕见的,我们
也可说:
Bernoulli定理说明,“绝对自由的”或似机遇的序列的短节段经常表现在与p
有比较大的离差,因此有比较大的涨落,而较长的节段,在大多数情况下,将表现
出随长度的增加与P的离差越来越小。结果,在足够长的节段中大多数离差将变得如
我们希望的那样小;换言之,大的离差将变得如我们希望的那样罕见。
因此,如果我们取随机序列的一个十分长的节段,为了通过计算或也许利用其
他的经验的和统计的方法,求在它的子序列内的频率,那么在大多数情况下我们将
得到如下结果。有一个特征性平均频率,使整个节段中以及几乎所有的长的子序列
中,相对频率与这个平均值的离差很小,如果我们挑选的子节段越短,较小的子节
段的相对频率与这个平均值的离差就越大和越经常,这个事实,即有穷节段这种可
在统计学上得到确定的行为,系指它们的“拟收敛行为”;或系指这样的事实:随
机序列在统计学上是稳定的。
因此,Bernoulli定理断言,似机遇序列的节段较小,经常表现为大的涨落,而
大节段总表现恒定或收敛;简言之,我们在小节段中发现无序和随机,在大节段中
发现有序和恒定。“大数定律”式所指的正是这种行为。
62.Bernoulli定理和概率陈述的解释
我们刚刚看到,用言语表述的Bernoulli定理中“概率”一词出现了两次。
频率理论家在两种情况下根据它的定义翻译这个词没有困难:他能对Bernoull
i定理和大数定律提供一个清楚的解释。主观理论的拥护者也能以它的逻辑形式做到
这一点吗?
想把“概率”定义为“理性信仰程度”的主观理论家,当他把“……的概率如
我们希望的那样逼近1”这些话解释为“……几乎是确定无疑的”时,他前后完全一
致,并且有权这样做。但是当他继续说:“……相对频率与它最可几的值p 的离差
小于一定量……”,或用Keynes的话说,“事件出现的比例与最可几的比例p的离散
小于一定量……”时,他只不过模糊了他的那些困难。这听起来似乎蛮有道理,至
少乍一听来是这样。但是如果在这里我们也把“可几的”(有时省略)一词,用主
观理论的意义加以翻译,那么整个问题变成这样:“相对频率与理性信仰程度p值的
离差小于一定量几乎是确定无疑的,”我认为这是十足的废话。因为相对频率只能
与相对频率作比较,只能与相对频率有离差或没有离差。很清楚,在演绎Bernoull
i定理之后,把一个不同于演绎之前给予p的意义给予它是不允许的。因此我们看到
主观理论不能用统计学的大数定律来解释Bernoulli定理。统计定律的推导只有在频
率理论的框架内才有可能。如果我们从严格的主观理论出发,将永远达不到统计陈
述——即使努力填补同Bernoulli定理之间的鸿沟也不能达到。 63.Bernoulli定理
和收敛问题
从认识论观点看,我对上述大数定律的演绎是不满意的;因为收敛公理在我们
的分析中所起的作用是很不清楚的。
实际上通过把我的研究限于具有频率极限的数学序列已不言而喻地引入了这类
公理(参阅第57节)。结果甚至容易使人认为我们的结果——大数定律的推导——
是无关紧要的;因为“绝对自由”的序列在统计学上是稳定的这一事实可被认为是
它们的收敛所蕴含的,而它们的收敛如果不是不证自明也是不言自明地被假定的。
但是正如von Mises已清楚地表明的那样,这个观点是错误的。因为有些序列满
足收敛公理,虽然Bernoulli定理对它们不适用,因为具有频率接近1的任何长度的
节段,出现在与p有一定程度离散的频率中。(极限p在这些情况下的存在是由于这
个事实:虽然离散可无限增加,但它们相互抵销。)这些序列看起来仿佛它们在任
意大的节段中是发散的。即使相应的频率序列事实上是收敛的。因此大数定律根本
不是收敛公理的无关紧要的推断,而且,这个公理对于推导大数定律完全不充分。
这就是为什么我对随机公理的修改,“绝对自由”的要求是不可缺少的。
然而,我们的理论重建,提示了这样一种可能性:大数定律也许是独立于收敛
公理的。因为我们已经看到,Bernoulli定理是直接从二项式公式中得出的;此外,
我已证明,可为有穷序列推导出第一个二项式公式,因此当然无需任何收敛公理。
还必须假定的一切是参考序列α的自由度至少是n-1;这是一个从中得出特殊乘法
定理的可靠性以及第一个二项式公式的可靠性的假定。为了过渡到极限,为了获得
Bernoulli定理,只需假定我们使n如我们希望的那样大。因此就能看出,Bernoull
i定理大概是对的,即使对于有穷序列也是如此,如果对于一个足够大的n它们的自
由度为n的话。
所以看来Bernoulli定理的演绎并不依赖于假定频率极限存在的公理,而是仅依
赖于“绝对自由度”或随机性。极限概念仅起次要的作用:它用来把相对频率的概
念(在第一个例子中给它下定义只是为了有穷类,没有它,n-自由度的概念就不能
提出)应用于能无限延伸的序列。
此外,不应忘记,Bernoulli本人是在经典理论的框架内演绎他的定理的,这个
理论不包含收敛公理;也不应忘记,作为频率极限的概率定义只是经典形式体系的
一种解释——而且不是惟一可能的一种解释。
我将试图用除n-自由度(应适当地加以定义)外无需假定任何东西就可推演出
这个定理来证明我的推测——Bernoulli定理独立于收敛公理。并且我将试图证明它
甚至适用于其主要性质并不具有频率极限的那些数学序列。
只要能够证明这一点,我就会认为我之推演出大数定律从认识论家的观点来看
是令人满意的。因为似机遇经验序列证明,我已描述为“收敛”或“统计学上稳定
的”那种特殊行为,是一个“经验事实”——或至少有时人们这样告诉我们(参阅
第61节)。通过用统计方法记录长节段的行为,人们能够确定相对频率越来越逼近
一个限定的值,相对频率在其中涨落的间隔变得越来越小。对这种所谓的“经验事
实”,已进行过如此多的讨论和分析,确实往往认为它是大数定律的经验验证,对
这种“经验事实”可以从不同角度来看。具有归纳主义倾向的思想家大多数认为它
是基本的自然律,不能还原为任何更简单的陈述;认为它是必须完全加以接受的我
们世界的特性。他们认为以适当形式——例如以收敛公理的形式——表示的这个自
然律应该作为概率论的基础,从而使概率论具有一门自然科学的性质。
我对这种所谓“经验事实”的态度是不同的。我倾向于认为,它可还原为序列
的似定律性质;可从这些序列的自由度为n的事实中推导出来。我认为Bermoulli和
Poisson在概率论领域的成就正是在于他们发现了一种方法以表明这种所谓“经验事
实”是重言式,表明从小规模的无序(假如它满足表述得合适的n-自由度条件)合
乎逻辑地得出一种大规模的稳定性秩序。
如果我们能够无需假定收敛公理而演绎出Bernoulli定理,那么我们就可把大数
定律的认识论问题还原为一个公理独立性问题,因而还原为一个纯粹的逻辑问题。
这种演绎也说明为什么收敛公理在各种实际应用(试图计算经验序列的近似行为)
中起了很好的作用。因为即使对收敛序列的限制结果弄清是不必要的,利用收敛数
学序列来计算经验序列的近似行为(它根据逻辑上的理由在统计学上是稳定的)肯
定不是不合适的。
64.收敛公理的排除“机遇理论基本问题”的解决
迄今频率极限除了具有提供一个可应用于无穷序列相对频率的明确概念外,在
我们的概率论的重建中没有其他功能,因此我们可以借助它来定义(不受后效约束
的)“绝对自由度”。因为正是相对频率被要求不受根据先行者作出选择的影响。
我们早就把我们的研究限制在具有频率极限的二择一,因此不言而喻地引入了
收敛公理。现在,为了使我们摆脱这个公理,我将摆脱这个限制,而不用任何其它
限制来代替它。这就是说我将不得不建构一个频率概念,它能接管被排除的频率极
限的功能,并可应用于所有的无穷参考序列。
满足这些条件的一个频率概念是相对频率序列聚点的概念。(如果在任何给定
的元素之后有一些与α的离差小于一定量,即使这个量很小,就说α值是某一序列
的聚点。)这个概念可不加限制地应用于所有无穷序列,这一点可从这个事实中看
出,即对于每一个有穷的二择一,与之相应的相对频率序列中必有至少一个这样的
聚点存在。由于相对频率决不可能大于1,也不可能小于0,相对频率序列必定由1和
0连结起来。而且作为一个无穷的连结起来的序列,它必须(根据著名的Bolzano和
Weierstrass)至少有一个聚点。
简而言之,与一个二择一α相应的相对频率序列的第一个聚点被称为“α的中
频率(midddle frequency)”。因此,我们可以说:如果一个序列α有一个并且只
有一个中频率,那么同时这就是它的频率极限;反之亦然:如果它没有频率极限,
那么它就有不止一个中频率。
将会发现中频率概念十分适合于我们的目的。正如前面p 是序列α的频率极限
这一点是我们的估计——也许是假说性估计——一样,我们现在也可以使用p是α的
中频率这一估计。而且假如我们采取必要的预防措施,我们能够借助这些估计的中
频率进行计算,类似我们用频率极限计算一样。此外,中频率概念可应用于所有可
能的无穷参考序列,没有任何限制。
如果我们现在试图把我们的符号αF’(β)解释为中频率,而不是频率极限,
并且我们因而改变客观概率的定义(第59节),我们的公式大多数仍然是可推导的。
然而有一个困难:某一中频率不是惟一的。如果我们估计或推测一个中频率是αF’
(β)=p ,那么这不排除αF’(β)有除了p以外的值。如果我们假定这并非如
此,那就不言而喻要引入收敛公理。如果在另一方面,我们定义客观概率无需这种
具有惟一性的假定,那么我们就获得(至少在第一个例子中)一个模棱两可的概率
概念;因为在某些条件下一个序列可同时拥有都是“绝对自由的”若干中频率。但
是这是难以接受的,因为我们习惯于用不含糊的或惟一的概率;也就是假定在同一
参考序列内对于同一性质,可能有一个,并且只可能有一个概率p。
然而,无需极限公理定义惟一的概率概念的困难是容易克服的。我们可引入惟
一性要求(毕竟是最自然的程度)作为最后一步,在假定了序列将是“绝对自由的”
以后。这使我们对我们的似机遇序列定义以及客观概率定义提出下列修改作为对问
题的一种解决办法。
设α为一个二择一(有一个或数个中频率)。设α的1有一个或只有一个“绝对
自由的”中频率p;于是我们说α是似机遇或随机的,并且p是1在α内的客观概率。
这有助于把这个定义分为两个公理性要求。
(1)随机性要求:对于似机遇的二择一,至少必须有一个“绝对自由的”中频
率,即它的客观概率p。
(2)惟一性要求:对于同一似机遇的二择一的同一性质,必定有一个且只有一
个概率p。
前面建构的实例保证了这个新公理系统的无矛盾性。有可能建构不具有频率极
限的序列,虽然它们有一个且只有一个概率。这表明新的公理要来实际上比老的更
广泛,更不确切。如果我们以下列形式陈述(如我们可以陈述的那样)我们的老公
理,这个事实甚至会变得更加明显:
(1)随机性要求:如上。
(2)惟一性要求:如上。
(2’)收敛公理:对于同一似机遇二择一的同一性质除了它的概率p外不存在
其他中频率。
我们可从建议的要求系统中演绎出Bernoulli定理,以及同它一起的经典概率计
算定理。这就解决了我们的问题:现在有可能在频率理论的框架内演绎出大数定律,
而无需利用收敛公理。此外,不仅第61节公式(1)和Bernoulli定理的文字表述仍
然不变,而且我们给予它的解释也仍然不变:在一个没有频率极限的似机遇序列情
况下,几乎所有足够长的序列表明与p只有小的离差,这仍然是正确的。在这些序列
中(正如在有频率极限的似机遇序列一样)具有拟发散行为的任何长度的节段,也
就是与p的离差有任何量的节段,当然不时会出现。但是这些节段比较罕见,因为它
们必定被其中所有的(或几乎所有的)节段具有拟收敛行为的序列极端长的部分所
补偿。正如计算所表明的,这些延伸部分一定会比它们补偿的具有发散行为的节段
长几个数量级。
这也就是解决“机遇理论基本问题”(在第49节就是这样称呼的)的地方。从
单个事件的不可预测性和不规则性到概率计算规则对这些事件的可应用性,这看起
来自相矛盾的推论实际上是可靠的。假如根据这样一个假说性假定,即在根据先行
者所作的任何选择中只出现一个循环的频率——“中频率”——因而没有后效发生,
我们就能够以相当的逼近度来表示不规则性。因为根据这些假定,有可能证明大数
定律是重言的。坚持这样的结论,即在可以说任何事情在这时和那时都会发生的—
—虽然某些事情的发生只是罕见的——不规则序列中,某种规则性或稳定性将出现
在十分大的子序列中,这是可以允许的,并非自相矛盾的(有人有此主张)。这个
结论也不是不重要的,因为为了这个结论我们就需要特殊的数学工具(Bolzano和W
eierstrass定理,n-自由度概念,以及Bernoulli定理)。当我们知道,不规则性
的假定可以置于某种频率假说(不受后效约束的假说)的形式中,并且知道,如果
我们要证明从不可预测性到可预测性,从无知到知识的推论的可靠性,它就必须置
于这种形式中,那么这种推论外表的自相矛盾就消失了。
现在已变得很清楚,为什么老的理论不可能适当处理我所说的“基本问题”。
大家承认,主观理论能够演绎出Bernoulli定理;但是在大数定理时兴以后它决不能
用频率前后一致地解释它(参阅第62节)。因此它决不能说明概率预测统计学上的
成功,另一方面,老的频率理论,根据它的收敛公理则明确要求有规则性。因此在
这个理论内不会有从小规模的不规则性推论到大规模的稳定性问题,因为它只涉及
从大规模的稳定性(收敛公理)同小规模的不规则性(随机公理)结合在一起,推
论到大规模的特殊形式的和稳定性(Bernoulli定理,大数定律)。
收敛公理不是概率计算基础的一个必要部分。我用这个结果来结束我的数学计
算分析。
现在我们回来考虑性质截然不同的方法论问题,尤其是如何判定概率陈述问题。
65.可判定性问题
无论我们可给概率概念下什么定义,或我们选择什么样的公理表述:只要二项
式公式在系统内是可推导出来的,概率陈述就是不可证伪的。概率假说并不排除任
何可观察的东西;概率陈述不可能同一个基础陈述发生矛盾,或被它反驳;它们也
不可能被任何有限数目的基础陈述所反驳;因此也就不会被任何有限数目的观察所
反驳。
让我们假定我们已对某个二择一α提出某个均等机遇假说;例如我们已估计到
用一块硬币作掷猜出现“1”和“0”的频率是均等的,因此 αF(1)- αF(0)
=1/2;再让我们假定我们在经验上发现无例外地一次又一次出现“1”:于是我们
无疑会在实际上放弃我们的估计,认为它已被证伪。但在逻辑的意义上不可能有证
伪问题。因为我们可以肯定观察的只是一个有限的掷猜序列。并且虽然根据二项式
公式,碰巧出现与1/2的离差很大的十分长的有限节段的频率是极小的,然而它必定
总仍然是大于0。因此具有甚至最大离差的有限节段十分罕见的出现决不可能反驳这
个估计。实际上,我们必定会期望它出现:这是我们估计的一个推断。任何这种节
段可计算的罕见性将是证伪概率估计的一种手段,这种希望证明是要落空的,因为
甚至一个长的、离差大的节段的频率出现,也总可以说不过是一个更长、离差更大
的节段的一次出现。因此不存在在外延方面给定的事件序列,所以不存在能够证伪
概率陈述的有限的几个一组的基础陈述。
只有一个无穷的事件序列——根据某项规则在内包上加以定义的——能反驳一
个概率估计。但是鉴于第38节阐述的考虑(参阅第43节),这就是说,概率假说是
不可证伪的,因为它们的维(dimension)是无限的。所以我们实际上应把它们描述
为经验上没有信息的、没有经验内容的。
然而面对物理学利用从概率假说性估计那里得到的预测所取得的成功,任何这
种观点显然是不能接受的。(这里所用的论据同早些时候用来反对主观理论把概率
解释为重言的论据是一样的。)许多这些估计的科学意义不亚于其他任何物理学假
说(例如,不下于某一决定论性质的假说)。并且物理学家常常很能判定他是否可
暂时接受某种特定的概率假说为“经验上得到确证的”,或他是否应该把它作为
“实践上被证伪的”而加以摈弃,即对于预测设有用处。十分明显,这种“实践上
被证伪”只能通过方法论上的判定才能获得,以把高度不可几的事件认作被排除的
——被禁止的。但是根据什么理由可认为它们如此呢?我们应从什么地方获得这种
思路?这种“高度不可几性”从哪里开始?
由于从纯逻辑观点看,概率陈述不可能被证伪这个事实是不可能有什么疑问的,
我们在经验上使用它们这个同样不容置疑的事实似乎必定是对我关于方法(我的划
界标准决定性地依赖于它)的基本思想的致命打击。然而我将通过果敢地应用这些
思想来试图回答我已提出的问题——什么是可判定性问题。但是要做到这一点,我
将首先不得不分析概率陈述的逻辑形式,既考虑到它们之间逻辑上的相互关系,又
考虑到它们与基础陈述所处的逻辑关系。
66.概率陈述的逻辑形式
概率估计不是可证伪的。当然,它们也不是可证实的。同样理由这也适用于其
他假说,因为看到任何实验结果,不管多么多和多么有利,最后总能确定“正”的
相对频率是1/2,并且将总是1/2。
因此概率陈述和基础陈述不可能相互矛盾,也不可能彼此蕴含。然而由此得出
结论说概率陈述和基础陈述之间没有任何逻辑关系,那就错了。并且同样不能认为
虽然在这两类陈述之间有逻辑关系(因为观察序列同频率陈述显然或多或少是接近
一致的),这些关系的分析迫使我们引入一种突破经典逻辑的特殊概率逻辑。与这
些观点相反,我认为这些关系完全能够用可推演性和矛盾的“经典”逻辑关系来分
析。
从概率陈述的非可证伪性和非可证实性可以推论出,它们没有可证伪的推断,
它们本身不可能是可证实陈述的推断。但是相反的可能性并未排除。因为它可以是
(α)它们有单向可证实推断[纯粹存在推断,或有推断(there-is-conse-qu
ences)]或(b)它们本身是单向可证伪全称陈述[所有- 陈述(all—statements)]
的推断。
可能性(b)对于弄清概率陈述和基础陈述之间的逻辑关系鲜有帮助:一个非可
证伪陈述,即一个说得很少的陈述能够属于可证伪的、因而说得更多的陈述的推断
类,这是非常明显的。
对我们意义更大的是可能性(α),它无论如何不是没有意义的,并且事实上
结果证明对我们分析概率陈述和基础陈述之间关系是基本的。因为我们发现能够从
每一个概率陈述中演绎出无限类的存在陈述,但反之不然。(因此概率陈述断言的
比任何这些存在陈述断言的更多。)例如,设p是对某一二择一假说性估计的概率
(并设0≠p≠1);那么我们能从这个估计中演绎出例如1和0都将出现在这序列的存
在推断。(当然也还有许多远不是那么简单的例子——例如,会出现与p的离差仅为
一非常小的量的节段。)
但是我们从这个估计中能演绎出的多得多;例如“一遍又一遍地”出现一个具
有性质“1”的元素和具有性质“0’的另一个元素;那就是说,在任何元素x之后,
在序列中会出现一个具有性质“1”的元素y,并且也出现一个具有性质“0”的元素
x。这种形式的陈述(“对于每一个x有y具有可观察的、或外延上可检验的性质B”)
既是不可证伪的——因为它没有可证伪的推断——又是不可证实的——由于使之成
为假说性的“所有”或“对于每一个”。虽然如此,它能够得到更好地或不那么好
地“确证”——指我们可以证实它的许多或很少存在推断,或者不能证实它的存在
推断;因此它与基础陈述处于似是概率陈述特有的关系中。上述形式的陈述可称为
“全称化的存在陈述”或(全称化的)“存在假说”。
我的主张是,概率估计对基础陈述的关系,以及这些估计或多或少得到很好
“确证”的可能性,考虑到这一事实就能理解:存在假说在逻辑上可从所有概率估
计中演绎出来。这对概率陈述本身是否可有存在假说的问题是有启发的。
一切(假说性的)概率估计蕴含着这样的推测:所说的经验序列几乎是似机遇
和随机的。这就是说,它蕴含着概率计算公理的(近似的)可应用性,以及真理性。
所以,我们的问题就是这些公理是否代表我所说的“存在假说”的问题。
如果我们检查一下第64节中提出的两个要求,那么我们发现随机性要求实际上
具有存在假说的形式。另一方面,惟一性要求则没有这种形式;它不可能有这种形
式,因为这种形式的陈述“只有一个……(There is only one……)”必然具有全
称陈述的形式。(可译为“至多一个……”或“所有……是同一的”。)
在这里我的论点是,正是概率估计的(可称之为的)“存在成份”,因而正是
随机性的要求,概率估计和基础陈述之间才建立起一种逻辑关系。因此,惟一性的
要求,作为全称陈述,没有任何外延的推断(extensional consequences)。具有
所要求性质的p的值存在这一点确定能够在外延上得到“确证”——虽然只是暂时地;
但是只存在一个这样的值这一点则不能。这后一个全称的陈述可能在外延上有意义,
仅当基础陈述能够同它发生矛盾时;这就是说,仅当基础陈述能够肯定存在的值不
止这一个时。由于它们不能够(因为我们记得不可证伪性与二项式有密切关系)做
到这一点,惟一性的要求必然在外延上是没有意义的。
这就是为什么如果我们从系统中消去惟一性要求,概率估计和基础陈述以及前
者的分级“可确证性”之的分级之间所有的逻辑关系不受影响的缘故。在这样做时,
我们能够给予系统以纯粹存在假说的形式。但是我们因此不得不放弃概率估计的惟
一性,并且因而(就惟一性而言)获得某种不同于通常概率计算的东西。
所以惟一性的要求显然不是多余的。那么它的逻辑功能是什么?
虽然随机性要求有助于确立概率陈述和基础陈述之间的某种关系,惟一性要求
调节着各种概率陈述本身之间的关系。没有惟一性要求,作为存在假说的某些陈述,
可以从其他陈述中推导出来,但是它们决不可能彼此矛盾。只有惟一性的要求才保
证,概率陈述能彼此矛盾;因为根据这个要求它们获得其成分为一个全称陈述和一
个存在假说的合取形式;并且这种形式的陈述能够彼此处于同样基本的逻辑关系中
(同义、可推导性、相容性和不相容性),正如任何理论——例如一个可证伪的理
论——的“正常的”全称陈述那样。
如果我们现在考虑收敛公理,那么我们发现,在它具有一种不可证伪的全称陈
述的形式这一点上它类似惟一性要求。但是收敛公理要求的比惟一性要求的更多。
然而这种附加要求也不可能有任何外延上的意义;此外,它没有逻辑或形式的意义,
而只有内包上的意义:它要求排除所有没有频率极限的用内包定义的(即数学的)
序列。但是从应用观点看,这种排除证明甚至在内包上也没有意义,因为在应用概
率论中我们当然不涉及数学序列本身,而只涉及经验序列的假说性估计。所以排除
没有频率极限的序列,只能用来告诫我们不要把那些经验序列着作为似机遇或随机
的,对于那些经验序列我们假定它们没有频率极限。但是对这种告诫,我们能够采
取何种可能的行动?鉴于这种告诫,我们应该容许或避免哪类关于经验序列可能收
敛或发散的考虑或推测,保证收敛标准同发散标准一样可应用于这些序列?一旦摆
脱了收敛公理,所有这些尴尬的问题也就消失了。
因此我们的逻辑分析使系统各部分的要求的形式和功能都一目了然,并且表明
反对随机性公理和支持惟一性要求的理由是什么。同时可判定性问题似乎变得越来
越重要。并且虽然我们不一定称我们的要求(或公理)“无意义”,看来我们被迫
把它们描述为非经验的。但是概率陈述的这种描述——不管我们用什么话来表达它
——是否同我们研究的主要思想相矛盾呢?
67.思辨形而上学的概率系统
概率陈述在物理学中最重要的用处是这样:某些物理学规律性或可观察的物理
效应被解释为“宏观定律”;也就是说,它们被解释或说明为大数现象,或假说性
的、不能直接观察的“微观事件”的可观察结果。宏观定律用下列方法从概率估计
中演绎出来:我们证明,与所说的观察到的规律性一致的观察结果,应该期望其概
率十分接近于1,即其概率与1的离差为一个能达到按我们选取的那样小的量。当我
们已证明这一点时,那么我们就说,我们已经用我们的概率估计把所说的可观察效
应“解释”为一个宏观效应。
但是如果我们以这种方法使用概率估计来“解释”可观察的规律性而不采取特
定的预防措施,那么我们会马上陷入某些思辨,根据一般的用法,完全可以把它们
描述为思辨形而上学的典型。
因为概率陈述是不可证伪的,以这种方法用概率估计“解释”我们喜欢的任何
规律性必定总是可能的。以万有引力定律为例。我们可以下列方法设想出一些假说
性的概率估计来“解释”这个定律。我们选择某类事件作为基本事件或原子事件;
例如某一小粒子的运动。我们也选择某方面作为这些事件的主要性质;例如粒子运
动的方向和速度。于是我们假定这些事件显现出似机遇的分布。最后我们计算出所
有的粒子在某一有限的空间区域内,在某一有限的时期内——某一“宇宙期”——
将以规定的精确性(附带地说,以万有引力定律要求的方式)运动的概率。计算出
的概率当然将十分小;实际上小得微不足道,但是仍然不等于零。因此我们可以提
出这样的问题:这个序列的某个n-节段得有多长,或换言之,整个过程必须假定有
多长,我们才可期望这种宇宙期出现的概率接近1(或与1的离差不超过某一任意小
的值E),在这宇宙期内,作为偶发事件积累的结果,我们的观察将会完全与万有引
力定律一致。对于任我们选取的接近于1的任何值,我们获得一个确定的、虽然极端
大的有限数。于是我们可以说:如果我们假定序列的节段有这十分大的长度——或
换言之,“世界”延续得足够长——那么我们的随机性假定使我们能够期望出现一
个方有引力定律似乎也适用的宇宙期,虽然“实际上”除了随机发散外什么也没有
出现。借助某种随机性假定,这类“解释”可应用于我们选取的任何规律性。事实
上,我们可用这个方式把我们整个世界,以及它的所有被观察到的规律性,“解释”
成随机混沌中的一个阶段——纯粹偶然巧合的一种积累。
我认为很清楚,这类思辨是“形而上学的”,它们对科学没有任何意义。并且
同样清楚的是:这个事实同它们的不可证伪性——我们能在任何时候和任何条件容
许它们这个事实是有联系的。因此我的划界标准似乎同“形而上学的”一词的一般
用法是完全一致的。
所以涉及概率的理论,如果它们不加特定预防措施而加以应用,就不应被认为
是科学的。如果它们应在经验科学的实践中有用处,我们就必须排除它们的形而上
学用法。
68.物理学中的概率
可判定性困难的问题只是方法论的,不是物理学的。如果要求提出一个实践上
可应用的概率概念,物理学家也许会提供某种物理学的概率定义,其思路如下:有
些实验,即使在受控条件下进行也得出不同的结果。在某些这类实验——“似机遇
的”实验,例如用硬币做掷猜——的情况下,经常重复导致具有相对频率的结果,
进一步重复,这些相对频率越来越逼近某个固定值,我们可称之为所说事件的概率。
这个值是“……可用经验通过一长系列实验确定到任何逼近度”;顺便说,这说明
为什么证伪一个假说性的概率估计是可能的。
数学家和逻辑学家会对根据这些思路下的定义提出异议,尤其是下列异议:
(1)这个定义与概率计算并不一致,因为根据Bernoulli定理,只有几乎所有
非常长的节段才是统计学上稳定的,即其行为仿佛是收敛的。由于这个理由,概率
不能用这稳定性,即用拟收敛行为来定义。因为“几乎所有”一词——它应该出现
在定义中——本身只是“十分可几的”一个同义语。因此这定义是循环的;这个事
实容易通过去掉“几乎”一词隐避起来(但不能取消)。这就是物理学家的定义所
做的事;所以这是不能接受的。
(2)什么时候应说一系列实验是“长的”?不提供一个应称之为“长的”标准,
我们不能知道我们何时,或是否已达到逼近这个概率。
(3)我们如何能知道所需要的逼近实际上已达到?
虽然我认为这些异议是合理的,然而我认为我们能够保留物理学家的定义。我
将通过上节概述的论据来支持这种见解。这些论据表明当概率假说被允许无限应用
时,它们就失去所有信息内容。物理学家决不会以这种方式使用它们。我将遵循物
理学家的范例,不允许概率假说的无限应用:我建议我们作为方法论的决定决不把
物理效应,即可复制的规律性,解释为偶发事件的累积。这个决定自然修改了概率
概念:它使这个概念变窄了。因此异议(1)并不影响我的观点,因为我根本不主张
概率的物理概念和数学概念是同一的;反之,我否认这种同一性。但是代替(1),
出现了一个新的异议。
(1’)什么时候我们能谈到“累积的偶发事件”?大概在概率很小的情况下。
但是什么时候一个概率“小”?我们可以承认的是,我刚提出的建议排除了使用通
过改变数学问题的提法,从小概率中制造任意大概率的方法(前节已讨论)。但是
为了执行所建议的决定,我们得知道我们应把什么看作是小的。
下面几页将表明所建议的方法论规则与物理学家的定义是一致的,问题(1’)、
(2)和(3)提出的异议能借助它得到解答。开始,我脑子里只有一个典型的概率
计算应用例子:我脑子里有一些可复制的宏观效应例子,这些效应能够借助精确的
(宏观)定律——如气体压力——加以描述,并且我们把这些效应解释或说明为由
于微观过程,如分子碰撞大量积累所致。其他典型例子(如统计涨落或似机遇的个
别过程的统计)可没有很多困难地还原为这个例子。
让我以这种类型的宏观效应为例,该效应由一个得到很好确认的定律来描述,
这个定律可还原为微观事件的随机序列。设这个定律断言在某种条件下某物理量为
p值。我们假定效应是“精确的”,因此没有可测量的涨落发生,即与p的离差不超
过间距±o(不精确性的间距;参阅第37节),在此间距内我们的测量由于现行测量
技术固有的不精确性,无论如何会有涨落。现在我们提出假说:p是微观事件序列α
内的概率;其次,n个微观事件促使产生效应。于是(参阅第61节)我们能够对每一
个选取的δ值,计算出概率αnF(△P),即测定值将落在间距△P内的概率。补概
率可用“E“来表示。因此我们有αnF(△)=ε。根据Bernoulli定理,随n增加至
无限,ε趋向零。
我们假定ε“小”到可以不计(在这个假定中有“小”是什么意思的问题(1’),
马上就要讨论它)。显然,△p应解释为间距,测量在此间距内逼近p值。由此我们
看到三个量:ε,n,和△p与三个问题(1’),(2)和(3)相应。△p或ε可任
意选取,它限制了我们选取ε和n的任意性。由于我们的任务是演绎出确切的宏观效
应p(±φ),我们不去假定δ大于φ。就可复制效应p而言,如果我们进行的演绎
满足δ≤φ ,它就是令人满意的。(这里φ是给定的,由于它是由测量技术来确定
的。)现在让我们选取δ使它(近似地)等于φ。于是我们就将问题(3)还原为两
个其他问题(1’)和(2)。
通过选取δ(即△P)我们已在n和ε之间确立了一种关系,因为对于每一个n,
现在都有一个ε值惟一地与之相应。因此(2),即什么时候n有足够长这个问题已
还原为(1’),即什么时候ε小这个问题(反之亦然)。
但是这意味着只要我们能够判定ε的哪一个特定的值可被认为“小到微不足道”
而不计,所有三个问题都可得到回答。现在我们的方法论规则等于是决定忽略不计
小的ε值;但是我们不准备老是去讨论某个确定的ε值。
如果我们把问题交给物理学家,即如果我们问他,他准备不计什么样的ε——
0.001或是0.000001,或是……?他大概会回答E根本不使他感到兴趣;他选取的
不是ε而是n;他已这样选取n,使n与△P之间的相关大大独立于我们愿意造成的ε
值的任何变化。
由于Bernoulli分布的数学特点,物理学家的回答是有道理的:对每一个n,确
定ε和△p之间的函数关系是可能的。对这个函数作一检查就可表明,对于一切(
“大的”)n都存在一个表示特征的△p值,使得在这个值的邻域,完全不受ε的变
化的影响。这种无影响性随n的增加而增加。如果我们取我们在极端大数现象情况下
应该期望的一个数量级的n,那么在它的特征值的领域△p完全不受ε的变化的影响,
以致即使ε的数量级改变,△p也几乎根本没有变化。现在物理学家将把很小的值附
加于规定得更明确的△p界限上。并且在研究所限的典型的大数现象的情况下,我们
记得,能够使△p与精确度为±φ(取决于我们的测量技术)的间距相对应;并且这
个间距没有明确的界限,只有我在第37节所说的“缩聚界限”(condensation bou
nd)。所以当△p在它的特征值(我们能够确定这个值)的领域的无影响性至少有如
此之大,甚至ε数量级的改变引起的△p值仅在±φ的缩聚界限内涨落时,我们才称
n是大的。(如果n→∞,则△P变得完全不受影响)。但是如果是如此,我们就无需
再操心ε的精确测定:即使我们没有精确地说出必须把什么看作是“小的”,决定
置小的ε于不顾也就够了。这等于是决定利用上述不受ε的变化的影响的△p的特征
值。
必须把极度不可几性置于不顾的规则(只有根据上述才成为十分明确的一条规
则)与要求科学的客观性是一致的。因为对我们的规则的明显反对显然是,最大的
不可几性始终是一种概率,不管这种概率有多么小,因此甚至最不可几的过程——
即我们建议置之不顾的过程——终有一天会发生。但是这个反对意见可通过恢复可
复制的物理效应概念来予以解决,这个概念与客观性概念有密切联系(参阅第8节)。
我不否认不可几事件会发生的可能性。例如我并不断言在小量气体中的分子在一短
暂时间内不会自发地聚集成为这容量的一部分,或者在大量气体中压力的自发涨落
永远不会发生。我断言的是,这些偶发事件不是物理效应,因为根据它们的极度不
可几性,它们不能随意复制。即使一个物理学家碰巧观察到这种过程,他也完全不
可能去复制它,因此永远不能判定在这种情况下实际发生了什么,他是否有可能犯
了一次观察上的错误。然而,如果我们发现一些可复制的离差,这些离差不同于按
上述方式从概率估计中演绎出的宏观效应,那么我们必须假定概率估计已被证伪。
这些考虑可帮助我们理解Eddington的下述看法,他区别了两类物理定律:“某
些事情永远不会在物理世界中发生,因为它们是不可能的;另一些则因为它们也是
不可几的。禁止前者的定律是一级定律;禁止后者的是二级定律”。虽然这种表述
也许并不能摆脱批评(我宁愿不去对极度不可几的事情是否发生作出不可检验的断
言),但它与物理学家对概率论的应用完全一致。
可应用概率论的其他场合,如统计涨落,或似机遇个别事件的统计,可还原为
我们一直在讨论的场合,即可精确测定的宏观效应场合。我理解的统计涨落就是Br
own运动那样的现象。在这里测量精确度的间距(±o)小于对效应起促进作用的微
观事件数n特有的间距△p;因而可期望不同于p的可测定离差是高度不可几的。发生
这些离差这一事实是可检验的,因为涨落本身成为一种可复制效应;并且我以前的
论证可应用于这种效应:涨落超过某一大小(超过某个间距△p),根据我的方法论
要求,必定不是可复制的,朝同一方向涨落的长序列也是如此,如此等等。相应的
论证也会适用于似机遇个别事件的统计。
我现在总结我的关于可判定性问题的论证。
我们的问题:概率假说——我们已看到它们是不可证伪的——如何能在经验科
学中起自然律的作用?我们的回答是:概率陈述,就它们是不可证伪的而言,是形
而上学的和没有经验意义的;就利用它们作为经验陈述而言,利用它们作可证伪的
陈述。
但是这种回答提出了另一个问题:概率陈述——是不可证伪的——可用作可证
伪陈述,怎么可能呢?(它们能如此使用这个事实是毋庸置疑的:物理学家知道得
十分清楚,什么时候认为概率假定已被证伪。)我们发现这个问题有两个方面。一
方面,我们必须根据其逻辑形式使利用概率陈述的可能性成为可理解的,另一方面,
我们必须分析支配它们用作可证伪陈述的原则。
根据第66节,公认的基础陈述可以多少令人满意地与某种所提出的概率估计一
致;它们可更好或稍差一些代表概率序列的一个典型节段。这为某种方法论规则的
应用提供了机会,例如要求基础陈述和概率估计之间的一致应该符合某种最低限度
标准这一规则。因此规则可引出某种任意的思路,并且规定只有适当代表性的节段
(或适当“公平的样本”)才得以“允许”,而不典型的或没有代表性的节段是被
禁止的。
对这种意见作更仔细的分析向我们表明,什么被允许和什么被禁止之间的分界
线的划定并不一定像起初想象的那样任意。尤其是无需“宽容地”划定这条分界线。
因为有可能用这种方式形成这条规则,使什么被允许和什么被禁止之间的分界线,
正如其他定律的情况一样,由我们的测量能达到的精确度来决定。
我们根据划界标准提出的方法论规则,不禁止不典型节段的出现;它也不禁止
离差(当然,对于概率序列是不典型的)的重复出现。这条规则禁止的是系统离差
的出现可预测和可复制,例如朝特定方向的离差,或肯定是不典型的节段的出现。
因此它要求的不单是粗略的一致,而是对于可复制和可检验的一切,简言之,对于
所有的可复制效应可能是最佳的一致。
69.定律和机遇
人们有时听说,行星的运动服从严格的定律,而一粒骰子的掷下是碰运气,或
受机遇支配。我认为区别在于这个事实:迄今我们已能成功地预测行星的运动,但
还不能预测掷骰子的个别结果。
为了演绎出预见,人们需要定律和初始条件;如果没有合适的定律或不能确定
初始条件,科学的预见方法就垮台。掷骰子时我们所缺乏的显然是初始条件的充分
知识。有了初始条件的足够精确的测定,也就有可能在这种情况下作出预见;但是
选定正确掷骰子的规则(摇摇骰子盒)是为了防止我们测量初始条件。游戏规则以
及确定某一随机序列的各种事件必将发生的那些条件的其他规则,我称之为“框架
条件”。它们由这样一些要求组成,如骰子应该是“纯的”(由同质物质组成),
应该把它们好好地摇摇等等。
有一些其他情况,预见是不成功的。也许迄今还不可能提出合适的定律;也许
发现一个定律的所有尝试都已失败,并且所有的预见也被证伪。在这些情况下我们
可能对究竟是否会找到一个满意的定律已失望。(但是大概我们不会放弃尝试,除
非问题已使我们不大感兴趣——例如如果我们满足于频率预测,就是这种情况。)
然而,无论如何,我们不能定论地说,在某个特定的领域没有定律。(这是证实不
可能性的一个结果。)这就是说,我的观点使机遇概念成为主观的。当我们的知识
不足以作出预见时我就说“机遇”;正如掷骰子时,我们说“机遇”,因为我们对
初始条件没有知识。(可以设想,仪器设备精良的物理学家,能观测其他人预测不
到的一次掷骰子的结果。)
与这种主观观点相反,人们有时支持一种客观的观点。就这种观点利用事件本
身是指决定的还是不决定的这种形而上学观念而言,我将不在这里对这种观点作进
一步的考察(参阅第71和78节)。如果我们的预见获得成功,我们可以谈到“定律”;
否则我们对定律或不规则性的存在或不存在不可能有任何知识。
也许比这个形而上学观念更值得考虑的是下面的观点。可以说,当我们的概率
估计得到验证时,我们遇到客观意义上的“机遇”;正如当我们遇到因果规律性时
一样。
蕴涵在这观点中的机遇定义可能不全是无用的,但是应该有力强调,如此定义
的概念并不与定律概念相对立:正是由于这个理由我称概念序列是似机遇的。一般
地说,一个实验结果的序列是似机遇的,如果定义序列的框架条件不同于初始条件
的话;当在同一框架条件下进行的个别实验,在不同的初始条件下进行时,就会产
生不同的结果。其元素根本不可预测的似机遇序列是否存在,我不知道。我们甚至
不能从某个序列是似机遇的这个事实,推论出它的元素是不可预测的,还是或者推
论出它们“由于”在主观的知识不足意义上的“机遇”所致;我们尤其不能从这个
事实推论出定律不存在的“客观”事实。
不仅不可能从序列的似机遇性质中推论出任何与定律一致的东西,或者在另一
方面与个别事件一致的东西;甚至不可能从概率估计的验证推论出序列本身是完全
不规则的。因为我们知道似机遇序列是存在的,这些序列是根据数学规则建构的。
一个序列具有Bernoulli分布这个事实不是不存在定律的征候,与“根据定义”不存
在定律完全不是一回事。我们在概率预测成功中看到的不过是在序列结构中不存在
简单定律的征候(参阅第43和48节)——与构成序列的事件相反。不受后效约束的
假定相当于这样的假说:这种简单的定律是不可发现的,这个假定得到验证,但这
就是一切。
70.从微观定律推演宏观定律的可能性
有一种学说几乎已成为偏见,虽然它在最近已受到严厉的批评——所有可观察
的事件必须解释为宏观事件,即解释为一些微观事件的平均数或累计或总和的学说
(这个学说有点类似某些形式的唯物主义)。像其他这种学说一样,这似是某一方
法论规则的形而上学具体化,而这条规则本身是完全无可非议的。我指的是这条规
则:我们应该看看我们是否能用上述类型的解释性假说简化、概括或统一我们的理
论。在评论这些尝试的成功时,认为关于微观事件的非统计假说及其相互作用定律
就能足以说明宏观事件,这是个错误。除此以外,我们应该需要假说性的频率估计,
因为从统计前提中只能推导出统计结论。这些频率估计总是独立的假说,当我们从
事研究与微观事件有关的定律时,这些假说的确不时出现在我们脑中,但是它们决
不能从这些定律中推导出来。频率估计形成一类特殊的假说:一般地说,它们是与
规律性有关的禁律。Von Mises对这一点说得十分清楚:“没有统计学性质的补充假
定,在气体动力理论中甚至最微不足道的定理也不是单从经典物理学中推导出来的”。
统计学估计或频率陈述决不能从“决定论”性质的定律中推导出来,理由是为
了从这些定律中演绎出任何预见,需要初始条件。在初始条件那里,关于初始条件
统计学分布的假定——也就是说特定的统计学假定——进入了演绎过程,统计学定
律就是通过演绎从决定论性质或“精确”性质的微观假定中获得的。
理论物理学的频率假定在一定程度上是等机遇假说,这是一个令人惊异的事实,
但这无论如何并不是意味着它们是“自明的”,或先验地正确的。它们远非如此,
这一点从经典统计学、Bose-Einstein统计学和Fermi-Dirac统计学之间的广泛差
异中就可看到。这些表明特定的假定如何可与一个等机遇的假说结合起来,在每一
种情况下都导致参考序列的主要性质(假定其分布是均等的)的不同定义。
下面的例子也许可证明这个事实:甚至当我们想摆脱频率假定时,它们也是必
不可少的。
想象一个瀑布。我们可辨认某种奇特的规律性:组成瀑布的水流的大小是变化
的;不时地飞溅从主流中甩出来;然而在贯穿所有这些变化中,某种规律性明显可
见,它强烈提示有一种统计学效应。尽管有一些尚未解诀的液体动力学问题(与涡
流的形成有关等等),我们在原则上能够以任何所需程度的精确性,预测任何量水
——比方说一组分子——的路线,如果给定足够精确的初始条件的话。因此我们可
以假定,有可能预言远在瀑布之上的任何分子,在哪一点上它将越过边缘,到达底
部等等。这样原则上可计算出任何数量分子的路线;并且给定充分的初始条件,我
们就能在原则上演绎出瀑布的任何一种个别的统计学涨落。但是只能是这种或那种
个别的涨落的,而不是我们已描述过的反复发生的统计学规律性,一般统计学分布
就更不行了。为了说明这些,我们需要统计学估计——至少假定某些初始条件对于
许多不同组的粒子(等于一个全称陈述)将一次又一次地反复出现。我们获得一个
统计结果,当且仅当我们作出这些特定的统计学假定——例如关于反复出现的初始
条件频率分布的假定——时。
71.形式上单称的概率陈述
我称一个概率陈述为“形式上单称的”,当它把某一概率赋予某个单一偶发事
件或某类偶发事件的单个元素时;例如,“用这个骰子掷下一次得5的概率是1/6”
或“(用这个骰子)掷任何一次得5的概率是1/6”。从频率理论观点看,一般认为
这些陈述是不十分正确的表述,因为不能把概率归之于单个偶发事件,而只能归之
于偶发事件或事件有限序列。然而借助客观概率或相对频率概念用适当定义的形式
上单称的概率把这些陈述解释为正确的陈述是容易的。我用“Pαk(β)”表示这
形式上单称的概率:作为序列α的一个元素,某一偶发事件k有性质β——符号为k
εα——于是我定义形式上单称的概率如下;
Pαk(β)=αF(β)(kεα)(定义)这可用文字表达如下:事件k具
有性质β——设k为序列α的一个元素——的形式上单称的概率,根据定义等于性质
β在参考序列α内的概率。
这个简单的几乎一目了然的定义证明令人惊异地有用。它甚至可帮助我们澄清
现代量予理论的某些复杂问题(参阅第75-76节)。
正如定义所表明的,如果一个形式上单称的概率陈述没有明确说出一个参考类,
它就是不完全的。但是虽然α常常没有明确提及,在这些情况下我们往往知道α是
什么意思,因此上述第一个例子没有具体规定任何参考序列α,但是十分清楚它与
掷真的骰子的所有序列有关。
在许多情况下,对一个事件K可以有若干不同的参考序列。在这些情况下非常明
显,对同一事件可以作出不同的形式上单称的概率陈述。因此一个个别的人K将在一
定时期内死亡这种概率可根据我们认为他是他的年龄组的一员,还是他的职业组的
一员等等来假定十分不同的值。对于应该从若干可能的参考类中选定哪一个,不可
能制定一个一般规则。(最窄的参考类往往最合适,假如它多到足以使概率陈述立
足于合理的统计外推,并且得到足够量验证证据的支持的话。)
一旦我们认识到同一偶发事件或事件可以有不同的概率,作为不同参考类的一
个元素,不少所谓概率悖论就消失了。例如,有时有人说,一个事件的概率αPk
(β)在它出现以前不同于同一事件在它出现以后的概率:在以前它等于1/6,而
在以后可能只等于1或0。当然这个观点是完全错误的。αPk(β)在出现以前和以
后总是相同的。除了根据信息kεβ(或kε)——根据时偶发事件的观察提供给我
们的信息——我们可选取一个新的参考类,即β(或),然后向βPk(β)值是什
么以外,什么也没有变化。这个概率值当然是1;而Pk(β)=0。告诉给我们关于
单个偶发事件实际结局的陈述——不是关于某个频率,而是关于“kεφ”形式的陈
述——不能改变这些偶发事件的概率;然而,它们可提示我们选取另一个参考类。
形式上单称的概率陈述概念提供了一种通向主观理论,从而也就通向域(rang
e)理论的桥梁,正如下节将表明的那样。因为我们会同意把形式上全称的概率解释
为“理性信仰程度”(依照Keynes)——假如我们允许我们的“理性信仰”受某一
客观的频率陈述指导的话。因此这种陈述还是我们的信仰所依靠的信息。换言之,
也可能有这样的事:我们除了知道某个事件属于某一参考类,某个概率估计在其中
受到了成功的检验外,对它一无所知。这个信息并不能使我们预见这个事件的性质
将是什么;但是它能使我们表达借助某种形式上单称的概率陈述知道它的一切,这
种陈述看起来像关于所谈论的特定事件的不确定预见。
因此,我不反对关于单个事件概率陈述的主观解释,即解释为不确定的预见—
—可以说,承认我们对所谈论的特定事件缺乏知识(的确,关于这个事件什么结论
也不能从某个频率陈述中得出)。那就是说,我不反对概率陈述的主观解释,只要
我们明确承认客观频率陈述是基本的,因为只有它们是可用经验检验的。然而,我
反对把这些形式上单称的概率陈述——这些不确定预见——解释为关于客观事态的
陈述,但不反对解释为客观统计事态的陈述。我脑子里有这样一种观点:关于掷骰
子概率为1/6的一个陈述不仅是承认我们不知道任何确定的事情(主观理论),而
且是关于掷下一次的断言——断言它的结果客观上既是不确定的又是非决定的——
是关于某种仍悬而未决的事情的断言。我认为所有作出这种客观解释(除了别人外,
Jeans作过充分的讨论)的尝试都是错误的。不管这些解释可能造成一些什么样的非
决定论气氛,它们全都包含这样的形而上学思想:不仅我们能演绎出和检验预见,
并且除此之外自然界或多或少是“决定的”(或“非决定的”);因此预见的成败
不应用它们由之演绎出来的定律来解释,而是首先由这样一个事实来解释:自然界
实际上是(或不是)根据这些定律组成的。
72.域理论
我在第34节中说,一个可证伪程度比另一陈述更高的陈述可被描述为逻辑上更
不可几的陈述;而不那么可证协的陈述则是逻辑上更可几的陈述。逻辑上不那么可
几的陈述衍推出逻辑上更可几的陈述。在逻辑概率概念和客观的或形式上单称的数
值概率概念之间有密切关系。某些概率哲学家(Bolzano,von Kries,Waismann)
曾试图把概率计算立足于逻辑域,因此立足于一个与逻辑概率一致的概念(参阅第
37节);并且他们在这样做时,也试图弄清逻辑概率与数值概率之间的密切关系。
Waismann曾建议用与不同陈述相应的相对频率测定它们逻辑域之间的相互关系
程度(可以说它们的比值),从而把频率看作为决定一个测定域的系统的东西。我
认为在此基础上建立概率论是可行的。的确我们可以说,这个计划就是使相对频率
同某些“不确定的预见”相关起来——正如当我们定义形式上的单称概率陈述时在
前一节已经做的一样。
然而必须说,仅当一个频率理论已经建构时,这种定义概率的方法才是可行的。
否则人们就得问在定义测定系统时使用的频率本身又是如何定义的。然而,如果我
们手中已经有某个频率理论,那么引入域理论实际上就成为多余的。但是尽管有这
种异议,我认为Waismann建议的可行性是重要的。发现一个更全面的理论能够填补
解决这个问题的各种尝试之间,尤其是在主观和客观解释之间的鸿沟——起初似乎
是不可填补的。然而Waismann的建议要求作一点修改。他的域比值概念(参阅第48
节注)不仅要求域能借助它们的子类关系(或它们的衍推关系)加以比较;而且它
更一般地要求使甚至只是部分交迭的域(不可比较的陈述的域)也能够成为可以比
较的。然而这后一个假定有相当的困难,它是多余的。有可能表明,在有关的情况
下(为随机情况)子类的比较和频率的比较必定导致类似的结果。这证明为了测定
域而把频率与域相关起来的方法是对的。我们在这样做时,就使所谈论的陈述(按
子类方法是不可比较的)成为可以比较的。我将粗略地表明所描述的方法如何可得
到证明。
如果在两个性质类γ和β之间,子类关系γB成立,则:(K)〔Fsb(kεγ)
≥Fsb(kεβ)〕(参阅第33节)因此逻辑概率或陈述(kεγ)的域必须小于或等
于(kεβ)的域。它将是相等的,仅当有一个参考类α(它可以是全称类)时,对
于这个参考类下列规则成立,这个规则可以说具有“自然律”的形式:
(x){[xε(α.β)→(xεγ)]} α.β如果这种“自然律”不成立,因
此我们可假定在这个方面有随机性,那么不等性就成立。但是在这个情况下我们就
得到下式,假如α是可数的,并可承认为一个参考序列:αF(γ)<αF(β)这
就是说,在随意性情况下,域的比较必须导致同样的不等性,正如相对频率的比较
一样。因此,如果我们有随机性,我们就可把相对频率同域相关起来,以使域成为
可测量的。但是这正是我们在第71节中当我们定义形式上单称的概率陈述时所做的
(虽然是间接地)。的确,我们可以从这些假定中直接推论出αPk(γ)<αPk
(β)这样我们就回到了我们的出发点,概率解释问题。并且我们现在发现,客观
和主观理论之间的冲突,初看似乎是如此难办,可用某种一目了然的形式上单称的
概率的定义来完全消除。
第九章 对量子论的若干意见
我们对概率论的分析,已使我们掌握一些工具,我们现在可通过应用它们于现
代科学一个主要问题来检验它们;并且我将借它们之助试图分析和澄清现代量子论
若干更为模糊不清的论点。
我用哲学或逻辑方法解决物理学中心问题之一的有点大胆的尝试,必定会引起
物理学家的怀疑。我承认他的怀疑是正当的,他的怀疑是有充分根据的,然而我希
望我也许能够克服他们。同时,值得注意的是在每门科学分支中,成堆的问题主要
是逻辑的。量子物理学家一直渴望参与认识论讨论,这是事实。这提示他们本身感
到量子论中某些仍未解决的问题的解法不得不在逻辑与物理学之间的无人岛上寻找。
我将开始就预先记下将从我的分析中得出的主要结论。
(1)量子论中有一些数学公式被Heisenberg用他的测不准原理加以解释;即关
于由于我们在测量时达到的精确性的限制所致的测不准域的陈述。我将试图证明,
这些公式应解释为形式上单称的概率陈述(参阅第71节);这意味着它们本身必须
用统计学来加以解释。对这个公式作如此解释就是断言:在统计学上“分散”或
“方差”或“离散”的某些域之间有一定的关系(它们在这里被称为“统计学的离
散关系”)。
(2)我将要试图证明,比测不准原理允许的精确性程度更高的测量与量子论的
公式系统或及其统计学解释并不是不相容的。因此如果这样一种精确度终究成为可
能,量子论不一定被反驳。
(3)所以Heisenberg所断言的可达到的精确性极限的存在,并不是从理论公式
中演绎出来的逻辑推断,更确切地说,它是一个孤立的或附加的假定。
(4)此外,正如我将试图证明的那样,如果量子论的公式在统计学上得到解释,
那么Heisenberg的这个假定实际上与这些公式是矛盾的。因为不仅更精确的测量与
量子论相容,而且甚至有可能描述表明更确切的测定有可能的想象实验。在我看来,
正是这个矛盾引起了所有那些困难,现代量子物理学的令人赞叹的结构就受这些困
难困扰;以致Thirring谈到量子论时说,它“留下了一个难解的秘密给它的创始人,
这是他们自己承认的”。
下面所述也许可描述为对量子论基础的研究。在这个研究中,我将避免一切数
学论证和一切数学公式,除一个例外。这是可能的,因为我将不对量子论数学公式
系统的正确性提出疑问,我将只关心归功于Bohn的物理解释的逻辑推断。
至于“因果性”的争论,我提出不同于现在如此流行的非决定论形而上学的意
见。非决定论形而上学与直到最近才在物理学家中风行的决定论形而上学的区别,
与其说在于它非常清晰,不如说它极无成果。
在清晰性方面,我的批判常常是严厉的。所以不妨可以在这里说我认为现代量
子论创始人的成就是整个科学史上最伟大的成就之一。
73.Heisenberg的纲领和测不准关系
当然尝试在新的基础上建立原子理论时,Heisenberg从一个形而上学纲领开始:
摆脱“不可观察的东西”,即摆脱不能作实验观察的量值(magnitudes);人们可
以说是摆脱形而上学因素。这些不可观察的量值发生在先于Heisenberg的理论的Bo
hr理论中:可被实验观察的任何东西与电子的轨道,甚至与电子旋转的频率均不一
致(因为可被观察为光谱线的发射频率不可能就是电子旋转的频率)。Heisenberg
希望通过排除这些不可观察的量值,他能够克服Bohr理论的缺点。
这个情况与Einstein试图重新解释Lorentz-Fitzgerald假说时面临的情况有一
定的相似之处。这个假说试图利用像对Lorentz的不动的以太作相对运动这样不可观
察的量值,即无法用实验检验的量值,来解释Michelson和Morley实验的阴性结果。
不管是在这种情况还是在Bohr理论的情况下,需要改革的理论都说明了某些可观察
的自然过程;但是它们都用了令人不满意的假定:存在着一些物理事件和物理上可
定义的量值,而自然界使它们永远不能接受观察检验,从而成功地把它们隐藏起来
不让我们知道。
Einstein表明了如何能消除包含在Lorentz理论中的不可观察的事件。人们可能
会说,Heisenberg理论,至少它的数学内容也是如此。然而,似乎仍然有改进的余
地。即使从Heisenberg自己对他理论所作的解释的观点看,并不是说他的纲领已经
完全实现了。自然界仍然能够非常狡黠地把包含在理论中的某些量值隐藏起来不让
我们知道。
这种事态与Heisenberg所阐明的所谓测不准原理有联系。也许这个原理可解释
如下。一切物理测量都包含着被测量物体和测量仪器(它也可是观察者本身)之间
的能量交换。例如一束光线照射到物体上,物体反射的一部分色散的光可被测量仪
器吸收。任何这种能量交换将会改变物体的状态,物体在被测量以后将处于一种与
以前不同的状态之中。因此可以说,测量产生刚被测量过程本身破坏的那种状态的
知识。测量过程干扰被测量物体,在宏观物体情况下可以忽略不计,但在原子物体
的情况下则不行;因为这些物体可受到例如光辐射十分强烈的影响。因此不可能在
一个原子已被测量后直接从测量结果中推论出它的状态。所以测量不能作为预测的
基础。大家承认,借助新的测量总有可能在前次测量以后确定物体的状态,但是系
统却因而又以不可预测的方式受到干扰。并且大家承认,总有可能以这样的方式安
排我们的实验,使要测量的状态的某些特征——例如粒子的动量——不受扰动。但
是,这只有以更严重地干扰要测量的状态的某些示性量值(在这种情况下是粒子的
位置)为代价,才有可能做到这一点。如果两个量值以这种方式相关,那么下列定
理就适用于它们;它们不可能同时精确加以测量,尽管每一个都可如此分别加以测
量。因此如果我们增加两个测量之一的精确性——比方说动量Px,从而缩小△Px误
差的域或间距——那么我们就必然会降低位置座标x测量的精确性,即扩大△x的间
距。这样,根据Heisenberg的意见,可达到的最大的精确性是受测不准关系限制的。
△x.△Px≥h/4π同样的关系也适用于其它坐标。这个公式告诉我们,两个误差域的
积至少是h个数量级,h是Planck的作用量子。从这个公式得出的结论是:这两个量
值之一的完全精确的测量将不得不以另一个的完全不确定性为代价。
根据Heisenberg的测不准关系,对位置的任何测量干扰了相应的动量部分。因
此原则上不可能预测一个粒子的轨迹。“在新的力学中,‘轨迹’概念没有任何确
定的意义……”
但是在这里出现了另一个困难。测不准关系只应用于属于已进行测量后的粒子
的(表示物理状态特性的)量值。一个电子的位置和动量直到测量那瞬间以前原则
上能够以无限的精确性加以确定。这是这一事实的必然结果,即毕竟有可能前后相
继地进行若干次测量操作。因此,通过把(a)位置的两次测量结果,(b)先作动
量测量的位置测量结果,以及(c)后作动量测量的位置测量结果结合起来,就可借
助所得数据计算出两次测量之间整个时期内精确的位置和动量坐标。(开始我们可
把我们的考虑限于这个时期。)但是根据Heisenberg的意见,这些精确的计算对于
预测是无用的:所以也就不可能去检验它们。之所以如此,是因为这种计算对于两
次实验之间的轨迹是有效的,仅当第二次实验是第一次的直接后继者,即在它们之
间没有干扰发生时。为检查两次实验之间轨迹而安排任何检验必然会干扰得如此厉
害,以致使我们对确切轨迹的计算变得无效。Heisenberg谈到这些精确计算时说:
“……人们是否应把任何物理实在赋予计算出的电子的过去历史,这是一个纯粹的
趣味问题。”显然他通过这句话要想说的是,这些不可检验的轨迹计算,从物理学
家的观点看没有任何意义。Schlick对Heisenberg这段话评论如下:“我要表示我自
己与Bohr和Heisenberg两人的基本观点是完全一致的,我认为他们这些观点是无可
争辩的。如果有关在原子范围内一个电子的位置的陈述是不可能证实的,那么我们
不可能把任何意义赋予它;谈论在两点(在这两点观察到了某一粒子)之间该粒子
的轨迹是不可能的”。(在March)Weyl和其他人那里可找到类似的评论。
然而正如我们刚才听到过的那样,用新的形式体系计算这样一种“无意义的”
或形而上学的轨迹是可能的。并且这表明Heisenberg不能把他的纲领贯彻到底。因
为这种事态只允许有两种解释。第一种解释是,粒子有一个确切的位置和确切的动
量(因此也有确切的轨迹),但是我们不可能同时测量它们二者。如果是如此,那
么自然界仍然倾向于隐藏某些物理量值不让我们的眼睛看见;隐藏的实际上既不是
粒子的位置,也不是它的动量,而是这两个量值的组合,“位置加动量”或“轨迹”。
这种解释认为测不准原理是我们知识的一种限制;因此它是主观的,另一可能的解
释是客观的解释,它断言把某种界限截然分明的“位置加动量”或“轨迹”赋予粒
子是不允许的或不正确的,或是形而上学的:它根本没有“轨迹”,只有结合着不
确切动量的确切位置,或结合着不确切位置的确切动量。但是如果我们接受这种解
释,那么理论的形式体系又包含形而上学的因素:因为正如我们已看过的那样,在
用观察检验粒子原则上是不可能的那些时间内,粒子的“轨迹”或“位置加动量”
是可精确计算的。
测不准关系的支持者如何在主观看法和客观看法之间摇摆,是看得很清楚的。
例如,正如我们已看到的,Schlick在支持客观观点之后立刻写道:“关于自然事件
本身,说什么、‘模糊性’或‘不准确性’,是不可能有什么意义的。这类词只能
用于我们自己的思想(尤其是如果我们不知道哪些陈述……是真的)”:这种评论
显然反对的正是那个客观解释,这种解释认为不是我们的知识,而是粒子的动量,
可以说由于使它的位置得到精确测量而被弄得“模糊”。其他许多作者也显示了类
似的动摇。但是不管人们决定支持客观观点还是主观观点,事实仍然是: Heisenb
erg的纲领并没有得到贯彻,他在他给自己布置的把一切形而上学因素驱逐出原子论
的任务中并未取得成功。所以,Heisenberg试图把两个对立的解释融合在一起并没
有获得任何成就,他说“……在这个意义上的‘客观’物理学,即把世界截然划分
为客体和主体实际上已不再是可能的了。”Heisenberg迄今尚未完成他给自己布置
的任务:他尚未清除掉量子论中的形而上学因素。
74.量子论的统计学解释概要
Heisenberg在推导测不准关系时仿效Bohr,利用了这样一个思想:原子过程可
以用“量子论的粒子图象”表示,也可以用“量子论的波图象”表示,二者表示得
一样好。
这个思想是与现代量子论沿着两条不同的道路进展这个事实是有联系的。Heis
enberg从经典的电子粒子理论开始,他按照量子论重新解释了这个理论:而Schrad
inger则从(同样经典的)de-Broglie的波理论出发:他把“波包”(Wave-packe
t)、即一组振荡(通过干扰这个振荡在一个小范围内互相增强,在此小范围外则彼
此抑制)同每一个电子协调起来。Schrodinger后来表明,他的波动力学导致数学上
与Heisenherg的粒子力学等价的结果。
粒子图象和波图象这两种根本不同的图象却是等价的,这种佯谬先由Born对这
两种理论的统计学解释解决的。他证明波理论也可被看作为粒子理论;因为Schrod
inger的波方程式能作这样的解释:它提供给我们在一定空间范围内发现粒子的概率。
(概率是由波幅平方决定的;在波包内波互相增强,概率就大,在波包外波就消失。)
量子论应作统计学解释是由不同的问题境况方面提示的。自从Einstein提出光
子(或光量子)以来,量子论的最重要的任务--原子光谱的演绎——不得不被认
为是一种统计学的工作。因为这个假说把观察到的光效应解释为大数现象,解释为
由于许多光子射入所致。“原子物理学的实验方法……在经验指导下,已成为惟独
与统计学问题有关。为观察到的规律性提供系统理论的量子力学在每一方面都与实
验物理学的现状相一致;因为它从一开始就把自己限于统计学问题和统计学解答。
只是把它应用于原子物理学问题时,量子论才获得不同于古典物理学的结果。
在把它应用于宏观过程时,它的公式产生十分近似古典力学的结果。March说:“根
据量子论,如果把古典力学定律看作为统计学平均数之间关系的陈述,那么它们就
是有效的”。换言之,古典的公式可演绎为宏观定律。
在某些著作中试图用这事实来说明量子论的统计学解释,即测量物理量值时所
能达到的精确性,受Heisenberg测不准关系的限制。有人论证说,由于在任何原子
实验中测量的这种测不准性,“……结果一般不是确定的,即如果实验在相同条件
下重复若干次,可获得若干不同的结果。如果实验重复的次数很大,就会发现每一
个特定的结果都是在总次数中确定的几次获得的,因此人们可以说,在从事实验的
任何时候结果的获得有一个确定的概率”。(Dirac)March也就测不准关系写道:
“在过去和将来之间……只有概率关系;由此可清楚看出,新力学的性质必定是统
计学理论的性质。”
我认为对测不准公式和量子论的统计学解释之间的关系的这种分析是不能接受
的。在我看来逻辑关系正好相反。因为我们能从Schrodinger的波方程式(它是应作
统计学解释的)中推导出测不准公式,但不能从测不准公式推导出前者。如果我们
对这些可推导性关系给予足够的重视,那么测不准公式的解释就得修改。
75.用统计学对测不准公式作重新解释
自从Heisenberg以来,以超出他的测不准关系所允许的精确性同时测量位置和
动量是与量子论矛盾的这一事实已被承认为确定的事实。人们认为,“禁止”精确
测量,能够从量子论或波动力学中合乎逻辑地推导出来。根据这个观点,如果进行
的实验能够得到的测量结果具有“被禁止的精确性”,就不得不认为这个理论被证
伪。
我认为这个观点是错误的。大家承认,Heisenberg公式(△x·△Px≥h/4π)
等等)确实是从这个理论引出的逻辑结论;但是按照Heisenberg的意思把这些公式
解释为限制可达到的测量精确性的规则则不是从这个理论得出的必然结论。所以比
按照Heisenberg所允许的更为精确的测量逻辑上不可能与量子论或波动力学发生矛
盾。因此我要在公式(“Heisenberg公式”的简称)与把它们解释——也由Heisen
berg提出的——为测不准关系(即对可达到的测量精确性加以限制的陈述)之间加
以明确的区分。
当人们在从事Heisenberg公式的数学推演时,不得不使用波方程式或某个等价
的假定,即能作统计学解释的假定(正如我们在前节看到的那样)。但是如果这个
解释得到采纳,那么用波包描述单个粒子无疑不过是一个形式上单称的概率陈述
(参阅第71节)。我们已知,波幅决定在一定地点发现这粒子的概率;并且正是这
种概率陈述——涉及单个粒子(或事件)的这种陈述——我已称之为“形式上单称
的”。如果人们接受量子论的统计学解释,那么人们就必然要把例如Heisenberg公
式那样一些陈述(它们能从这个理论的形式上单称的概率陈述中推导出来)反过来
解释为概率陈述,并且如果它们应用于单个粒子的话,又要解释为形式上单称的。
所以它们也必然最终解释为统计学断言。
与“我们对粒子位置的测量越精确,我们对它的动量所能知道的越少”这种主
观解释相反,我建议,应该把对测不准关系的客观解释和统计学解释作为基本的解
释来接受;可表述如下。给定一个粒子的聚合体(在物理分离的意义上),选择一
些粒子,它们在一定瞬间,以一定程度的精确性,具有一定的位置x,我们就会发现,
它们的动量Px将展示出随机离散(random scattering);并且因而离散的域△Px越
大,我们得到的△x,即允许位置所具有的离散范围或不精确性越小,反之亦然;如
果我们选择或分离出那些粒子,它们的动量Px全落在预定的范围△Px内,那么我们
将发现,它们的位置在某一范围△x内随机离散,△x越大,则我们得到的△Px即允
许动量所具有的离散范围或不精确性就越小。最后如果我们试图选择那些粒子既有
性质△x又有△Px,那么我们就能在物理学上进行这种选择——即在物理学上分离析
这些粒子——仅当这两个域都足够大以满足方程式△x·△Px≥h/4π时,对Heisen
berg公式的这种客观解释把这些公式看作为断言在某些离散域之间有某种关系;如
果它们用这种方式解释,我将称它们为“统计学离散关系。”
在我的统计学解释中,我迄今尚未提及测量;我仅提及物理选择。现在有必要
澄清这两种概念之间的关系。
我谈到物理选择或物理离析,就是指例如我们从粒子流中筛去除了通过狭孔△
x,即通过粒子的位置在△x域的一切粒子。并且在谈到属于如此被分离出的那粒子
束的粒子时,我要说它们已根据它们的性质△x,被物理上或技术上选择了出来。惟
有这种过程或它的结果,物理上或技术上被分离的粒子束,我才把它们描述为“物
理选择”——与只是“精神的”或“想象的”选择加以区别,当我谈到已通过或将
通过△p域的一切其他粒子类,即谈到一个更广泛的粒子类(它已经在物理上从这一
更广泛的粒子类中被筛出)内的一个类时,我们就是作的物理选择。
现在一切物理选择当然可被看作是一种测量,并且实际上也可这样使用。如果
比方说,一束粒子通过筛去或排除一切没有通过某一位置域(“地点选择”)的那
些粒子而被选择出来,那么我们认为这地点选择就是位置测量,因为我们由此知道
粒子已经通过一定的位置(虽然它什么时候在那里,我们有时也许不知道,或只能
从其他测量中知道)。另一方面,我们必不可把一切测量都看作为一种物理选择。
例如一股飞向x的单色电子束。我们用一架Geiger计数器就能记录那些到达一定位置
的电子。通过对计数器的作用之间的时间间隔,我们也可以测量空间间隔;也就是
说,我们测量它们在作用那瞬间以前在x方向上的位置。但是在从事这些测量时,我
们并未根据它们在x方向上的位置对粒子进行物理选择。(实际上这些测量一般得到
的是在x方向上位置的完全随机的分布)。
因此我们的统计学离散关系在其物理应用中得出了如下这一点。如果人们不管
用什么手段试图获得一个尽可能均匀的粒子聚合体,那么这个尝试在离散关系上将
碰到确定无疑的障碍。例如我们可以通过物理选择获得一个平面的单色射线——比
方说等动量的电子束。但是如果我们尝试使这个电子聚合体更为均匀——也许通过
排除其一部分--以便获得不仅具有同样动量,而且已经通过了确定位置域△x的某
个狭缝的电子,那么我们就必然失败。我们之失败是因为根据粒子的位置所作的任
何选择就是对系统的干扰,这种干扰将使动量成分Px的离散增加,因而使离散随缝
的变窄而增加(与Heisenberg公式表示的定律相一致)。反之:如果我们有一束射
线,使其通过一个缝,根据位置加以选择,如果我们试图使之成为“平行的”(或
“平面的”)和单色的,那么我们就一定要破坏这种根据位置所作的选择,因为我
们不能避免增加射线的宽度。(在理想情况下,——例如如果粒子的Px成分全都变
成等于0——宽度就一定会成为无限的。)如果选择的均一性尽可能地增加(即尽H
eisenberg公式所允许的,以致在这些公式中相等的符号成为有效),那么这种选择
可称为纯例(a pure exam-ple)。
我们用这种术语就可表述统计学离散关系如下:没有一种粒子聚合体比纯例更
均一。
到现在还没有加以充分考虑的是,从量子论基本方程式的解释中推导出Heisen
berg公式的解释恰恰必须同从这些基本方程式中用数学推导出的Heisenberg公式一
致。例如March已描述了正好相反的情况(前节已表明):在他的论述中,量子论的
统计学解释呈现为Heisenberg对可达到的精密度所加限制的结果。另一方面,Weyl
从波方程式——他用统计学术语解释的方程式——严格地推导出Heisenberg公式。
然而他把Heisenberg公式——他刚从用统计学解释的前提中推导出这些公式——解
释为对可达到的精密度的限制。并且他这样做不顾如下的事实:他注意到对公式的
这种解释在某些方面同Born的统计学解释是背道而驰的。因为按照Weyl的意见,鉴
于测不准关系,Born的解释应加以“校正”。“当一个粒子的位置和速度在每一个
单个情况下被测定时,正好服从统计学规律,情况不仅如此。更确切地说,这些概
念的意义本身取决于确定它们所需的测量;并且位置的精确测量剥夺了我们确定速
度的可能性。”
Weyl感觉到的Born的量子论统计学解释和Heisenberg对可达到的精密度的限制
之间的矛盾的确存在着;但是这个矛盾比Weyl认为的更尖锐。不仅从用统计学解释
的波方程式推导出对可达到的精密度的限制是不可能的,而且可能的实验和实际的
实验结果都与Heisenberg的解释不一致,这个事实能够被认为是支持量子论统计学
解释的一个决定性论据,一种判决性实验。
76.通过倒转Heisenberg纲领排除形而上学因素的尝试及其应用
如果我们从量子论特有的公式是概率假说并且因而是统计学陈述的假定开始。
那么难以理解如何能从这种性质的统计学理论中演绎出禁止单个事件(也许除了概
率等于1或等于0的情况下)。认为单个测量能同量子物理学的公式发生矛盾,在逻
辑上似乎是站不住脚的;正如认为总有一天在一个形式上单称的概率陈述αPk=
(β)=p(比方说“掷k为5的概率为1/6”)与下列两个陈述:kεβ(“这次掷
实际上得5”)或(“这次掷实际上没有得5”)之一之间可发现矛盾一样站不住脚。
这些简单的考虑提供给我们反驳任何这些证明的手段,据说,这些证明是设计
出来表明位置和动量的精确测量与量子论是矛盾的;或许设计出来表明单单假定任
何这类测量在物理上是可能的,就必定导致理论内部的矛盾。因为任何这类证明必
须利用应用于单个粒子的量子论考虑;这意味着它不得不利用形式上单称的概率陈
述,而且意味着必定有可能把证明——可以说逐字地——翻译为统计学语言。如果
我们这样做,那么我们就发现在认为是精密的单个测量与作统计学解释的量子论之
间没有矛盾。在这些精密的测量和理论的某些形式上单称的概率陈述之间只有表面
上的矛盾。
但是,虽然说量子论排除精确的实验是错误的,然而说从量子论特有的公式—
—如对它们作统计学解释——中不可能推导出精确的单个预测仍是正确的。(我不
把能量守恒定律或动量守恒定律列在量子论特有的公式中。)
之所以如此是因为鉴于离散关系,我们必然不能用实验操纵系统(即用我们所
说的物理选择)产生精确的初始条件。实验者的正常技术是要产生或建构初始条件,
这是对的;并且这使从统计学离散关系中推导出这样一个定理——然而只适用于这
种“建构性的”实验技术——:我们不可能从量子论中获得任何单个预测,只能获
得频率预测。
这个定理概括了我对Heisenberg(他在这里主要是遵循Bohr)讨论的所有那些
想象实验的态度,目的是证明不可能作出他的测不准原理禁止的精确的测量。这一
论点在所有情况下都是一样的:统计学离散使之不可能预测在测量操作后粒子的轨
迹将会是什么。
很可能我们对测不准原理的重新解释所得到的并不很多。因为即使Heisenberg
大体上也不过断言我们的预测服从这个原理(正如我已试图证明的那样);并且由
于在这个问题上我每一点都同意他,也许会认为我争论的只是字眼,不是实质问题。
但是这很难说是对我的论证的公正评价。实际上我认为Heisenberg的观点和我的是
正好对立的。这在下节将充分加以说明。同时我将尝试解决Heisenberg解释中固有
的典型困难;并且我将努力弄清这些困难如何和为什么发生。
首先我们必须考察如我们已看到的那样,使Heisenberg纲领遭到失败的那个困
难。这就在那个形式体系中,出现位置加动量的精密陈述的困难;或换言之对轨迹
(参阅第73节)作精确计算的困难,对这轨迹的物理实在性Heisenberg是必然要怀
疑的,而其他人例如Schlick则干脆否认它。但是实验(a),(b)和(c)——参
阅第73节——都能用统计学术语来解释。例如,组合(c),即测量位置后紧跟着测
量动量,可以如下的实验实现。我们借助有一狭缝的光阑(diaphragm)根据位置选
择一束射线(位置测量)。然后找们测量正从狭缝按一定方向传播的那些粒子的动
量。(这第二次测量当然会使位置产生新的离散)。这两次实验加在一起将精密地
测定所有那些属于第二次选择的粒子的轨迹,只要这个轨迹在两次测量之间:两次
测量之间位置和动量都能精密计算。
与诸要素精确一致的这些测量和计算,在Heisenberg的解释中被认为是多余的,
而按照我对这个理论的解释则根本不是多余的。大家承认,它们不起初始条件或预
测推导的基础的作用;但是它们是必不可少的:它们是检验我们的预测所必需的,
我们的预测是统计预测。因为我们的统计离散关系所断言的是,当位置更为精确地
测定时动量必定离散,反之亦然。这是一种不是可以检验、可以证伪的预测,如果
我们不能借助于已描述的那类实验来测量和计算,那么在根据位置所作的任何选择
后就会马上出现各种离散的动量。
所以用统计学解释的理论,不仅不排除精确的单个测量的可能性,并且如果这
些测量不可能,这个理论便是不可检验的,因而是“形而上学的”。因此,Heisen
berg纲领的实现形而上学因素的清除在这里完成了,但用的是一种与他十分对立的
方法。因为当他试图排除他认为不允许的量值(尽管不完全成功)时,我都把这种
尝试倒过来,办法是证明正因为这些量值不是形而上学的,包含这些量值的形式体
系是正确的。一旦我们放弃了Heisenberg对可达到的精密度所加的限制中包含的教
条,就不再有任何理由,为什么我们应该怀疑这些量值的物理意义。离散关系是关
于轨迹的频率预测;所以这些轨迹必定是可测量的——正好与比方说掷个5必定可用
经验确定一样——如果我们能检验我们关于这些轨迹或这些掷猜的频率预测的话。
Heisenberg之摈弃轨迹概念,及其谈论“不可观察的量值”,清楚地表明哲学
思想的影响,尤其是实证主义思想的影响。March在同样影响下写道:“人们也许可
以不怕误解地说……对于一个物理学家来说,一个物体仅在他观察它的时刻才有实
在性。自然,没有人如此疯狂以致断言一个物体在我们背对着它时不再存在;但是
它在那时不再是物理学家研究的对象,因为没有可能根据实验对它说些什么了。”
换言之,当一个物体不在被观察时它以这种或那种轨迹运动这个假说是不可证实的。
这当然是明显的,但是无聊的。然而重要的是这个或类似的假说是可证伪的:根据
它沿一定轨迹运动的假说,我们能够预测物体将在这个或那个位置上可观察到;这
是一个可被反驳的预测。量子论并不排除这类程序将在下节看到。但是事实上我们
在这里说的已经很充分了;因为它解决了与轨迹概念“无意义性”有联系的一切困
难。如果我们记得从轨迹概念所谓的失败中引出的极端结论,就可以更好地认识到
这对澄清气氛有多么大的帮助。Schlick表述这些结论如下:“也许描述所考察情况
的最简练方法是说(正如最杰出的量子问题研究者所做的那样),平常时空概念的
有效性仅限于宏观上可观察的范围,不能把它们应用于原子的尺度。”这里Schlic
k可能在暗示Bohr,后者写道:“所以人们可假定,在与量子论的一般问题有关的地
方,不只是一个力学和电动力学理论的改变,一个用普通物理学概念可以描述的改
变,而是我们时空图象的根深蒂固的失弃,直到现在还用这些时空图象来描述自然
现象。”Heisenberg采纳了Bohr的思想,即放弃时空描述作为他的研究纲领的基础。
他的成就似乎表明这个放弃是富有成效的。但是事实上,这个纲领从来没有贯彻过。
鉴于我们的分析,时空概念频繁的、不可避免的,即使是偷偷摸摸的使用,现在似
乎可证明是正当的。因为这已表明统计离散关系是关于位置加动量离散的陈述,所
以是关于轨迹的陈述。
由于我们已经证明测不准关系是形式上单称的概率陈述,我们也能理清对测不
准关系的客观解释和主观解释纠缠在一起的乱丝。我们在第71节中知道,一切形式
上单称的概率陈述都能主观地解释为不确定的预测,关于我们知识不确定性的陈述。
我们也已看到,在哪些假定下,客观地解释这种陈述的合理的和必要的尝试必定会
失败。如果人们试图通过把不确定性直接赋于单个事件,用单个的客观解释来代替
统计的客观解释,就必定要失败然而如果人们在主观的意义上(直接)解释Heisen
berg公式,那么物理学作为一门客观科学的地位就受到了损害;因为为了前后一致,
人们不得不主观地解释Schrodinger的概率波。这个结论是由Jeans作出的,他说:
“简言之,粒子图象告诉我们,我们对一个电子的知识是不确定的;波图象则告诉
我们电子本身是不确定的,不管是否对它作了实验。然而测不准原理的内容在这两
种情况下必定是完全一样的。只有一种办法使之如此:我们必须设想,波图象提供
给我们的不是客观自然界的描述,而只是我们关于自然界知识的描述……”因此对
于Jeans来说,Schrodinger的波是主观概率波,关于我们知识的波。并且随着这一
点整个主观主义概率论就侵入了物理学领域。我已摈弃的论据——利用Bernoulli定
理作为从无知到统计学知识的桥梁以及类似的论据(参阅第62节)——就成为不可
避免的了。Jeans表述现代物理学的主观主义态度如下:“Heisenberg通过放弃主要
的谜——客观宇宙的性质——抨击物理宇宙之谜不可解,而集中于协调我们对这个
宇宙的观察这个次要疑点上。因此最后出现的波图象应该证明仅与通过我们的观察
获得的我们关于宇宙的知识有关,就不奇怪了。”
这些结论无疑非常容易为实证主义者接受。然而我自己的有关客观性的观点犹
未涉及。量子论的统计陈述必须像任何其他物理学陈述一样是可以在主体间检验的。
并且我的简单分析不仅坚持了时空描述的可能性,也保持了物理学的客观性。
有趣的是对Schrodinger波的这种主观解释有一个对于非统计学的,因而是直接
的(即单个的客观描述)。Schrodinger本人在他的著名的Collected Papers on
Waue-Mchanics中曾对他的波方程式(正如我们已经看到的它是形式上单称的概率
陈述)提出了某种这样的解释。他试图把粒子直接同波包本身等同起来。但是他的
尝试直接导致这类解释:我指的是把测不准归之于物理客体本身(客观化的测不准
性)所特具的那些困难。Schrodinger不得不假定,电子电荷在空间(以及由波幅决
定的电荷密度)被“模糊或涂污”;这个假定结果证明与电的原子结构是不相容的。
Born的统计学解释解决了这个问题;但是统计学解释与非统计学解释之间的逻辑关
系仍是模糊不清的。结果其他形式上单称的概率陈述——例如测不准关系——的独
特性质仍得不到承认,这些陈述继续破坏理论的物质基础。
也许我们可以把本节所说的应用于Einstein所提出的并被Jeans称为“新量子论
最困难的部分之一”的想象实验作为结语;虽然我认为我们的解释使这个实验极为
清晰,即使没有使它通俗些”。
设想一面半透明的镜子即反映部分光线并让光线一部分通过的镜子。某一光子
(或光量子)穿过镜子的形式上单称的概率陈述αPk(β),可被看作等于它被反
射的概率;因此得: αPk(β)=αPk()=1/2我们知道,这种概率估计被客
观统计概率定义;也就是说,这种概率估计与下列假说是等价的:某类光量子α的
一半穿过镜子,而另一半被反射出来。现设一个光子k射在镜子上,并且接着用实验
确定它已被反射出来;那么这概率似乎可以说是突然地和不连续地发生变化。似乎
在实验前它们都等于1/2,而在反射的事实已知以后,它们突然地分别变为0和接近
1。显然这个例子实际上与第71节中列举的是一样的。如果这个实验被Heisenberg用
下列术语描述,对澄清情况鲜有帮助:“实验(即我们用以发现反射光子的测量)
从一半波包反射出来的地方对另一半波包正好碰巧在的另一地方——距离由我们选
取——起着一种物理作用”;他对这种描述补充说:“这种作用是以超过光速传播
的”。这毫无裨益,因为我们原来的概率αPk(β)和αPk()仍然等于1/2。已发
生的一切是选取一个新的参考类——β或,不是α——实验结果,即信息k∈β 或
k∈分别强烈地提示我们的一种选取。谈到这种选取的逻辑结果(或者这个信息的逻
辑结果)时说:“以超光速传播”,其助益几乎等于说二乘二以超光速等于四一样。
Heisenberg的进一步的评论大意是物理作用的这种传播不可能用来传递信号,这种
评论虽然是正确的,但对情况并无改善。
这个想象实验的命运说明迫切需要区分和定义统计学的和形式上单称的概率概
念。它也表明量子论的引起的解释问题只有用对概率陈述解释的逻辑分析才能解决。
77.判决性实验
我现在已经完成了第73节前面的导言中概述的我的纲领的前两部分。我已证明
(1)Heisenberg公式可用统计学加以解释,所以(2)把它们解释为对可达到的精
密度的限制并非从量子论中合乎逻辑地得出的结论,因此不可能仅因我们测量时达
到更高的精密度就反驳了量子论。
“现在为止,一切顺利”,有人也许反驳说:“我不否认也许有可能这样看量
子力学。但是我仍然不认为你的论证甚至触动了Heisenberg理论真正物理核心:作
出精确的单个预测的不可能性。”
如果要求用一个物理学的例子来详述他的论点,我的对手也许会这样说:“设
想有一束电子,像阴极射线管中的一束电子那样。设这电子束的方向指向x。我们可
以从这电子束中获得各种物理选择。例如,我们可以根据它们在x方向上的位置(即
根据它们在某一时刻的x坐标)选择或分离出一组电子;这也许用一个在很短时间内
打开的闸板来做到这一点。这样我们就应该获得一组电子,这些电子在x方向上的广
延非常小。按照离散关系,这组不同电子的动量在x方向上也是十分不同的(因此它
们的能量也如此)。你说得很对,我们可以检验这些关于离散的陈述。我们用测量
单个电子的动量或能量就能做到这一点;并且由于我们知道位置,因此我们将既得
到位置,又得到动量。可以进行这类测量,例如使电子撞击一块金属片,激发金属
片的原子:于是我们就将发现某些被激发的原子,它们受激发要求的能量超过了这
些电子的平均能量。因此我承认在你强调这些测量既是可能的又是重要的时,你是
完全正确的。但是——现在我的反对意见来了——在进行任何这种测量时,我们必
定扰动了我们正在考察的系统,或是单个电子,或是整个电子束,如果我们测定得
多的话(如在我们的例子中)。大家承认,如果我们知道扰动前该组不同电子的动
量,这个理论在逻辑上不会被反驳(当然只要它并不使我们能够利用我们的知识来
影响一个被禁止的选择)。但是没有办法获得任何有关单个电子的知识而不去扰动
它们。结论是精密的单个预测是不可能的,这仍然是对的。”
对于这个反对意见,我应该首先答复说,如果它是正确的,那也并不奇怪。精
确的单个预测块不能从统计学理论中推导出来,能推导出来的只是“不确定的”
(即形式上单称的)单个预测,这毕竟是很明显的。但是我眼下断言的是,虽然这
个理论并不提供任何这类预测,但它也并不排除它们。仅当可以断言对系统的扰动
或干扰必定妨碍一切种类的预测测量时,人们才能说单称预测的不可能性。
“但是那正是我断言的”,我的对手会说。“我恰恰断言任何这类测量的不可
能性。你假定有可能来测量这些运动着的电子之一的能量而并不会迫使它离开它的
轨迹和电子群。这个假定我认为是站不住脚的。因为假定我拥有能够进行这类测量
的任何仪器,那么我用这某种类似的仪器就能产生一些电子聚合体,这些电子(a)
就它们的位置而言,它们全是有限的,而(b)全有同样的动量。这些聚合体的存在
会反驳量子论,这当然也是你的观点,因其存在是被你称之为‘离散关系’所排除
的。因此你只能回答说,有可能设想一种仪器,它使我们能够进行测量,但不是作
出选择。我承认这个回答在逻辑上是可允许的;但是作为一个物理学家我只能说,
我的本能反对这种想法:我们能够测定电子的动量,而不能消除其动量超过(或不
足于)一定量的所有那些电子。”
我对这一点的第一个回答是,这一切听起来似乎十分令人信服。但是如果一种
预测测量是可能的,相应的物理选择或分离也会是可能的,这种主张并未得到严格
的证明(我们马上会看到不可能得到这种证明)。这些论据都不能证明精密的预测
与量子论是矛盾的。这些论据都引入了一个补充假说。因为(按照Heisenberg的观
点)精确的单个预测是不可能的这个陈述,结果证明与预测测量和物理选择有不可
分割的连系这个假说是等价的。我的意见确实必定同这个新的理论系统——量子论
与这个辅助的“连系假说”的合取——是冲突的。
这样我的纲领的第(3)点也就落实了。但是第(4)点仍需证明:即我们仍需
证明把用统计学解释的量子论(我们假定包括动量和能量守恒定律)同“连系假说”
结合起来的系统是自相矛盾的。我认为有一个根深蒂固的成见:预测测量和物理选
择总是连系的。这个成见的流行说明为什么证明对立看法的简单论据从来没有提出
来过。
我要强调指出,迄今介绍的主要是物理学的考虑并未形成我对测不准关系逻辑
分析的一部分假定或前提,虽然可以说这些考虑是分析的成果。实际上,迄今进行
的分析与后面的考虑是完全无关的,尤其与下面描述的想象实验无关,这个实验意
图证明对单个粒子轨迹作出任意精密的预测是有可能的。
我将借助于这个想象实验首先讨论一些简单的例子。这些例子意图表明我们能
够毫无困难地作出任意精密的轨迹预测,并且检验它们。我暂时只考虑不涉及确定
的单个粒子的预测,只涉及在一确定的小的时空区(△x.△y.△z.△t)内的
(一切粒子)。在每一种情况下,只有粒子存在于这区内的概率是确定的。
我们再设想一束(一个电子或光束)粒子朝x方向传播。但是这次我假定它是单
色的,因此,所有粒子以已知的同样动量沿着朝x方向的平行轨迹传播。于是朝其他
方向的动量也将是已知的,即已知等于零。现在我们不借助物理选择测定一群粒子
在x方向上的位置——即不用技术手段把这群粒子同这束其余粒子分离开(我们在上
面已这样做过)——我们将只满足于仅用集中注意于这群粒子把它同其余的区分开。
例如,我们可集中注意于所有那些粒子,这些粒子(以一定的精密度)在一定时刻
有地点坐标x,所以并未越出任意小的域△x。我们精确地知道这些粒子中每一个的
动量。所以我们精确地知道在每一个未来时刻这群粒子将在哪里。(显然仅仅存在
这样一群粒子并不与量子论发生矛盾;只是它的孤立的存在,即在物理上选择它的
可能性,才与这理论有矛盾。)我们能够进行同样性质的与其他空间坐标有联系的
想象选择。经物理选择的单色束在y和z方向上一定非常宽(在一个理想的单色束情
况下无限宽),因为在这些方向,动量应该是精确选择的,即应该等于0;因此在这
些方向上位置必定是伸展得很宽的。虽然如此,我们再可以集中注意于一条十分狭
窄的部分射线。我们将又一次不仅知道每条射线每一个粒子的位置,而且知道它们
的动量。因此我们将能够预测这条狭窄射线(可以说我们是在想象中选择它的)的
每一个粒子它将在哪一点上用多少动量,撞击在一块挡着它轨迹的摄影底片上,当
然我们能用经验(用前面的实验)检验这一点。
类似从一种特定类型的“纯例”中进行选择一样,想象选择也能从其他类型的
聚合物中进行。例如,我们取一单色束,借助非常小的缝△y,从中进行物理选择
(因此把仅根据前面例子的想象选择进行的物理选择作为我们的物理起点)。我们
不知道哪些粒子在通过缝以后将转向哪一个方向;但是如果我们考虑某个确定的方
向,我们就能精确计算出所有转向这特定方向的粒子的动量分量。因此,通过缝后
朝某个确定方向传播的那些粒子又形成一个想象选择。我们也能预测它们的位置和
它们的动量,或简言之它们的轨迹;并且把一张摄影底片放在它们的轨迹上我们又
能检验我们的预测。
这个情况原则上与我们考虑过的第一个例子的情况,即根据它们在传播方向上
的位置选择粒子一样(即使经验检验有点更加困难)。如果我们根据这个情况作出
物理选择,那么由于动量距的增加不同的粒子将以不同的速度传播。因此这群粒子
随着它的前进在x方向上将伸展一个日趋增大的域(波包将变得更宽)。于是我们可
算出这些粒子(想象中选择的)群部分的动量,这些粒子在一定时刻将在x方向上的
一定位置上:动量越大,选择的那部分群越靠前面(反之亦然)。用这个方法作出
的预测的经验检验可用一个活动的带状电影片代替摄影底片来进行。由于我们对带
上的每一点能够知道它接触电子冲击的时间,我们也能够对带上每一点预测冲击会
以多少动量发生。我们可以检验这些预测,例如在活动带前面,或者也许在Geiger
计数器前面插进一个滤光器(如光线则是滤光器;如电子则对射线方向形成直角的
电场),接着根据方向进行选择,只允许那些具有某一最小动量的粒子通过。于是
我们可以确定这些粒子在预测的时间实际上是否到达。
与这些检验有关的测量的精密度不受测不准关系的限制。我们已看到测不准关
系本意主要应用于那些用作推演预测而不是用作检验预测的那些测量。那就是说它
们本意应用于“预测性测量”,而又是“非预测性测量”。在第73和76节中我考察
了这种“非预测性”测量的三种情况,即(a)两次位置测量,(b)测量动量后测
量位置或(c)测量位置后测量动量。上面讨论的借助放在电影片前面的滤光器或G
eiger计数器前面的测量就是(b)的实例,即根据动量选择后测定位置。这大概恰
好是按照Heisenberg(参阅第73节)所说的允许“计算电子的过去”那种情况。因
为虽然在(a)和(c)时只有计算两次测量之间的时间才是可能的,在(b)时则有
可能计算第一次测量以前的轨迹,假如这种测量是根据一定动量进行选择的话。我
们知道,Heisenberg对这种测量的“物理实在性”提出了疑问,因为它使我们仅能
根据粒子到达某个精确测定的位置和精确测定的时间计算它的动量:这种测定似乎
缺乏预测内容,因为不能从它推导出任何可检验的结论。然而我将把我的想象实验
(意图证明有可能精确预测一个确定的粒子的位置和动量)立足于这个特定的测量
安排上,这种安排乍看起来显然是非预测性的。
由于我就要从这类精密的“非预测性”测量是可能的这个假定推导出这些具有
深远意义的结果,讨论这个假定的可允许性似是适宜的。
下面我用想象实验直接向Bohr和Heisenberg的论证方法挑战,他们曾用这种方
法证明把Heisenberg公式解释为对可达到的精密度的限制是正确的。因为他们试图
通过证明不可能设计任何想象实验来产生更精确的预测性测量来证明这种解释。但
是这种论证方法显然不能排除这种可能性,即终有一天可设计出一种想象实验,
(利用已知的物理效应和定律)证明这些测量毕竟是可能的。任何这类实验与量子
论的形式体系发生矛盾已被认为理所当然,并且似乎这种思想决定了探索这些实验
的方向。然而我的分析——落实我的纲领(1)和(2)点——显然已经扫清了设计
一种想象实验的道路,这种实验完全符合量子论,证明所说的精密测量是可能的。
为了落实这个实验,我将如前一样利用“想象选择”;但我将选定这样一种安
排,使得如果用这种选择表征的一个粒子实际存在着,我们就将能够确定这个事实。
我的实验在某种程走上形成一种Compton-Simon和Bothe-Geiger实验的理想化。由
于我们希望获得单个预测,我们不能仅使用统计学假定。必须使用能量和动量守恒
的非统计学定律。我们可以利用这一事实:这些定律使我们能够计算出当粒子相撞
时发生了什么,假如我们已知描述碰撞的四个量值(即碰撞前的动量a1和b1,和碰
撞后的动量a2和b2)以及第三个量值的一个分量。(这种计算方法已知为Compton效
应理论的一部分。)
现在让我们设想下列的实验安排(见图3):我们使两条粒子束交叉(其中一条
至多是一条光线,而一条至多是电荷非中性),这两条粒子束在下列意义上都是纯
例,即A束是单色的,即根据动量a1作的选择,而B束通过狭缝SL,从而接受根据位
置作的物理选择。可设B粒子具有(绝对)动量b1。这两束的一些粒子相撞。我们现
在设想两条窄的部分射线[A」和[B」,他们在P处相交。[A」的动量是已知的;
它是a1。部分射线(B)的动量是可计算出来的,只要我们已经判明它某个确定的方
向;设它为b1。现在我们选定方向PX。注意到碰撞后在PX方向传播的部分射线(A)
的粒子,我们就能计算出它们的动量a2以及b2,即在它们与之碰撞的那些粒子碰撞
后的动量。与以动量a2在P沿X方向偏转的[A]的每一个粒子相应必定有「B」的第
二个粒子在P以动量b2沿可计算的方向PY偏转。我们现在置一仪器于X上——例如一
架Geiger计数器或一卷活动的电影片——以记录粒子从P到达任意限制的区域X的冲
击力。于是我们可以说:由于我们注意到关于一个粒子的这种记录,我们同时知道
第二个粒子必定以动量b2从P向Y传播。并且我们根据纪录也知道这第二个粒子在一
定时刻在什么地方;因为我们从第一个粒子冲击X的时间及从它的已知的速度,可计
算出它在P点碰撞的动量。通过在Y处使用另一架Geiger计数器(或活动电影片),
我们能够检验我们对第二个粒子的预测。
这些预测的精密度以及用来检验它们的测量的精密度,就位置坐标和在PY方向
动量的分量来说,原则上不受测不准原理所致的任何限制。因为我的想象实验把对
在P偏转的B粒子作出预测的精密度问题归结为在X测量时可达到的精密度问题。首先
这些测量似是相应的第一个粒子「A」的时间、位置和动量的非预测性测量。这个粒
子在PX方向的动量,以及它冲击X,即它在PS方向上位置的时间可以任何所需的精密
度测量,如果我们在测量位置前设置一个电场或滤器在Geiger计数器前面进行动量
选择的话。但是由于这样做的缘故,我们就能够以任何精密度作出关于在PY方向传
播的B粒子的预测。
这种想象实验使我们有可能不仅看到能够作出精确的单个预测,而且看到在什
么条件下能够出这种预测,或更确切地说,在什么条件下它们与量子论可以相容。
仅当我们能够获得关于粒子状态(不能任意创造这种状态)的知识时,就能作出这
些预测。因此可以说我们实际上是在事件之后获得我们的知识的,因为在我们获得
知识时,粒子已经采取了它的运动状态。然而我们仍然能够利用这种知识从中演绎
出可检验的预测。(例如如果所说的B粒子是,光子,我们能计算出它达到天狼星的
时间。)到达X的粒子的冲击将在不规则的时间间隔内接连发生;这就是说,我们对
之作出预测的部分射线B的粒子也将在不规则的时间间隔后接连发生。如果我们能通
过例如使这些时间间隔成为均等来改变事情的这种状态,它就与量子论发生矛盾。
因此可以说,我们能够瞄准和预先测定子弹的力量;我们也能(在子弹打中靶Y以前)
计算出在P开枪的确切时间。然而我们不能自由选定开枪时刻,而不得不等待开枪。
我们也不能防止(从P的领域)射向我们的靶的不受控制的射击。
很清楚,我们的实验和Heisenberg的解释是不相容的。但是由于进行这种实验
的可能性可从量子物理学的统计学解释(加上能量和动量定律)中演绎出来,看来
与这个实验矛盾的Heisenberg解释也必然同量子论的统计学解释发生矛盾。鉴于Co
mpton-Simon和Bothe-Geiger实验,看来进行我们的实验是可能的。可以把它看作
为在Heisenberg的概念和量子论的前后一致的统计学解释之间判决的一种判决性实
验。
78.非决定论的形而上学
自然科学家的任务是探索使他能够演绎出预测的定律。这个任务可分为两部分。
一方面,他必须努力发现将使他能够演绎出单个预测的那些定律(“因果性”或
“决定论”定律或“精确陈述”)。另一方面他必须努力提出关于概率的假说,即
断言概率的定律,以演绎出频率预测。在这两项任务中没有任何东西使它们互不相
容。显然情况并不是这样:只要我们作出精确陈述,我们就不会作出频率假说;因
为我们已经看见,某些精确陈述是可以从频率假定中推导出来的宏观定律。情况也
不是那样;只要在某一特定的领域内,频率陈述得到充分的确证,我们就要作出结
论说,在这个领域内不可能作出精确陈述。这种情况是十分明显的。然而我们刚摈
弃的两个结论中的第二个却一再得出。我们也一再遇到这样的信仰:在运气占支配
地位的地方就排除规律性。我已在第69节批判地检查了这种信仰。
从科学发展的现状来判断,宏观和微观定律的二元论——我的意思是指我们都
利用这两种定律这一事实——是不容易克服的。然而,逻辑上有可能的是把一切已
知的精确陈述——通过把它们解释为宏观定律——还原为频率陈述。逆向还原是不
可能的。我们在第70节已经看到,决不能从精确陈述中演绎出频率陈述。频率陈述
需要自己的假定,这些假定必须是统计学的。概率只能从概率估计中计算出来。
逻辑境况就是如此,它既不支持决定论观点,也不支持非决定论观点。并且如
果物理学只用频率陈述工作终于成为可能,那么我们仍然不应该作出非决定论的结
论;那就是说我们仍然不应该断言“自然界没有精确的定律,没有由之可演绎出关
于单个或基本过程进程的预测的定律”。科学家决不让有什么东西阻止他探索定律,
包括这类定律。不管我们可以多么有成效地运用概率估计,我们也不可作出探索精
确定律是白费的结论。
这些考虑无论如何不是第77节描述的想象实验的结局;完全相反。让我们假定
测不准关系没有被这个实验反驳(不管什么理由):即使那时测不准关系也只能作
为频率陈述受到检验,并且只能作为频率陈述得到验证。因此无论如何我们不应从
它们得到充分验证这个事实引出非决定论结论。
世界是否受严格的定律支配?我认为这是一个形而上学问题。我们发现的定律
总是假说;这就是说它们总是可以代替的,它们有可能从概率估计中演绎出来。然
而否认因果性同样是试图说服理论家放弃他的探索;并且这样一种尝试不可能得到
刚刚已经说明的证明的支持。所谓:“因果性原理”或“因果律”,虽然可以表述,
但性质上与自然律迥然有别;并且我不能同意Schlick,他说:“……可以在与任何
其它自然律完全一样的意义上检验因果律的真理性。”
对因果律的信仰是形而上学的。这不过是一条得到充分证明的方法论规则的一
种典型的形而上学实体化,这条规则是科学家决不放弃他探索定律的决心。因此对
因果性的形而上学信仰在其各种表现中比Heisenberg支持的那种非决定论形而上学
更富成效。确实我们能够看到Heisenberg的评论对研究有一种摧残作用。如果继续
重复说,探索任何这类联系是“无意义的”,就可能很容易忽视去寻找并不很远的
联系。
Heisenberg的公式——正如只能用它们的统计学推断验证的类似陈述一样——
不一定导致非决定论结论。但是这本身并不证明不可能有证明这些或类似结论的其
他经验陈述:例如这样的结论,上述方法论规则——决不放弃探索定律的决心——
不可能实现它的目的,也许因为探索定律和单个预测是无成效的,或无意义的,或
“不可能的”。但是具有能迫使我们放弃探索定律的经验陈述是不可能的。因为一
个被认为是摆脱了形而上学因素的陈述可能有非决定论结论,仅当这些陈述是可证
伪时。但是可以证明它们是假的,仅当我们能提出定律,并且从这些定律演绎出得
到验证的预测时。因此,如果我们认为这些非决定论结论是经验假说,我们就应该
严格地检验它们,即证伪它们。并且这就意味着我们应该探索定律和预测。因此我
们不可能听从放弃这种探索的劝告,而不否认这些假说的经验性质。这表明认为有
可能存在会迫使我们放弃探索定律的任何经验假说是自相矛盾的。
这里我不想详细证明:多次尝试确立非决定论如何揭示了一种只能在形而上学
意义上描述为决定论的思维方式(例如Heisenberg试图对因果解释为什么不可能提
供一种因果解释)。我恰恰要提醒读者注意企图证明测不准关系关闭了若干可能的
研究途径的尝试,正如光速不变原理所做的那样:两个常数c和h,即光速和普朗克
常数之间的类似,通过说它们二者都在原则上对研究的可能性施加了限制,而得到
了解释。在试图摸索越出这些障碍时提出的问题由于把令人讨厌的问题作为“假问
题”而取消的众所周知的方法取消了。在我看来,在c和h两个常数之间确实存在着
类似之处;顺便说一句,这种类似是保证常数h同常数c一样不是研究的障碍。光速
不变(以及超过光速不可能性)原理并不禁止我们去探索大于光速的速度;因为它
只是断言我们将不会发现什么;也就是说,我们将不能产生比光传播得更快的信号。
同理Heisenberg公式不应该被解释为禁止探索“超纯”例:因为它们只是断言我们
将不会找到什么;尤其是我们不能产生什么。禁止速度大于光速和“超纯”例的定
律,像其他经验陈述一样,鞭策研究人员去探索被禁止的东西。因为他只能通过试
图证伪它们来检验经验陈述。
从历史观点看,非决定论物理学的出现是很可理解的。长期以来,物理学家信
仰决定论物理学。因为逻辑境况没有得到充分的理解,从原子的力学模型中演绎出
光谱--它们是统计学效应——的种种尝试的失败必定产生决定论的危机。今天我
们看得很清楚,这种失败是不可避免的,因为从一个非统计学的(力学的)原子模
型中演绎出统计学定律是不可能的。但是在那时(1924年左右Bohr,Kramers和Sla
ter理论提出时)似乎在每一个单个原子的机制中概率代替了严格的定律。决定论的
大厦倒坍了——主要是由于概率陈述被表达为形式上单称的陈述。在决定论的废墟
上,非决定论起来了,得到了Heisen-berg测不准原理的支持。但是我们现在看到,
它的崛起同样是由于误解了形式上单称的概率陈述的意义。
这一切的教训是我们应该努力去发现能够与经验冲突而垮台的严格定律——禁
律。然而我们应该避免对研究的可能性施加限制的禁律。
第十章 验证或理论如何经受住检验
理论是不能证实的,但是它们可被“验证”。
常常尝试把理论描述为既非真的又非假的,而是或多或少可几的。尤其是归纳
逻辑已发展为一种不仅把“真”和“假”两个值,而且把不同程度的概率赋于不同
的陈述;这类逻辑在这里将称为“概率逻辑”。按照那些相信概率逻辑的人看来,
归纳应该确定一个陈述的概率程度。并且归纳原理应该,或者使归纳出来的陈述是
“可能正确的”这一点成为确实可靠的,或者使这一点成为可几的——因为归纳原
理本身只是“可能正确的”。然而我认为整个假说概率问题是被误解了的。我们不
应去讨论一个假说的“概率”,而是应该努力去评价它通过经受住检验在多大程度
上能够证明它适宜生存。简言之,我们应该努力评价它在多大程度上得到“验证”。
79.关于假说的所谓证实
理论是不能证实的这一事实常常被忽视。人们常常谈到一个理论时说,当从它
推导出的某些预测被证实时它就被证实了。他们也许会承认从逻辑观点看,证实是
不完全没有缺点的,或者承认通过确定某一陈述的某些推断决不能最终确定这个陈
述。但是他们易于把这些异议看作是由于某种不必要的顾虑所致。他们说,我们不
能确定地知道太阳明天是否会升起,这是很对的,并且甚至是平凡浅显的,但是这
种不确定性可以不予考虑:理论不仅可改进,而且能被新的实验证伪这个事实给科
学家提供了一个在任何时候都可成为现实的重大可能性;但是从来还没有认为一个
理论由于一个得到充分确证的定律突然垮台而必须被证伪。决不会发生老的实验有
一天产生新的结果这种事。发生的只是新的实验判定反对旧的理论。旧的理论,即
使当它被取代时,也常常保持它的正确性作为新理论的一种极限情况;它仍然至少
以高度的近似应用于那些以前它在其中富有成效的情况。简而言之,可用实验直接
检验的规律性没有改变。大家承认,它们会改变这是可以设想的,或者在逻辑上是
可能的;但是这种可能性为经验科学所忽视,并且不影响它的方法。相反,科学方
法以“自然过程不变性”或“自然界均一性原理”为前提。
对于上述论证有一些话要说,但它不影响我的论点。它表示对我们世界存在规
律性的形而上学信念(我也有这种信念,并且没有这种信念实践行动是不可设想的)。
然而,在我们面前的问题——则是在完全不同的侧面上。与我对其他形而上学问题
的态度相一致,我避免去支持或反对对我们世界存在规律性的信念。但是我将努力
证明理论的不可证实性在方法论上是重要的。正是在这个侧面我反对刚才提出的论
据。
所以我将认为只是这个论据中一个论点是有关的——提到所谓“自然界均一性
原理”。我认为这个原理以十分浅显的方式表达了一个重要的方法论规则,这个规
则正是从理论的不可证实性的考虑中有效地推导出来的。
让我们设太阳明天将不升起(并且虽然如此我们将继续生活着,并从事着我们
感兴趣的科学工作)。如果发生这样的事情,科学就不得不努力解释它,即认定律
中把它推导出来。大概要求对现存的理论作重大修改。但是修改的理论不仅应解释
新事态,我们旧有的经验也应可以从修改的理论中推导出来。从方法论观点看,人
们看到自然界均一性原理在这里被既要考虑到空间又要考虑到时间的自然界不变性
的公设取代了。所以,我认为断言自然规律性不变是错误的。(这是一种既不能反
对又不能赞成的陈述。)更确切地说,如果我们假设它们不随空间和时间而变化,
并且假设它们没有例外,这种陈述是我们自然律定义的一部分。因此从方法论观点
看,证伪一个得到验证的定律无论如何不是没有意义的。它帮助我们发现,我们对
自然律的要求和期望什么。并且“自然界均一性原理”也可被认为是对某个方法论
规则——如与它十分接近的“因果律”的一种形而上学解释。
人们尝试用方法原理代替这种形而上学陈述,这导致“归纳原理”,这个归纳
原理被认为是支配归纳方法的,从而支配证实理论的方法。但是这个尝试失败了,
因为归纳原理本身在性质上是形而上学的。正如我在第1节已指出的,归纳原理是经
验的这一假定导致无穷的后退。因此只能作为原始命题(或公设,或公理)引入。
如果归纳原理并非在任何情况下都得被看作不可证伪的的陈述,这也许没有什么关
系。因为如果这个原理——它应证明理论的推论正确——本身是可证伪的,那么它
就会随第一个被证伪的理论而证伪,因为这个理论在那时是一个借助归纳原理推导
出的结论;而这个原理作为一个前提,只要从这前提推导出的一个理论被证伪,当
然就将被否定后件的推理(modus tollens)所证伪。但是这意味着一个可证伪的归
纳原理将随着科学的进展而一再被证伪。所以就必须引入一个假定不可证伪的归纳
原理。但是这等于是对一个先验地正确的综合陈述,即关于实在的一个不可反驳的
陈述理解错误的观念。
因此如果我们试图把我们对自然界均一性和理论可证实性的形而上学信念转变
为基于归纳逻辑的知识理论,留给我们的只是在无穷后退和先验论之间进行选择。
80.假说的概率和事件的概率:概率逻辑批判
即使承认理论决不能最后被证实,我们是否能够确保它们在或大或小的程度上
是可靠的——更可几的或不那么可几?毕竟也许有可能把一个假说的概率问题还原
为比方说事件的概率问题,因而使之容易接受数学和逻辑的处理。
像一般的归纳逻辑一样,假说概率理论似乎是由于把心理学问题和逻辑问题混
为一谈而产生的。大家承认,我们对确信的主观感觉具有不同的强度,并且我们等
待某一预测的实现和某个假说的进一步确认的信心程度,很可能取决于(除了其他
以外)这个假说迄今业已经受住检验的方式——取决于它过去的验证。但是这些心
理学问题并不属于认识论或方法论这一点甚至得到概率逻辑信仰者的充分承认。然
而他们争辩说,根据归纳主义者的决定,把概率程度归于假说本身是可能的;并且
进一步争辩说把这个概念还原为事件概率概念是可能的。
一个假说的概率主要被认为只是关于陈述概率的一般问题的特例;而后者本身
又被认为不过是用特定术语表达的一个事件的概率问题。因此例如我们在Reichenb
ach那里读到:“不管我们把概率归于陈述还是归于事件只是一个术语问题。迄今我
们认为分配给一粒骰子某一面朝上的概率为1/6是事件概率的一种情况。但是我完
全可以说正是‘点1将朝上’这个陈述被分配到1/6的概率。”
如果我们想起第23节所说过的,就可以更好地理解事件概率和陈述概率的这种
等同。在那里“事件”概念被定义为一类单称陈述。所以说用陈述概率代替事件概
率也必定是可允许的。因此我们能够认为这仅是一个术语的改变:参考序列被解释
为陈述序列。如果我们想到陈述所代表的一种“二择一”,或更确切地说它的元素,
那么我们就能用“k是正面”这个陈述来描述正面朝上,并且用这个陈述的否定来描
述它不朝上。这样我们就获得一个这种形式的陈述序列Pi,Pk,PI,Pm,Pn,……,
其中Pi有时表征为真,有时(上面加一划)为“假”。因此能够把在一个二择一内
的概率解释为陈述序列内陈述的相对“真频率”(而不是某种性质的相对频率)。
如果我们愿意,我们可以称经过如此改造的概率概念为“陈述概率”或“命题
概率”。并且我们能够证明在这个概念和“真理”概念之间有十分密切的联系。因
为如果陈述序列变得越来越短,最后只包含一个元素,即只有一个单个的陈述,那
么根据这单个陈述是真还是假,序列的概率或真频率只可能有1和0两个值中一个值。
因此可把一个陈述的真或假看作是概率的特例;反之,就概率把真理概念作为一个
极限情况包括在内而言,可把概率看作为真理概念的一般化。最后有可能以这种方
式定义真频率运算,即经典逻辑常用的真值运算是真频率运算的极限情况。这些运
算的计算可称为“概率逻辑”。
但是我们实际上能否把假说概率与以这种方式定义的陈述概率,因而间接地与
事件概率等同起来呢?我认为这种等同是混淆的结果。这个思想是,某一假说的频
率,由于它显然是一种陈述概率,必须在刚才定义的意义上的“陈述概率”的名目
下。但是这个结论证明是没有根据的;并且因此这个术语是很不合适的。也许终究
最好不要用“陈述概率”这个词,如果我们心里指的是事件概率的话。
不管这可能怎样,我断言假说概率概念引起的问题甚至未被基于概率逻辑的考
虑触及。我断言如果人们谈到一个假说时说,它不是真的,但是“可几的”,那么
这个陈述无论如何不能译为关于事件概率的陈述。
因为如果人们试图把假说概率观念还原为使用陈述序列概念的真频率观念,那
么他马上面临这个问题:根据哪些陈述序列,能够把一个频率值赋予一个假说?Re
ichenbach把一个“自然科学的断言”——他用它指一个科学假说——本身与一个陈
述参考序列等同起来。他说,“……自然科学的断言决不是单称陈述,事实上是陈
述序列,严格地说我们必须把一个较小的概率值,而不是概率度1赋予这些陈述。所
以惟有概率逻辑才提供能够严格代表适合于自然科学知识概念的逻辑形式。”现在
让我们把假说本身是陈述序列的意见追根究底。解释它的一个方法是取可能与假说
矛盾或一致的种种单称陈述作为这样一个序列的元素。于是这个假说的概率决定于
与它一致的那些陈述的真值频率。但是如果平均起来该假说被这个序列的每隔一个
的单称陈述所反驳,那么这个假说的概率为1/2 !为了避免这个毁灭性的结论,我
们再试试两个权宜之计。一个是根据对它通过的所有检验与尚未尝试的所有检验的
比值的估计把一定的概率——也许不很精确——赋予这个假说。但是这种办法也没
有什么结果。因为这种估计碰巧能够精确计算,并且结果总是概率等于零。最后,
我们可以努力使我们的估计立足于导致有利结果的那些检验与导致中性结果——即
不产生清楚决定的结果——的那些检验的比值上(用这种方法人们确实可以获得某
种类似主观信心感的量度,实验者就是用这种信心看他的结果的)。即使我们不顾
这个事实:我们由于这种估计已经离开真值频率概念和事件概率概念很远了,这最
后一种权宜之计也不行(这些概念基于真陈述与假陈述的比值,并且我们当然必须
把中性陈述同客观上假的陈述等同起来)。为什么这最后的尝试也不行的理由是所
建议的定义使一个假说的概念成为不可救药地主观:一个假说的概率不是依靠客观
上可复制的和可检验的结果,而是依靠实验者的训练和技能。
但是我认为接受可把某个假说看作是陈述序列这种意见是完全不可能的。如果
全称陈述有这样的形式:“对一切k值,在k处某某事发生,这是真的”,这是可能
的。如果全称陈述有这种形式,那么我们就可把基础陈述(与全称陈述矛盾或一致
的陈述)看作陈述序列——被视为全称陈述的序列——的元素。但是我们已经看到
(参阅第15和28节),全称陈述并不具这种形式。基础陈述决不是仅仅从全称陈述
中推导出来的。所以全称陈述不能被认为是基础陈述序列。然而,如果我们试图考
虑是从全称陈述推导出来的基础陈述的否定的序列,那么对每一个自相一致的假说
的估计将导致相同的概率,即1。因为我们必须考虑能被推导出的未被证伪的否定的
基础陈述(或其他可推导陈述)与已被证伪的那些陈述的比值。这就是说,我们不
考虑真频率,而应考虑假频率的补值。这个值无论如何等于1。因为可推导的陈述类,
甚至可推导的基础陈述否定类,都是无限的;另一方面,已接受的起征伪作用的基
础陈述数目是有限的,不可能比它更多。因此即使我们不顾全称陈述决不是陈述序
列这个事实,并且即使我们试图把它们解释为这类东西,把它们与完全可判定的单
称陈述序列相关起来,即使如此我们也达不到一个可接受的结果。
然而我们得考察用陈述序列解释假说概率的另一个十分不同的可能性。也许还
记得我们已称某一单称事件是“可几的”(在“形式上单称概率陈述”的意义上),
如果它是以一定概率发生的事件序列的一个元素的话。但是这个尝试也失败了——
完全不是确定参考序列的困难(它可用许多方法选定;参阅第71节)。因为我们不
能说假说序列内的真频率,只是因为我们决不能知道一个假说是否是真的。如果我
们能够知道这一点,那么我们就根本不需要假说概率概念。现在我们如上述那样,
试图取假说序列内假频率的补数作为我们的出发点。但是如果比方说我们借助未证
伪与已证伪的假说序列的比值来定义一个假说的频率,那么如前所说,每一个无穷
参考序列内每一个假说的概率等于0。并且即使选定一个有穷的参考系列,我们也未
处于更好的地位。因为让我们假定我们能把与这种程序相应的在0与1之间的概率程
度——比方说值3/4——赋予某个(有穷的)假说序列的诸元素。(如果我们获得
信息,说某个假说属于已被证伪的序列,就能作到这一点。)就这些已被证伪的假
说是序列元素而言,我们正由于这个信息就得把3/4而不是零值赋予这些元素。一
般来说,一个假说的概率由于知道了它是假的,就要降低1/n,n是参考序列中的假
说数。所有这一切显然同用“假说概率”表达我们必须根据支持性或破坏性证据赋
予某一假说可靠性程度的纲领是矛盾的。
我认为这已详尽地研究了使假说概率概念立足于真陈述频率(或假陈述频率)
概念,从而立足于事件概率频率理论的可能性。
我想我们不得不认为把假说概率与事件概念等同起来的尝试完全失败了。这个
结论完全不依赖于我们是否接受(Reichenbach的)这个主张:物理学的所有假说
“实际上”是,或者“仔细检查时”不过是概率陈述(关于观察结果序列内某些平
均频率陈述,观察结果总是表明与某个均值有离差),或者不依赖于我们是否倾向
于在两类不同的自然律之间——一方面“决定论的”或“精确的”定律与另一方面
“概率定律”或“频率假说”之间作出区分。因为这两类都是假说性假定,这些假
定决不能成为“可几的”:它们只能在这样的意义上得到验证,即它们能够在烈火
中——检验的烈火中“证明它们的品质”。
我们该如何解释概率逻辑的信仰者已经达到某种对立的观点这一事实呢?Jean
写道——首先在我可以完全同意的意义上——“……我们对任何东西也不能……确
定无疑地知道”,但是他接着说:“我们至多只能涉及频率。(并且)新量子论的
预测(与观察结果)是如此完全一致,以致有利于与实在相符合的这个图式的机会
是极大的。确实,我们可以说这个图式几乎肯定是定量正确的……”,当他这样写
时,他的错误在哪里?
无疑最常见的错误在于认为频率的假说性估计,也就是关于概率的假说,本身
只能是可几的;或换言之,在于赋予概率假说以某种程度的所谓假说概率。如果我
们记得,就其逻辑形式而言(无需参照我们的可证伪性的方法论要求),关于概率
的假说既不能证实也不能证伪,那么我们也许能够提出一个令人信服的论据来支持
这个错误结论(参阅第65至68节)。它们不是可证实的,因为它们是全称陈述,它
们不是可严格证伪的,因为它们决不能在逻辑上与任何基础陈述发生矛盾。因此它
们是(如Reichenbach认为的那样)完全不可判定的。现在正如我们已证明的那样,
它们能够更好地或不太好地得到“确证”,那就是说,它们可或多或少地与已接受
的基础陈述一致。看来正是在这一点概率逻辑起了作用。经典归纳主义逻辑所承认
的可证实性与可证伪性之间的对称提示了这样一个信念:把某种可靠性程度的标尺,
某种其可达到的上限和下限是真和假的“连续概率程度”(引自Reichenbach),同
这些“不可判定的”概率陈述相关起来必定是可能的。然而,根据我的观点,概率
陈述正因为它们是完全不可判定的,它们是形而上学的,除非我们使它们因接受某
一方法论规则而变得可证伪。因此它们不可证伪的简单结果,并不是它们能更好地
或不那么好地得到确认,而是它们根本不能在经验上得到验证。因为否则——假如
它们什么也不排除,因而与一切基础陈述相容——就可以说它们被(任何组成程度
的)一切任意选取的基础陈述所“验证”,假如它描述某种有关事例的出现的话。
我认为物理学使用概率陈述仅在我在有关概率论已充分讨论的这一方面;更具
体地说,它把概率假定,正如其他假说一样,用作可证伪的陈述。但是我应该拒绝
参加关于物理学家“实际上”如何工作的这一争论,因为这必定主要是一个解释问
题。
我在这里对我的观点与我在第10节中称之为“自然主义”的观点之间的对比作
了很好的说明。能够证明的首先是我的观点具有内在的逻辑一致性;其次,摆脱了
困扰其他观点的那些困难。大家承认证明我的观点是正确的,这是不可能的,并且
与另一种科学逻辑学的支持者进行争论也许毫无裨益。能证明的一切是我对这个特
定问题的观点是我一直为之论证的科学概念的一个结果。
81.归纳逻辑和概率逻辑
假说的概率不能还原为事件的概率。这是从前节进行的考虑中引出的结论。但
是一种不同的看法可否导致假说概率概念令人满意的定义?
我不认为有可能建立一种假说概率概念,可被解释为表达假说的“可靠性程度”,
与“真”和“假”的概念类似(而且它与“客观概率”概念,即与相对频率有如此
密切的关系,因而证明使用“概率”一词是正确的)。虽然如此,我现在为了论证
起见,要假设这样一种概念事实上已成功地建立,以便提出这样的问题:这会如何
影响归纳问题?
让我们假设,某一假说——比方说Schrodinger理论——在某个确定的意义上被
承认是“可几的”;或“可几到某一数值程度”,或仅仅是“可几的”,没有具体
规定程度。把Schrodinger的理论描述为“可几的”这种陈述我们可称为对理论的评
价。
一个评价当然必定是一个综合陈述——关于“实在”的断言——,正如陈述
“Schrodinger的理论是真的”或“Schrodinger的理论是假的”一样。所有这些陈
述显然说的是关于这个理论的适宜性,因此当然不是重言的。他们说一个理论是适
宜的或不适宜的,或者在某种程度上是适宜的。其次,对Schrodinger理论的评价必
须是一个不可证实的综合陈述,正如理论本身一样。因为一个理论的“概率”——
即理论仍然可接受的概率——看来不可能决定性地从基础陈述中演绎出来。所以我
们不得不问:评价如何能得到证明?它如何能受到检验?(因而又发生了归纳问题;
参看第1节。)
至于评价本身,也可断言这个评价是“真的”,或者也可说它是“可几的”。
如果认为它是“真的”,那么它必定是一个经验上尚未证实的真的综合陈述——先
验地真的综合陈述。如果认为它是“可几的”,那么我们需要一个新的评价:可以
说是评价的评价,所以是更高水平上的评价。但是这意味着我们陷入了无穷后退。
诉诸假说概率不能改善归纳逻辑这种靠不住的逻辑境况。
相信概率逻辑的大多数人坚持这样的观点:借助赋予归纳出来的假说以概率的
“归纳原理”可达到这种评价。但是如果他们把概率赋予这个归纳原理本身,那么
这个无穷后退仍继续着。如果另一方面他们把“真理”赋予它,那么他们就不得不
在无穷后退和“先验论”之间进行抉择。Heymans说,“概率论永远不可能说明归纳
论证;因为正是同一个问题隐藏在一方,也隐藏在另一方(概率论的经验应用)。
在两种情况下,结论都超出了前提中所给予的”。因此,用“可几的”一词代替
“真的”一词,用“不可几的”一词代替“假的”一词毫无收获。仅当考虑到证实
和证伪之间的不对称性——那种不对称性产生于理论和基础陈述之间的逻辑关系—
—时才有可能避免归纳问题的覆辙。
信仰概率逻辑的人也许试图用这种方法来对付我的批评:他们断言概率逻辑产
生于人的心智,而人的心智“与经典逻辑的框架紧紧束缚在一起”,所以不能遵循
概念逻辑使用的推理方法。我坦白地承认我不能遵循这些推理方法。
82.积极的验证理论:假说如何可“证明它的品质”
我刚刚提出的反对归纳概率理论的异议是否可能转变为反对我自己的观点?似
乎它们是可能的;因为这些异议基于“评价”概念。并且显然我也不得不使用这个
观念。我谈到一个理论的“验证”;而验证只能被表达为一种评价(在这方面,验
证与概率之间没有区别)。此外我也认为不可能断言假说是“真的”陈述,只能断
言它们是“暂时的推测”(或这类东西);并且这个观点也只能用评价这些假说的
方法来表达。
这个异议的第二个部分容易回答。我确实不得不使用的。描述为“暂时的推测”
(或这类东西)的假说的评价具有重言式的地位。因此它不发生归纳逻辑发生的那
类困难,因为这种描述仅仅是解说或解释严格全称陈述,即理论不能以单称陈述中
推导出来这个断言(按照定义,这种描述与这个断言是等价的)。
至于异议的第一部分,有关陈述理论得到确认的评价,情况也类似。确认的评
价不是一种假说,但是如果给定理论和公认的基础陈述就可以推导出来的。它断言
这些基础陈述与理论并不矛盾这一事实,并且在它断言这个事实时考虑到这个理论
的可检验性程度,以及直至陈述时间为止理论已经受的检验的严格性。
我们说只要一个理论经受住了这些检验,它就得到“验证”。断言验证的评价
(验证评价)确定某些基本的关系,即相容性和不相容性。但是单单相容性不允许
我们把某种正的验证度赋予理论:单凭一个理论尚未被证伪的事实显然不能被认为
是充分的。因为没有比建立任何数目的、与公认的基础陈述的任何系统相容的理论
系统更容易的了。(这个评价也适用于所有“形而上学”系统。)
也许可以提出,如果一个理论与公认的基础陈述系统一致,并且如果再加上这
个系统的一部分可从这理论中推导出来,就应该给予某种正的验证度。或者,考虑
到基础陈述不是可以从纯理论系统中推导出来的(虽然基础陈述的否定可如此推导
出来),人们会提出,应该采取下列的规则:如果一个理论与公认的基础陈述相容,
并且如果再加上这些基础陈述的非空子类可以从这个理论与其他公认的基础陈述的
合取中推导出来,就应给予它一个正的验证度。
我对这最后的表述并无严重的异议,除了我认为这对一个理论正验证度的适宜
表征是不充分的。因为我们想说理论得到更好地或不那么好地确认。但是一个理论
的验证度肯定不能只靠计算验证事例的数目,即可用已表明的方法推导出来的公认
的基础陈述的数目来确定。因为会有这样的事发生:一个理论得到的验证似乎比另
一个差得多,即使我们已借助它推导出非常多的基础陈述,而借助后一个理论推导
出的基础陈述却很少。作为一个例子我们可以比较假说“一切乌鸦皆黑”同假说
(第37节提到的)“电子电荷有Millikcan测定的值”。虽然在前一类假说的情况下,
我们大概遇到许多更为验证的基础陈述,然而我们将判断Millikcan的假说是二者之
一得到更好验证的假说。
这表明决定验证度的与其说是验证实例的数目,不如说是所说的那个假说能够
并且已经经受的种种检验的严格程度。但是检验的严格程度本身取决于可检验性程
度,并且因此取决于假说的简单性:高度可证伪的假说,或更简单的假说,也是高
度可验证的假说。当然实际达到的验证度不仅依赖于可证伪度:一个陈述也许是高
度可证伪的,然而它也许只得到一点儿验证,或它事实上也许被证伪了。并且它也
许虽未被证伪,却被它可从中推导出——或是它的极为密切的接近——的一个可更
好检验的理论所代替。(在这种情况下,它的验证度也是低的。)
两个陈述的验证度也许同可证伪度一样并不是在所有情况下都是可以比较的:
我们不可能规定一个数值上可计算的验证度,但是只能用正的验证度、负的验证度
等等粗略地说。然而我们可制定种种规则;例如这一条规则:我们不应继续把一个
正的验证度给予一个已经被主体间可检验的实验证伪的理论,而这些实验基于起证
伪作用的假说(参阅第8和22节)(然而,我们在某些条件下可把一个正的验证度给
予另一个理论,即使它遵循一条类似的思路。一个例子是Einstein的光子理论,它
与Newton的光的微粒说有密切联系)。一般说来,我们认为一个主体间可检验的证
伪是最后的(假如它受到充分的检验):正是通过这种方式使人们感觉到理论的证
实和证伪之间的不对称。这些方法论要点每一点都以它自己独特的方式推进作为一
步步逼近过程的科学的历史发展。在后来作出的验证评价——即在把新的基础陈述
加于那些已经得到承认的基础陈述上面作出的评价——可以用一个负的验证度代替
正的,但是反之则不然。并且虽然我认为在科学史上总是理论而不是实验,总是思
想而不是观察,开辟通向新知识的道路,我也认为总是实验把我们从死胡同中挽救
出来:帮助我们跳出老框框,激起我们去发现新的道路。
因此一个理论的可证伪性或简单性程度进入了理论验证的评价。并且这个评价
可被认为是理论和公认的基础陈述之间的一种逻辑关系:考虑到理论已经经受的检
验严格程度的一种评价。
83.可验证性、可检验性和逻辑概率
在评价一个理论的验证度时我们考虑到它的可证伪度。一个理论越能更好地得
到验证,它就越可检验。然而,可检验性与逻辑概率的概念是相反的,因此我们也
能说一个验证评价考虑到了该陈述的逻辑概率。而逻辑概率本身,如我们在第72节
已表明的那样,与客观概率——事件概率——的概念有关。因此,通过考虑到逻辑
概率,把验证概念与事件概率概念连结起来,即使也许只是间接地和松散地。我们
认为这里也许同上面批评的假说概率学说有某种联系。
当试图评价一个理论的验证度时,我们可推理如下:它的验证度将随它验证实
例的数目而增长。这里我常常给予第一个验证实例比后面几个大得多的重要性:一
旦一个理论得到充分验证,进一步的实例只能提高它的验证度很少一点儿。然而如
果这些新的实例迥然不同于早先的实例,即如果这些实例在一个新的应用领域验证
这个理论,这条规则就不适用。在这种情况下,它们就可极大地增加验证度。普遍
性程度更高的理论的验证度因此可比普遍性程度较低(所以可证伪度也较低)的理
论的验证度更大。同样,精确度更高的理论比精确度较低的理论可得到更好的验证。
为什么我们不把一个正的验证度给予手相者和占卜者的典型预言的一个理由是他们
的预测是如此小心谨慎和不精确,以致这些预言是正确的逻辑概率极高。并且如果
我们被告知说,一些更为精确、因而逻辑上不那么可几的这类预测曾经是成功的,
那么一般说来,我们怀疑的往往不是它们的成功,而是它们所谓的不可几性:因为
我们倾向于认为这些预言是不可验证的,在这些情况下我们也往往从它们低的验证
度推论到它们低的可检验度。
如果我们把我的这些观点同蕴涵在(归纳)概率逻辑中的观点加以比较,我们
就会得到一个真正值得注意的结果。根据我的观点,一个理论的可验证度——以及
一个真实上已通过严格检验的理论的验证度,可以说均与它的逻辑概率处于反比关
系中;因为它们都随它的可检验性和简单性程度而增加。但是概率逻辑蕴涵的观点
正好是这种观点的对立面。这种观点的支持者使一个假说的概率的增加与它的逻辑
概率成直接比例——虽然无疑他们想要他们的“假说概率”所要代表的与我试图用
“验证度”所表明的完全是同一件事。
在那些以这种方法论证的人中间是Keynes用了“先验概率”一词来指我称之为
“逻辑概率”的东西(参见第113页注)。他就一个“概括”g(即一个(假说)以
及“条件”或前件或条件从句φ和“结论”或后件或结论句f作了下列完全确切的评
论:“条件φ内容越丰富和结论f内容越贫乏,我们赋予概括g的先验“概率就越大。
这个概率随着φ中的每一次增加而增加,它随着f中的每一次增加而减少。”正如我
说的,这完全正确,即使Keynes并没有在他称之为“某一概括的概率”——与这里
被称为“假说概率”的相一致——与它们的“先验概率”之间作出明确的区分。虽
然如此,Keynes用他的“概率”所指的与我用“验证”所指的是一回事,这一点可
从他的“概率”随验证实例数目以及(最为重要的)也随实例之间多样性的增加而
增加中看出。(但是Keynes忽视了这一事实:其验证实例属于各种各样应用领域的
理论常常相应地具有高度的普遍性。因而他的两个要求,即获得高的概率——最小
可能的普遍性和验证实例最大可能的多样性——一般是不相容的。)
用我的术语来表达,Keynes的理论蕴涵着验证(或假说概率)随可检验性而降
低。他对归纳逻辑的信仰引导他达到这个观点。因为使科学假说尽可能确定无疑,
正是归纳逻辑的倾向。只有在种种假说能被经验证明为正确时才赋予它们以科学意
义。只是因为理论和经验陈述之间密切的逻辑接近,一个理论才被认为科学上有价
值。但是这不过意味着理论的内容必须尽可能少地超越经验上确定的。这个观点与
否认预测的价值有密切的联系。Keynes写道:“预测的独特优点,……完全是想象
性的。被考察的实例的数目和它们之间的类似是基本要点,碰巧在检查它们之前还
是之后提出某一特定假说的问题是完全无关的。”Keynes在援引“先验地提出的”
——即我们在对它们已有充分的支持以前根据归纳的理由提出的——假说时,写道:
“……如果它不过是一种猜测,在它之前有一些事例或所有的事例都证实它,这一
饶悻事实对它的价值丝毫不增添什么。”这种预测观点当然是前后一贯的。但是它
使人们感到奇怪为什么我们总是要进行概括。有什么可能的理由要建立所有这些理
论和假说?归纳逻辑的立场使这些活动成为完全不可理解的。如果我们评价最高的
是可得到的最可靠的知识——并且如果预测本身对验证无所贡献——,那么为什么
我们依然不满足于我们的基础陈述?
引起十分类似的问题的另一个观点是Kaila的观点。虽然我认为正是简单的理论,
以及那些很少利用辅助假说(参阅第46节)的理论能得到很好的验证,正因为它们
的逻辑不可几性,Kaila根据类似Keynes的理由正好以相反的方式解释这种情况。他
也看到我们常常把一个高概率(用我们的话说,高的“假说概率”)赋予简单的理
论,尤其是那些需要很少辅助假说的理论。但是他的理由是与我的对立的。他不像
我所做的那样把一个高概率赋予这些理论,因为它们是可严格检验的,或逻辑上不
可几的;那就是说因为它们可以说是先验地具有与基础陈述矛盾的许多机会。相反
地,他把高概率赋予具有很少辅助假说的简单理论,是因为他认为由很少假说组成
的系统先验地比由许多假说组成的系统与实在发生矛盾的机会更少。人们在这里又
一次不明白为什么老是要费神去建立这些冒险的理论。如果我们怕与实在发生冲突,
为什么通过作出断言把理论招来?我们最安全的方针是采取一个没有任何假说的系
统。〔“言多必失,不说为佳”]
我自己的规则要求所用的辅助假说要尽可能地少(“利用假说的节约原理”)
与Kaila的考虑毫无共同之处,我对仅仅减少我们陈述的数目不感兴趣:我感兴趣的
是它们在高度可检验性意义上的简单性。正是这种兴趣一方面导致我的应尽可能少
地利用辅助假说的规则,另一方面导致我的公理——最基本的假说——数目应尽量
减少的要求。因为这后一点出于这一要求:应选取普遍性水平高的陈述,以及由许
多公理组成的系统如有可能应从具有更少“公理”和普遍性水平更高的系统中演绎
出来(因此用后一系统解释)。
84.论关于“真的”和“被验证的”概念的使用
在这里概述的科学逻辑学中,避免使用“真的”和“假的”概念是可能的。它
们的地位可由关于可推导性关系的逻辑考虑来代替。因此我们不一定说:“假如理
论t和基本陈述b是真的,预测p就是真的。”我们可以说,陈述p是从t和b(非矛盾
的)合取中得出的结论。一个理论的证伪可用同样方法描述。我们不一定说这理论
是“假的”,但我们可以说它被一组公认的基础陈述反驳。关于基础陈述我们也不
一定说,它们是“真的”或“假的”,因为我们可以把它们的得到承认解释为协约
决定的结果,而公认的陈述是这种决定的结果。
这当然不是说,我们禁止使用“真的”或“假的”概念,或它们的使用造成了
任何特殊的困难。我们可以避免它们这一事实本身表明它们不可能引起任何新的基
本问题。“真的”和“假的”概念的使用十分类似像“重言”、“矛盾”、“合取”、
“蕴涵”和诸如此类这些概念的使用。这些是非经验概念、逻辑概念。它们描述或
评价一个陈述,不考虑经验世界中的任何变化。虽然我们假定物理对象(Lewin意义
上的“发生同一的[genidentical]对象”)随时间的推移而变化,我们仍然决定
以这种方式使用这些逻辑谓词,因而陈述的逻辑性质成为无时间性的了:如果一个
陈述是重言的,那么它永远是重言的。我们也把这同样的无时间性赋予“真的”和
“假的”概念,这与日常的用法是一致的。说一个陈述昨天是完全真的,但今天变
成假的,这不是日常的用法。如果昨天我们评价一个陈述是真的,今天评价它是假
的,那么我们今天不言而喻地断言我们昨天错了;甚至昨天这个陈述也是假的——
无时间性地假的——但我们错误地“把它当作真的”。
这里人们能十分清楚地看到真理和验证之间的不同。评价一个陈述得到验证或
没有得到验证也是一个逻辑评价,因此也是没有时间性的;因为它断言在某一理论
系统和某种公认的基础陈述系统之间有一定的逻辑关系。但我们谈到一个陈述时决
不能简单地说它本身或自己“得到验证”(以我们说它是“真的”这种方式)。我
们只能说它就某种基础陈述系统而言得到验证——直到某一特定时刻以前得到承认
的系统。“一个理论直到昨天得到的验证”与“一个理论直到今天得到的验证”在
逻辑上不是等同的。因此我们必须给每一个验证评价添上一个下标——表征验证与
之有关的基础陈述系统的下标。(例如用它得到承认的日期)。
所以验证不是一个“真值”;即它不能与“真的”和“假的”概念(它们没有
时间标志)处于同等的地位;因为对于同一陈述可以有任何数目的不同的验证值,
这些值确实都可能同时是“正确的”或“真的”。因为它们是一些可从理论和在不
同时期承认的不同组基础陈述中合乎逻辑地推导出来的值。
上述的评论也可帮助阐明我的观点和实用主义者的观点之间的对立,他们建议
用一个理论的成功——因而用它的有用性,或它的确证或它的验证来定义“真理”。
如果它们的意图只是要断言一个理论成功的逻辑评价不过是它的验证评价,那我可
以同意。但是我认为把验证概念同真理概念等同起来远不是“有用的”。这在日常
用法中也是要避免的。因为人们谈到一个理论时完全可以说,它迄今根本末被验证,
或它仍未被验证。但我们一般不应说一个理论迄今不是真的,或它仍然是假的。
85.科学的道路
人们在物理学进化中可以辨认出某种总方向——从普遍性水平较低的理论到水
平较高的理论的方向。这通常被称为“归纳”方向;也许会认为物理学沿这个“归
纳”方向进展这个事实可被用作支持归纳方法的一个论据。
然而沿归纳方向进展不一定由归纳推理序列组成。实际上我们业已表明它可用
完全不同的术语--用可检验性和可验证性程度——来解释。因为一个已得到充分
验证的理论只能被一个普遍性水平更高的理论来代替;即被一个可更好检验的、并
且此外包含旧的、得到充分验证的理论(或至少很接近于它)的理论来代替,所以
把那种趋向——向普遍性水平越来越高的理论进展——描述为“拟归纳”趋向更好。
这种拟归纳过程应设想如下。提出具有某种普遍性水平的理论,并用演绎法检
验;在这以后,又提出普遍性水平更高的理论、又借助具有以前水平的普遍性的理
论检验,如此等等。检验方法是不变地根据从较高水平到较低水平的演绎推理;另
一方面普遍性水平按时间次序通过从较低水平到较高水平而达到。
也许提出这个问题:“为什么不直接发明普遍性水平最高的理论!为什么等待
这种拟归纳进化?也许这不就是因为毕竟有归纳要素包含在其中吗?”我不认为如
此。具有一切可能的普遍性水平的意见——推测或理论——一次又一次被提出。那
些普遍性水平太高的理论(即离开当时可检验的科学达到的水平太远)也许产生一
种“形而上学系统”。在这种情况下,即使陈述应该可以从这个系统中演绎出来
(或只是不完全地推导出来,例如在Spinoza系统的情况下),这些陈述属于流行的
科学系统,在其中也不会有任何新的可检验陈述;这意味着没有任何判决性实验能
被设计出来检验所说的系统。如果在另一方面,可以为它设计一个判决性实验,那
么系统作为第一个近似将包含某个得到充分验证的理论。并且同时也包含某种新的
东西——能够接受检验的东西。因此,该系统当然不是“形而上学的”。在这种情
况下,可把所说的系统看作为科学拟归纳进化上的新进展。这说明为什么一般只是
由那些提出来试图应付当时问题境况,即当时的困难、矛盾和证伪的理论来建立与
当时科学的联系。在对这些困难提出一种解决办法时,这些理论可指出通向判决性
实验的道路。
为了获得一个这种拟归纳科学进化的图景或模型,可把种种思想和假说看作为
悬浮在液体中的粒子。可检验的科学是这些粒子在容器底下的沉淀物:它们是分
(普遍性的)层沉淀的。沉积的厚度随这些层次数目而增长,每一个新的层次相当
于比在它下面的那些理论更为普遍的理论。这个过程的结果是以前在较高的形而上
学区漂浮的思想有时可因科学的增长而被触及,因而与它接触而沉淀。这些思想的
例子是原子论;单一物理“本原”或最终元素(其他东西由此衍生出来)的思想;
地动理论(被Bacon认为虚构而反对);古老的光微粒说;它的液体理论(作为金属
传导的电气假说而复活)。所有这些形而上学概念和思想,即使在其最初的形式,
也许已帮助把秩序引入人的世界图景中,并且在一些情况下也许甚至已导致富有成
效的预测。然而这样的一个思想获得科学的地位,仅当它存在于可证伪的形式时;
那就是说,仅当用经验在它与某个对立理论之间作出抉择成为可能时。
我的研究已探索了本书开头所采取的一些决定和约定——尤其是划界标准——
的种种结果。我们在回顾时可以试图最后全面地看一看已经呈现的科学和科学发现
的图景(我在这里想到的不是作为一种生物学现象,作为一种适应工具,或作为一
种迂迴的生产方法的科学图景:我想的是它的认识论方面)。
科学不是一个确定的或既成的陈述的系统;它也不是一个朝着一个终极状态稳
定前进的系统。我们的科学不是绝对的知识(episteme):它决不能自称已达到真
理,甚或像概率一样的真理的替代物。
然而科学具有的价值不只是生物学的生存价值。它不仅是一个有用的工具。虽
然它既不能达到真理,也不能达到概率,追求知识和探索真理仍然是科学发现最有
力的动机。
我们不知道:我们只能猜测。并且我们的猜测受到对我们能够揭示——发现的
定律、规律性的非科学的、形而上学的(尽管在生物学上可以说明的)信仰指导。
像Bacon一样,我们可把我们自己的当代科学——“人们现在通常应用于自然界的推
理方法”——描述为由“轻率的和过早的预感”组成的,描述为“偏见”。
但是,我们的这些不可思议的富有想象力的和大胆的推测或“预感”受系统的
检验仔细而清醒的控制。我们的任何“预感”一旦提出,都不能被教条地坚持。我
们的研究方法不是维护它们,为了证明我们是多么正确。相反,我们努力推翻它们。
我们努力利用我们的逻辑的、数学的和技术的武库中的所有武器来证明我们的预感
是错的——为了代替它们提出新的未被证明的和不可被证实的预感,Bacon嘲弄地称
它们为新的“轻率的和过早的偏见”。
有可能更为乏味地解释科学的道路。人们会说,进步“……只有两种方法获得:
通过收集新的知觉经验,以及通过把已经得到的那些经验更好地组织起来”。但是
科学进步的这种描述,虽然实际上并不错,似乎没有抓住要害。它也是Bacon归纳法
的残余:太使人想起他的勤奋收集“无数成熟的应时的葡萄,他期望科学之酒从中
流出:想起他的始于观察和实验,然后进到理论的科学方法神话(顺便说一句,这
种神话方法仍然激励一些试图实践它的新近出现的科学,原因是普遍认为它是实验
物理学的方法)。
科学的进展并不是由于越来越多的知觉经验随时间而积累这一事实。它也不是
由于我们正在越来越好地利用我们的感觉这个事实。科学不可能从未被解释的感觉
经验中提炼出来,不管我们多么勤奋地收集和挑选它们。大胆的想法,未被证明的
预感,以及思辨的思想是我们解释自然的惟一手段:我们把握自然的惟一的工具,
我们惟一的仪器。并且我们为了获奖,就必须使它们冒风险。在我们之中不愿意使
他们的思想去冒反驳的风险的人,不能参加科学游戏。
甚至用经验仔细地认真地检验我们的思想本身也受思想启发:实验是有计划行
动,其中每一步受理论支配。我们并不是偶然地碰见我们的经验的,我们也让它们
像溪流那样在我们身旁流过。宁可说,我们必须是主动的:我们必须“制造”我们
的经验。正是我们总是向自然界提出问题;正是我们一而再、再而三试图提出这些
问题,为了得到明确的“是”或“否”(因为自然界不给答案,除非逼着它)。最
后,正是我们给出答案;正是我们自己在认真仔细研究之后决心回答我们向自然界
提出的问题——在持久地和诚挚地试图从自然界那里得到一个毫不含糊的“否”之
后。Weyl说,“我永远要记录我对实验家在他的斗争中工作的无限敬意,他在这种
斗争中从毫不让步的造物主那里夺取可解释的事实,造物主清楚地知道如何用一个
决定性的不——或用一个听不见的是来对付我们的理论”。我完全同意他。
关于episteme——绝对的确定的可证明的知识——的古老的科学理论已证明是
一个偶像。科学客观性的要求使每一个科学陈述必定仍然永远是试探性的成为不可
避免。它当然可被验证,但是每一次验证是相对于其他陈述而言的,这些陈述又是
试探性的。只有在我们确信的主观经验中,在我们的主观信仰中,我们才可能是
“绝对确定无疑的”。
蒙昧主义的防御工事随着确定性的偶像(包括不完全确定性或概率的偶像)而
垮台了。蒙昧主义阻碍科学前进的道路,妨碍我们问题的大胆性,危害我们检验的
严格性和完整性。这种错误的科学观表现于渴望成为正确;因为造就科学家的不是
他之拥有知识、不可反驳的真理,而是他坚持不懈地以批判的态度探索真理。
那么我们的态度不得不是一种无可奈何的态度吗?我们是否不得不说,科学只
能完成它的生物学任务;即至多它只能在可验证它的实际应用中证明它的品质吗?
它的智力问题是不可解的吗?我不认为如此。科学决不追求使它的回答成为最后的
甚至可几的这种幻想的目的。宁可说,它的前进是趋向永远发现新的、更深刻的和
更一般的问题,以及使它的永远是试探性的回答去接受永远更新的和永远更严格的
检验这一无限然而可达到的目的。
追记(1972)
我书的前一章(即最后一章)中,我试图阐明,我说的一个理论的验证度是指
总结该理论如何经受住检验以及这些检验如何严格的简要报告。
我从未偏离过这个观点。这里我将补充以下几点:
(1)逻辑的和方法论的归纳问题不是不可解决的,但是我的书提供了一个反面
的解决:(a)我们决不能合乎理性地证明一个理论,这就是说,我们决不能合乎理
性地证明对一个理论真理性的信念,或对它可能是真的信念。这种否定解决同下述
包含在优先选择比其他理论得到更好验证的理论的规则中的肯定解决是相容的;
(b)我们有时能够合乎理性地证明根据理论的验证,即根据竞争理论的批判讨论的
现状(从评价它们接近真理性,即逼真性的观点对它们进行批判讨论和比较)优先
选择某一理论。这种批判讨论的现状,原则上可以它们验证度的形式报告。然而,
验证度不是逼真性的量度(逼真性的量度必须是没有时间性的),而只是关于我们
到某一时刻为止能够确定什么的报告,关于根据对可得到的理由(这些理由已被提
出来支待或反对理论的逼真性)所作的判断比较竞争理论主张的报告。
(2)逼真性观念提出的一个形而上学问题是:自然界中有没有真正的规律性?
我的回答是:“有”。支持这个回答的论据(非科学的,但也许是“超验的”;参
阅P.368)是:如果自然界中没有显而易见的规律性,那么观察和语言都不可能存
在:描述性语言和论证性语言都不可能存在。
(3)这个回答的力量依赖某种常识实在论。
(4)实用的归纳问题也就自行解决了:在实践上优先选择根据理性讨论更接近
于真理的理论是冒风险的,但是合乎理性
(5)我认为心理学问题(为什么我们相信如此选择的理论继续值得我们信任?)
是没有什么意义的。
(6)这种方法并未解决所有可能的“归纳问题”(参阅我即将出版的书:Obj
ectiue Knowledge:An Euolutionary Approach)。
Saturday, June 6, 2009
Subscribe to:
Post Comments (Atom)
Followers
Blog Archive
-
▼
2009
(1187)
-
▼
June
(312)
- 潇潇 发表于2008-11-29 00:59:00 阅读 680 次 评论 18 条 所属文章分类:...
- 犹太犹太人的象征:白色、蓝色、大卫王之星 犹太人历史始于公元前第二个一千年的头五百年,始祖是亚伯...
- 通货紧缩目录[隐藏]通货紧缩——定义通货紧缩——成因通货紧缩——影响通货紧缩——利弊通货紧缩——循环...
- 货币目录[隐藏]货币定义货币概述货币历史货币本位货币种类货币防伪现代货币货币职能中国货币货币类型货币...
- 信用货币目录[隐藏]信用货币简介信用货币的沿革和性质信用货币的特征信用货币的形态 [编辑本段]信用...
- 金融学(Finance)是以融通货币和货币资金的经济活动为研究对象的学科。 金融是货币流通和信用活...
- 金融学目录[隐藏]定义历史分支分类金融学专业 金融[编辑本段]定义 金融学(Finance)是以...
- 宇宙暴涨理论 【宇宙起源的问题】 对于宇宙的起源,我们仍然有很多问题: 第一.为什么宇宙在大尺...
- 暗物质目录[隐藏]暗物质存在的证据美国故事影片《暗物质》(2007)最被看好的暗物质候选者CCDM存...
- 黑洞目录[隐藏]【黑洞简介】【黑洞动力学】【黑洞的特殊】【黑洞的划分】【黑洞的吸积】【黑洞的毁灭】【...
- 侯瀚如:里昂双年展正面临重大自我变革的挑战 作者:侯瀚如 2009-06-26 14:16:3...
- 宋庄:当代艺术的前哨阵地还是一个大型的艺术加工厂? 作者:何桂彦 2007-12-07 14:...
- 心理的距离,还是“他者”的眼光? ——郭锐笔下的都市生存印象作者:何桂彦 2009-03-09...
- 形式主义还是现代主义? ——20世纪80年代的中国抽象绘画作者:何桂彦 2009-03-31 ...
- 中国当代艺术有自身的价值尺度吗? 作者:何桂彦 2009-04-13 09:36:12 ...
- 抽象艺术 原始股还是问题股? 作者:张颖 2008-03-22 15:27:45 来源 ...
- 前卫艺术的文化逻辑及其与抽象绘画的关系 ——兼论格林伯格早期形式主义批评中的理论问题作者:何桂彦 ...
- 谢国忠:美国坐庄做爆了 我来告诉中国怎么坐庄 谢国忠:通涨来临是拐点 ,明年更痛苦谢国忠搜狐博客 h...
- 放款热的黑暗一面 / 謝國忠2009-06-22谢国忠搜狐博客 http://xieguozhong...
- 字号:大 中 小 谢国忠:美国坐庄做爆了 我来告诉中国怎么坐庄 谢国忠:通涨来临是拐点 ,明年更痛苦...
- 谢国忠:A股折腾至少要到明年底来源:新浪财经谢国忠搜狐博客 http://xieguozhong.b...
- 字号:大 中 小 谢国忠:谁将在通胀中获益 2009年06月24日 第一财经日报 通胀只要没有让...
- 谢国忠:全球经济进入沉闷时代 随着流动性的大幅收紧,全球可能出现持久熊市。一些依靠吸引国外资本流...
- 谢国忠:全球经济进入沉闷时代 [原创 2009-06-23 19:41:21] 字号:大 ...
- 宽松投机本文见《财经》杂志 2009年第13期 出版日期2009年06月22日除非中国经济模式发生变...
- 赵云字子龙,常山真定人,三国时期蜀汉名将。追随刘备,功绩卓著,有勇有谋,善始善终,卒于公元229年,...
- 赵云字子龙,常山真定人,三国时期蜀汉名将。追随刘备,功绩卓著,有勇有谋,善始善终,卒于公元229年,...
- 刺激增长还是刺激投机?本文来源于《财经网》 2009年06月19日谢国忠:贷款激增把中国企业从真正...
- Taming the beast / 謝國忠2009-06-17The US could benef...
- Maya Kóvskaya is a Beijing-based writer, art criti...
- People in Dark Times"Even in the darkest of times ...
- 货币武器世界
- 沒有永遠對的價值觀朋友手拿一份報紙說讓我做一個小小的測驗,我欣然同意了。問題一:如果你知道有一個女人...
- 智能本 发表评论(0)编辑词条上网本(netbook)将消失,演变成为智能本(smartbook),...
- • MySpace每况愈下 默多克一世英名将毁于一旦 • Facebook美国用户量首超MySpac...
- 蓝光前景堪忧 发表评论(0)编辑词条目录• Harris调查机构:蓝光播放器及蓝光影碟前景堪忧 • ...
- 拉里·罗伯茨 发表评论(0)编辑词条拉里•罗伯茨(Larry Roberts) (born 1937...
- 约翰·凯默尼 发表评论(0)编辑词条约翰·凯默尼(John George Kemeny)(1926....
- 美国社会主义 发表评论(0)编辑词条目录• 富人的美国社会主义 • 外媒称美国大步迈向美国特色社会主...
- 杰克·基尔比 发表评论(0)编辑词条杰克·基尔比(Jack Kilby,1923年11月8日-200...
- 美国法上的“网络匿名发表言论权”述评编辑本段回目录《美国法上的“网络匿名发表言论权”述评》在所有的自...
- Ward Christensen 发表评论(0)编辑词条BBS大约诞生于1978年。沃德·克里斯滕森...
- Michael Cowpland 发表评论(0)编辑词条Michael Dr. Cowpland (...
- 约翰·巴顿 发表评论(0)编辑词条约翰·巴丁(John Bardeen)(May 23, 1908 ...
- 保罗·布林内德 发表评论(0)编辑词条 保罗·布莱内德(Paul Brainerd):桌面出版之父P...
- 肯·莱维尼 发表评论(0)编辑词条肯·莱维尼(Ken Levine)公司:2K Boston职务:《...
- 罗伯特·科蒂克 发表评论(0)编辑词条罗伯特·科蒂克(Robert Kotick),全名Robert...
- 苹果黑盒文化 发表评论(0)编辑词条目录• 纽约时报:苹果的“黑盒”文化 • 《新闻周刊》:被苹果愚...
- 德国黑客部队 发表评论(0)编辑词条目录• 德国60岁老将组建黑客部队将矛头指向中国 • 德国76人...
- 《第三浪》 发表评论(0)编辑词条目录• 基本信息 • 内容简介 • 图书目录 • 作者简介 • 背...
- 网络集体主义社会 发表评论(0)编辑词条凯文·凯利(Kevin Kelly)在2009年6月号《连线...
- GOOGLE的罪过 GOOGLE是我看到过的最有想象力的公司,想象力难得呀!随便输入一个“妈...
- Cowell's Confession: Simon Says, "I Was Wrong"Post...
- 当代艺术不讲文化 今日看到复旦某大三学生证明了计算几何领域世界级猜想,头一次见到这么凶险的...
- 冯珏 TOM美女副总裁 家世:“外公是哲学家冯友兰,母亲是著名作家宗璞,父亲是大学教授”。光辉...
- 外媒记者:中国须谨防朝鲜战争再起(1) 时间:2009-6-18 9:55:28 世界能源金融网...
- 论世界海军5强攻击核潜艇的威力发布: 2009-6-15 20:17 | 作者: 龙11猫 | ...
- 日本欲引进远程精确攻击导弹引周边国家不安发布: 2009-6-18 20:07 | 作者: 高倚天...
- 美军称十年内中国空军都无法抗衡F-22战机[图]发布: 2009-6-20 11:16 | 作者:...
- LEAP预警:美元违约,三个冲击波将毁灭全球政经体系发布: 2009-6-19 11:53 | 作...
- 依靠皮卡 印度要与中国争霸美汽车市场http://www.huanqiu.com 来源:环球时报 网...
- 朝鲜玩火,中美谁加油,谁救火? 朝鲜自今年5月份以来,接连进行地下核试验和发射短程导弹,...
- 【警惕】谈中国的处境,内忧外患的时代来了!很多人看了会觉得可笑,世界的发达国家和发展中国家都这么巴结...
- 70年来最大规模金融改革 奥巴马被批太激进http://www.huanqiu.com 来源:环球时...
- 朝鲜步入战争后对中国有何影响(1) 时间:2009-6-16 10:43:30 世界能源金融网 ...
- 中国航母的五大秘密同时曝光:把日本和美国吓傻了 秘密一、近三年网上出现“要不要航母”争议的背景折...
- 原油补涨提升大宗商品价值中枢(1) 时间:2009-5-18 16:01:10 世界能源金融网 ...
- 品牌社群的七大迷思苏珊 • 富尼耶(Susan Fournier)拉腊 • 李(Lara Lee) ...
- 美国经济危机中的“艺术赞助政策” elemy 发表于2009-05-23 21:56:01 阅读 4...
- 博物馆在金融危机中的生存战略 elemy 发表于2009-05-23 22:01:08 阅读 484...
- Do you know how to protect yourself? Get the scoop...
- Galleries for emerging artist – 6 pages worthhttp:...
- The Chinese Language, Ever EvolvingBy The Editors(...
- YouTube維基百科,自由的百科全書跳轉到: 導航, 搜尋YouTube {{{company_...
- GRANTS > BOROUGHWIDE > MANHATTAN COMMUNITY ARTS FU...
- 透析纽约苏富比亚洲艺术专场拍卖时间:2008-09-27 14:36:40 来源:Arting79...
- 纽约仅仅是等待已久的“确认键”时间:2008-09-27 14:38:13 来源:Arting79...
- 1、世界上总有一半人不理解另一半人的快乐。——《爱玛》 2、什么是权力?当一个人犯了罪,法官依法...
- 猶太觀點。父母經(值得為人父母者一看之文章)1992年,當我輾轉回到以色列的時候,13歲的老大、12...
- 威廉·莎士比亚 顶级专家认为此画主人公是莎士比亚本人莎士比亚(W. William Shakesp...
- 老聃,真吾师也!
- 莎士比亚全集(1-8增订本)(精)放在你的blog里!译者: 朱生豪等作者: 威廉·莎士比亚ISBN...
- 莎士比亚全集(1-8增订本)(精)放在你的blog里!译者: 朱生豪等作者: 威廉·莎士比亚ISBN...
- 形而上学和形而下学都是什么意思? 悬赏分:0 - 解决时间:2006-4-15 10:40 提问者...
- 人类学究竟是什么 ——一门学科的公众形象问题 陈洁:整理 发布时间: 2007-06-19 1...
- 哈耶克简介shunz 于 2004-3-13,08:02 归类于:哲思政论 Tags:hayek ...
- 知识分子反对市场吗?2009-06-12 21:46:25 来自: malingcat (慎思明...
- Jhon Ellerman阅读(21) 评论(0) 发表时间:2007年12月26日 07:33 本...
- 很多企业不懂网络营销 上一篇 / 下一篇 2009-04-10 12:12:36 系统分类:生活 ...
- 毛泽东与孟锦云 Local Access打往中国电话卡1.3¢/分种 来源: 佚名 于 0...
- 毛泽东对习仲勋说:你比诸葛亮还厉害(图) Local Access打往中国电话卡1.3¢/分种 ...
- 养虎为患 日本令美国不敢对朝动武 军事杂谈 2009-06-10 02:49:15 ...
- 乐谈东北亚史十前195年-108年的东北亚人群和族群前文花了较长篇幅,介绍了前195年-108年东北...
- 乐谈东北亚史之前195年-108年的东北亚国际形势 【一】 2009-04-13 08:19:13 ...
- 小日本欲哭无泪 伊朗狠狠"捅了"日本一刀 世界军事网 2009-06-09 19:51:21 ...
- 中国有钱了,该还老百姓的国防债了 陆军论坛 2009-06-10 02:33:09 ...
- (图文)印总理就中国藏南领土放狠话:绝不妥协 陆军论坛 2009-06-09 21:05:43...
- (图文)美军此物一出 我军重机枪又丧失一点优势 陆军论坛 2009-06-10 20:54:0...
- 养虎为患 日本令美国不敢对朝动武 军事杂谈 2009-06-10 02:49:15 ...
- 印度向藏南地区增兵近6万 中国专家称中印可能因藏南地区擦枪走火 世界军事网 2009-06-1...
-
▼
June
(312)
No comments:
Post a Comment