换言之,两件事物,两个事件 A B, 如果它是互为充要条件的话,那从这个智能的本质来看,就是两个是同步发生了。这个确实是一件有点出人意料的事情,就是说两个事情在我们看来是,其实是两件事,但是从这个皮尔逊系数这个角度来看,它们两个实际上是一件事。就意思就是说,从概率的角度讲,是你没有办法去区分它们两个。就是 A 发生了 B 一定发生。 A 和 B 的这个从概率的统计上是你没法区分的。我我是可以这么设想,就说有一个最接近于智能的这个,就是初级,我们讲这个智能最开始,从这个生物演化,或者说它最低级最低级草履虫这种,或者是什么感光它的感官非常弱非常弱,它仅仅能够,就是说做一个很简单的一个概率统计,它完全不能够有模式识别的这种能力。或者说它没有能力去比较两件事。不过这个也好像也不对,就说为什么它,或者说 A 和 B 实际上从模式识别的角度来讲是可以区分出来是两个是不同的,你明白吗?就是 A 和 B 一个是红色一个是黄色,两个是完全不同的事物。但是从概率的角度讲,如果 A 和 B 是互为充要条件的话,那么从概率的区分上是区分不出它们的,就是 A 和 B 总是同时发现,同时发生。而且出现的概率是一样的,它们两个分开来的概率跟合起来的概率,或者说是独立发生的概率,都是一样的。能不能这么讲?对不对?就是说你从统计学或者从筛筛选采样的角度讲,你是没有办法说单独去取出其中一个而取不到另外一个,因为它们两个是强相关的。能够取到一个而取不到另外一个那就已经说明他们不是强相关了是不是?因为它的这个条件概率就是说一定要发生的。所以你就是这个叫什么叫做哼哈二将,就是这个叫什么推多 d 推多 down, 就是有 A 必有 B, 就是两个那个以前的有个俗语,就是说这个哼哈二将,他哼就来了就哈一定来,你不可能区分他两个人,这两个小胖子,就是说同时都在,也不可能分开来。就从永远就不可区分这一点就是最高级的,就是等于是识别。什么叫做识别呢?其实你可以说,识别是从统计学的规律来看。或者说从 feature 或者是 recognition 你去看,但是还可以从另一个角度来看,就是从它的统计的概率样本来看。因为为什么我们会需要这个东西?如果有模式识别了,那么是否还需要这种概率上的统计来识别它两个是是否是同样的事物。但是我刚才讲了,很有可能从模式识别的角度来看, A 和 B 是两个截然不同的东西。但是我们能够识别 A 和 B,但是它们两个从概率统计的角度讲又是同时出现,同时发生,而且互为因果,就是完全是充要条件。那么它实际上从统计学的角度讲它是一个事物,你从模式识别的时候是两个事物。所以这个是一个很微妙的地方,你理解不理解我说的意思?
其实这里面你最后说了,就是说我们用统计的这个角度来看,但是其实我们真的是说模式识别需要这个东西吗?就说我们自己问自己一下,我觉得是需要的。我们前提已经讲过了,世界上的万事万物其实是五花八门的,很多事物其实是用伪装的脸来迷惑你。其实他是一个人,但是他假装了一下,就是我们刚才说的那个变脸,就是在我只是用比喻的方式,比如说一个人或者是妖怪,孙悟空他妖精他变了一张脸。然后呢从模式识别的角度来看,他是两个人。就说 A 和 B, 我们总是看 A。 当然这个是有点牵强附会了,他怎么能分身呢?是不是?我们只能说是这个就说变脸这个东西不好,就是不是一个好的例子,我们可以说 A 和 B 是一丘之貉。比如说 A 是一个总是说他是好人,然后 B 呢说他是坏人。然后我们现在有了这么两个概念,就是 A 和 B 我们是完全可以区分来的。可是我们现在发现了一个奇怪的现象, A 出现的时候 B 也一定出现,而 B 出现时候 A 也一定出现。然后我们就可以得出结论,虽然我们认为 A 和 B 是不同属性的东西,可是因为它们同时出现的这种,让我们从概率感知上角度来看,它们是一类人。就说原来你说 A 他是个好人, B 是个坏人。可是他们总是在一起,那就是臭味相投。所以我们最后把它归类为他们是同类人,尽管我们认为他们不是一类,可实际上呢,他是一类人。就说从模式识别并不能完全解决所有的东西。模式识别有时候是会被欺骗的,就是这种情况。从模式识别的角度讲说,我们可以区分 A 和 B, 可是这个是不完整的,是容易被欺骗的,可能是低等智能。真正的高等智能的话,是要从统计学的角度去区分它 A 和 B 的相关性。而这个相关性是用 A 和 B, 就是 A 发生 B, 就 A 是 B 的条件概率, B 是 A 的条件概率,到底是不是 100%?如果都是 100% 的话,那么我们才能说 A 和 B 是同类的事物。所以这个我觉得是从统计学或者从机器学习的角度讲,它是有意义的、有价值的。等于是我们发现了两个从概率的角度讲是同一件事,或者说总是发生,同时发生的。那么这个再从像那个机器学习,或者说从 Transformer 里面这个语言现象,可以说它们是一个同一类的,因为它始终是同时发生的,是不是?同时发生的事情并不等于说两个是一一模一样的,只是从概率的角度讲是它们是同一类事物,是最强规律、最强相关性的。