其实关于这一段我想展开的这个人工智能我刚才没有说完实际上我想说的是什么呢这个从这个公理的美这个就是极简的基础的假设这个导致说他没有他为什么这么做的原因就是防止推出这种按逻辑自洽推出矛盾所以呢这让我想起这个人工智能当前这个训练数据也是这样我们现在追求的什么大数据这个多少这个多大参数这几上亿的这个万亿级的参数千亿级参数那么这个实际上训练出来是什么样大量的例子去训练但是呢有没有过多的例子就是案例教学实际上它潜在的是有互相矛盾的地方这个才有造成了很多的灾难性遗忘实际上很多情况下所谓灾难性遗忘就是因为它的这个知识体系是互相冲突的就是一个重要原因这其中一个原因吧那么有没有可能我们在训练一个人工智能的话我们就用公理公理体系一样它自己掌握了一个极简的这种逻辑的方法就是我们就给它一些最基本的事实然后让它按照这种事实的这种演绎逻辑关系去演绎出来我想这个这个思想其实也不是我发明我想啊这个跟那个维特根斯坦的那个逻辑哲学论里面的这个思想是一一样的这也是当前就是说那个很热门的话题就是说那个李飞飞还是科那个那个杨立昆他们倡导的是世界模型的一个一个一个解决的方案所谓世界模型就是说用极简的公理体系去创建出来衍生出来的因为你不可能去做一个这种案例教学式的世界体系为什么呢因为太大了太多了这个就是说现在的训练是说为什么要训练万亿级数就是说万亿参数就把所有的其实可以冗余的可以去演绎出来的东西也当做一个例子教学举一个例子就好像我们现在教小学生去计算数学题一样你天天教他说 13+14 等于多少然后你不教他方方法的话明天换一道题 15+16 等于多少他又不会了你现在等于是说一个加法你就教他一个题目一个加法就教他一遍训练一遍那还得了你这世界体系这是自然数是无穷的你要教他无穷的这案例吗所以这个是就是你如果教会他一套方法的话这个是不是就能够人工智能的训练就能够走走这条路当然这是一种幻想了就是说这个很可能这个深层次的但是这这是一个想法吧就是做有感而发嘛就是说为什么要这样呢因为防止就是防止他这个冲突就说矛盾因为大训练数据你想这个多少 T 级的有没有这个数据有没有被污染数据有没有这个呃互相冲突或者矛盾那这清洗数据的工作可比那个训练数据这个工作还要严格因为越往后的话这个已经没有那么多数据了现在人工智能为什么到现在它这个走不进走不出去了这没有数据可训练了为什么没有数据可训练了这数据是为为什么要训练无穷的数据呢是不是如果掌握了一个基本的方法能不能做到说一个小模型它就自己能够逻辑推演出来的就是这个思想这个其实是数学上是一脉相承的所以我才有这种感想你看能不能把这一段加到最后这实际上就画龙点睛的这个就是这个体系吧
这让我们联想到当下火热的人工智能。AI的训练逻辑,其实和数学公理体系有着异曲同工之妙:AI的“公理”是海量的训练数据和预设的算法规则,它基于这些“假设”生成逻辑自洽的输出,却不需要关心输出是否贴合现实本质——就像数学不关心“0是否代表没有”,只关心它能否支撑起严谨的运算。而人类的认知,则更像物理研究,需要在“假设-验证-修正”的循环中逼近真相。