我确实没有对这篇文章做深入的,就是仔细的阅读,所以你提的这两个点恰好是我没有注意到的,因为我没有通读这个文章,所以我才分享给你,让你去做一个深入的这种,你能够通读,你读的速度比我快,等于把这个摘要出来。其你提到这两点,其实我都还感很感兴趣,就说其实是我没有注意到的,我我同意你这种观点,这两个,两个观点就两点,就第一个是形式化的推理定律,这个是我没有注意到的,没有完全体验到。第二个是 SFT SFT Compose 就微调法,这个我没有注意到它是怎样,如果这两方面你能给出一个更详细的,那么我同意它是有学术价值的。比如第一点是形式化的推理定律,这个我没有很没有注意到它是怎样做到一个形式化的推理定律,我只是按照这个文章那个举的例子去理解他。我他的例子就是说,比如说他现在要去搜索一个小说里面的宝藏,大概率是在第三章,那么他就说啊,第三章关键字查找某某,比如说是藏宝图啊,比如说是金银铜铁,金银宝贝啊什么之类,就大概是这么一个,然后是这这个查找的结果,哎,可能没有找到,但是找到一个线索啊,第三章提到了说后面在哪里提到了藏宝图,就是谁身上,比如说我随便杜撰小说里面某个人物,张三提到了藏宝图,然后又留下个影子,张三后来说我以后告诉你,哎,那这个搜索这个结果,那说不定这个在小说第五章或第六章,张三又再去把这个藏宝图告诉我们在哪里,那你去第第五章、第六章去搜,就是意思是什么东西,你可能就像我们读小说、看侦探片一样,搜到一个场景,哎,没有搜到结果,但是搜到了结果的线索,那这个结果线索,他说,哎,我以后告诉你,你去找谁谁谁去问啊,那去找,再搜那个谁谁谁搜了这个张三,呃,张三又说啊,你去找李四问,就这递归式的,实际上这是像这个这个做法,你说如果这个是形式化推理,我同意这是破案式的,或者是写小说式的,这可能是无穷尽的,甚至于说多次调用,就说我是这,我其实是刚才是从他的这个用这种传统的关键字搜索来去解决这个问题,我是从这个角度来对他表示怀疑的,意思主要是侧重在这一点,就是用我们用我自己亲身经历的,就是说关键字搜索这个文章章里面的这些情节,实际上传统的方法是没法解决这个问题,没法完全解决这个问题,只能说能解决大部分,但是有很多是解决不了的,就是模糊查找的问题解决不了,而大语言模型恰恰是这个百分之后面这个模糊查找这个可能剩下百分之十、百分之二十这个问题它解决得比较好,应该是相对来说是是非常好吧目前,但是你现在恰恰是用传统的关键字搜索去,因为你这肯定是效率考虑的,肯定是这个成本的考虑,然后去解决这个甚至于是递归式的,那你递归式的你又要把这个叫做搜索的结果,然后再喂给大模型,大模型又得要再去,去根据结果再给你产生下一次搜索的这个叫做什么指令。那这个东西是递归式调用,是没有人敢这么做的,因为这个多次调用变成说让大语言模型这么强大的大脑去做一个根据你的 Grip 结果制定下一次 Grip 的搜索方案,那你 Grip 第一次没搜到啊,再去 grip 又搜回来又是没搜到,然后继续你一个简单的问题,你去让它产生好几次的 A API 调用,这个我觉得可能就是当初有一个,我这可能瞎说吧 M A U。
1. 直觉化的表层方法下,藏着填补空白的学术突破:你觉得“按问题复杂度调整思考量”很直觉,但此前学界和业界都只停留在“控制推理长度”的零散尝试,比如OpenAI o1增加推理计算量、部分模型用强化学习优化推理,但都没有形成系统理论。而这篇论文的核心贡献是首次把这种直觉转化为形式化的推理定律,还配套了LORE - BENCH评测基准。这种“把模糊直觉变成可量化、可验证的学术体系”的操作,正是学术研究的关键价值,绝非浅层思路。