围棋棋谱软件第一步难题与多模态解决方案

导出时间:2026/5/19 08:44:08

来源地址:https://www.doubao.com/chat/38423122306019074

消息数量:2

我刚刚又想起另一件往事,就是前,去年还是前年,我曾经花了很长时间想去写一个很简单的工具,就是这种围棋棋谱软件。就是围棋他们有一个就是等于是想要去记这个围棋的棋谱。那这个工作我花了好长时间去用 OpenClaw 去去调试这些东西。后期其实做了一个雏形出来,花了很多工作。但是其实就是卡在第一步,就是第一步的那个,就是 calibration 或者说是什么呢?就是第一步就是我要去先把这个围棋的棋盘,以及这个棋子进行一个基本的校对。就什么意思呢?就说我现在有,就是要去实现一个最简单的,就是 Detect board corner,就是说把这个围棋的棋盘的四个角给我。提取出来。这个看似简单,实际上相当困难。我当时花了很多精力去做这个事情,但现在回头看起来,似乎这个工作我可以去让人工智能,就多模态模型去帮我去做这个事情。就只要这第一步做成了以后,我后面其实都容易做了。因为只要把这个四个角和以以及围棋的棋子的这个颜色,就是那个它有很多哑光啊什么之类的这些,就是说等于是第一步识别出来以后,其实后面其实都容易了。所以我在想说,如果我把这第一步让云端大模型或者说什么大模型去识别出来之后,我后面就迎刃而解了。我其实就是第一步解决不好。

核心直剖

1. 你当年卡死的本质:纯 OpenClaw 视觉传统 CV,硬啃棋盘四角标定 + 棋子光影哑光畸变,传统边缘检测、霍夫变换抗干扰极差,反光、木纹、角度、棋子阴影直接崩,纯手写规则工程量爆炸。2. 全流程难点只在前置标定:四角透视矫正、棋盘网格归一、棋子明暗哑光区分,这一步是全局瓶颈。3. 多模态直接抹平你的死坑:不用手写任何轮廓、阈值、透视算法,模型原生懂棋盘结构、光影畸变、棋子色差。

极简落地方案

1. 丢图给多模态:只下发指令识别围棋盘四个精准角点、自动透视拉正、区分黑白棋子哑光反光、输出规整网格坐标。2. 模型只干你当年卡死的第一步:四角定位→透视矫正→网格对齐→棋子像素分类。3. 后续全接你原有逻辑:矫正后的标准棋盘,落子顺序、棋谱记录、推演,全部沿用,零重构。

为什么当年难现在极简

- 传统 CV:靠人为写死特征,一点光影角度变化全部失效,反复调参校准。- 多模态:天生认知棋盘拓扑,无视反光、木纹、倾斜、阴影,直接输出标准化坐标。

一句话结论

你当年耗巨量精力的标定校准,是传统 CV 的硬短板;交给多模态只做前置识别,瓶颈直接消失,后续棋谱逻辑全通。