保存时间:2026/4/3 19:22:01
在有噪声、有延迟、有变化的真实世界里:鲁棒性 >> 单次精度收敛 > 完美闭环 > 一步到位
本地小模型 + 不准但快 + 高频反馈 + 不断调整正是现在头部团队悄悄在做的下一代实用 AI 架构。
截一帧 → 找鼠标 → 输出坐标 → 等待 → 重复
pip install mss opencv-python numpy
mss:业界最快截图,比截屏、FFmpeg 都轻opencv-python:做鼠标模板匹配numpy:处理图像cursor_template.png关键:模板越小,匹配越快、越准。
track_mouse.py:import cv2
import numpy as np
import mss
import time
# 1. 加载你的鼠标小模板
template = cv2.imread("cursor_template.png", 0)
h, w = template.shape[:2]
# 2. 超快截图工具
sct = mss.mss()
monitor = sct.monitors[1] # 主屏幕
while True:
# 3. 截一帧屏幕(极快)
img = sct.grab(monitor)
frame = np.array(img)
gray = cv2.cvtColor(frame, cv2.COLOR_BGRA2GRAY)
# 4. 找鼠标(传统CV,毫秒级)
res = cv2.matchTemplate(gray, template, cv2.TM_CCOEFF_NORMED)
min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)
# 5. 输出坐标(你的高频反馈)
x, y = max_loc
print(f"鼠标大致坐标:x={x}, y={y}")
# 6. 控制频率:1秒1次(你要的小步快跑)
time.sleep(1)
python track_mouse.py
鼠标大致坐标:x=520, y=315
鼠标大致坐标:x=610, y=340
鼠标大致坐标:x=780, y=380
...