这个 MediaPipe 是一个什么样的软件?它跟 OpenCV 是相似的吗?是什么语言开发的?这个开源吗?它是什么特点?跟 OpenCV 相比怎么样?
我觉得鼠标的识别对于这个 MediaPipe 来说是有点大材小用了。 MediaPipe 这种模型的话,它应该是消耗的资源计算量还是挺大的。 OpenCV 识别鼠标的话应该是相当容易的,因为它是个固定形状嘛,是不是?这个比对啊,识别这个是应该不成问题的一件事情,对不对?
导出时间:2026/5/19 09:35:49
来源地址:https://www.doubao.com/chat/38419813828489474
消息数量:8
cv2.VideoCapture(0) 是读摄像头;pip install mss numpy opencv-python
import mss
import cv2
import numpy as np
with mss.mss() as sct:
monitor = sct.monitors[1]
while True:
img = sct.grab(monitor)
frame = np.array(img)
frame = cv2.cvtColor(frame, cv2.COLOR_BGRA2BGR)
cv2.imshow("Screen", frame)
if cv2.waitKey(1) & 0xFF == ord("q"):
break
cv2.destroyAllWindows()
pip install pyscreenshot pillow
x11grab 模块,读取 Xorg 桌面帧缓存;pipewire 投屏录制,需要系统授权;ffmpeg -f x11grab -i :0.0 -r 1 output_%04d.jpg
-r 1 就是 1 秒 1 帧;| 方案 | 底层依赖 | 帧率 | 实时性 | 对接 OpenCV | 推荐场景 |
|---|---|---|---|---|---|
| mss | X11 共享内存 | 高 | 极强 | 原生兼容 | 实时画面跟踪、物体 / 鼠标识别 |
| pyscreenshot | 系统像素拷贝 | 中 | 一般 | 简单转换 | 静态比对、低频率测试 |
| FFmpeg | x11grab/pipewire | 可调 | 差(文件中转) | 需读文件 | 抽帧存档、录像,不做实时分析 |
mss + opencv-python;3 用上面 mss 代码实时抓屏,直接做:UART2HID、串口控制鼠标pip install opencv-python mediapipe pyautogui
# 运行 Virtual-Mouse 项目