Rico AI学习笔记 – 技术分享空间

“Harness 工程体系：给 AI 搭一套生产可用的工程系统”

2026年5月14日 Agent AI AI编程 Harness-Engineering OpenSpec 工程实践

AI摘要为AI编程构建工程化运行时环境Harness，通过约束输入、Agent执行、反馈验证、经验沉淀形成闭环。提出六层架构，强调人机共用基线门禁与契约约束，由唯一Orchestrator统一调度专家Agent，确保代码生产可控、可演进。

“SparkCanvas Pro：从零搭建丐版 NanoBanana AI 绘图节点（二）”

2026年5月9日 AI绘图 AnimeSeg Comfy-Cozy ComfyUI ControlNet LLM-Agent vLLM

AI摘要SparkCanvas Pro节点用LLM agent直接驱动ComfyUI，实现自主规划、执行与验证。通过双实例避免死锁，结合Comfy-Cozy四阶段循环和知识库扩展，让agent灵活调用工作流并自我修正。主要挑战是静默失败的调试。

SparkCanvas：从零搭建丐版 NanoBanana AI 绘图节点（一）

2026年4月26日 AI绘图 AnimeSeg ComfyUI ControlNet LLM Stable-Diffusion vLLM

AI摘要SparkCanvas 是一个 ComfyUI 自定义节点，通过"LLM 决策 + 代码组装"架构实现自然语言驱动 AI 绘图。用户输入一句话，本地部署的 Qwen3.6-VL 多模态模型自动规划生成模式（txt2img/img2img/ControlNet/角色替换/局部重绘）、生成 danbooru tags 并输出轻量 JSON，Python 代码根据预定义分支自动组装 ComfyUI 节点链路完成生图，无需手动连线。核心创新在于限制 LLM 只做"选择题"和"填空题"而非生成完整工作流，使 7B 本地模型即可胜任，并集成 AnimeSeg DINOv2 实现二次元 13 类语义分割自动 mask。

NVIDIA DGX Spark 部署 Qwen3.5-35B 踩坑记录

2026年4月24日 DGX-Spark Docker FP8 NVIDIA Qwen vLLM 部署

AI摘要在NVIDIA DGX Spark（128GB统一内存）上部署Qwen3.5-35B-A3B时，BF16原版因torch.compile内存峰值不可控而OOM，最终采用FP8量化版（35GB）结合`--enforce-eager`跳过CUDA graph capture，并以Docker方案解决cu12/cu13库混装问题。关键教训：统一内存架构需预留充足余量，避免torch.compile；推荐vLLM社区nightly镜像而非滞后官方镜像，并配置内存看门狗防止系统卡死。

Obsidian 自动发布到 WordPress 工作流

2026年4月23日 Markdown Obsidian WordPress 工作流自动化

AI摘要本文介绍了一套将 Obsidian Vault 自动发布到 WordPress 的工作流。核心架构为：Obsidian 本地写作后，通过轻量 HTTP API（Vault Sync Server）暴露文件，再由自研 WordPress 插件（QNTLab Vault）浏览预览并一键导入草稿，数据库保存原始 Markdown，前端用 Parsedown 实时渲染，并可选调用 Kimi AI 生成摘要。整套方案避免了手动复制粘贴，保留 Markdown 格式，支持代码块与数学公式。

长视频知识点提取总结（LLM API + 本地预处理版）

2026年4月22日 AI 工作流自动化视频提取

AI摘要本文介绍一套超长知识分享直播的自动化知识点提取方案，采用"本地轻量预处理+Dify纯编排+云端AI API"三层架构。核心约束为原视频不上传（10GB压缩至100MB）、本地零模型部署、仅运行传统图像处理算法。本地层通过FFmpeg抽音频、PySceneDetect检测关键帧、ImageHash去重等CPU纯算法处理，上传产物后触发Dify工作流；Dify层负责JSON数据编排与多模态AI API并行调用；云端层集成ASR、视觉理解、大语言模型等服务，实现音频与视觉双通道并行处理，全程保留时间戳，最终输出带视频定位与PPT截图的知识点笔记。

Harness-Engineering入门

2026年4月22日 AI Coding Harness

AI摘要Harness Engineering 是一套让 AI 稳定、可约束、可校验地干活的工程系统，核心论点是不让 AI 更聪明，而是让 AI 更可靠。它由六个逐层叠加的零件组成：SPEC（设计规格文档）、Rule（底线红线）、Skill（标准操作手册）、Sub Agent（专业角色分工）、Workflow（流程规则）和 Scripts（硬约束门禁）。文章建议从零搭建时先写 SPEC 明确边界，再逐步添加 Rule 和 Skill，复杂任务再引入多 Agent 和 Workflow，避免一次搭齐。