Rico AI学习笔记
文章 作品集 关于
EN 登录
  • “Harness 工程体系:给 AI 搭一套生产可用的工程系统”

    2026年5月14日 AgentAIAI编程Harness-EngineeringOpenSpec工程实践

    AI摘要为AI编程构建工程化运行时环境Harness,通过约束输入、Agent执行、反馈验证、经验沉淀形成闭环。提出六层架构,强调人机共用基线门禁与契约约束,由唯一Orchestrator统一调度专家Agent,确保代码生产可控、可演进。

  • “SparkCanvas Pro:从零搭建丐版 NanoBanana AI 绘图节点(二)”

    2026年5月9日 AI绘图AnimeSegComfy-CozyComfyUIControlNetLLM-AgentvLLM

    AI摘要SparkCanvas Pro节点用LLM agent直接驱动ComfyUI,实现自主规划、执行与验证。通过双实例避免死锁,结合Comfy-Cozy四阶段循环和知识库扩展,让agent灵活调用工作流并自我修正。主要挑战是静默失败的调试。

  • SparkCanvas:从零搭建丐版 NanoBanana AI 绘图节点(一)

    2026年4月26日 AI绘图AnimeSegComfyUIControlNetLLMStable-DiffusionvLLM

    AI摘要SparkCanvas 是一个 ComfyUI 自定义节点,通过"LLM 决策 + 代码组装"架构实现自然语言驱动 AI 绘图。用户输入一句话,本地部署的 Qwen3.6-VL 多模态模型自动规划生成模式(txt2img/img2img/ControlNet/角色替换/局部重绘)、生成 danbooru tags 并输出轻量 JSON,Python 代码根据预定义分支自动组装 ComfyUI 节点链路完成生图,无需手动连线。核心创新在于限制 LLM 只做"选择题"和"填空题"而非生成完整工作流,使 7B 本地模型即可胜任,并集成 AnimeSeg DINOv2 实现二次元 13 类语义分割自动 mask。

  • NVIDIA DGX Spark 部署 Qwen3.5-35B 踩坑记录

    2026年4月24日 DGX-SparkDockerFP8NVIDIAQwenvLLM部署

    AI摘要在NVIDIA DGX Spark(128GB统一内存)上部署Qwen3.5-35B-A3B时,BF16原版因torch.compile内存峰值不可控而OOM,最终采用FP8量化版(35GB)结合`--enforce-eager`跳过CUDA graph capture,并以Docker方案解决cu12/cu13库混装问题。关键教训:统一内存架构需预留充足余量,避免torch.compile;推荐vLLM社区nightly镜像而非滞后官方镜像,并配置内存看门狗防止系统卡死。

  • Obsidian 自动发布到 WordPress 工作流

    2026年4月23日 MarkdownObsidianWordPress工作流自动化

    AI摘要本文介绍了一套将 Obsidian Vault 自动发布到 WordPress 的工作流。核心架构为:Obsidian 本地写作后,通过轻量 HTTP API(Vault Sync Server)暴露文件,再由自研 WordPress 插件(QNTLab Vault)浏览预览并一键导入草稿,数据库保存原始 Markdown,前端用 Parsedown 实时渲染,并可选调用 Kimi AI 生成摘要。整套方案避免了手动复制粘贴,保留 Markdown 格式,支持代码块与数学公式。

  • 长视频知识点提取总结(LLM API + 本地预处理版)

    2026年4月22日 AI工作流自动化视频提取

    AI摘要本文介绍一套超长知识分享直播的自动化知识点提取方案,采用"本地轻量预处理+Dify纯编排+云端AI API"三层架构。核心约束为原视频不上传(10GB压缩至100MB)、本地零模型部署、仅运行传统图像处理算法。本地层通过FFmpeg抽音频、PySceneDetect检测关键帧、ImageHash去重等CPU纯算法处理,上传产物后触发Dify工作流;Dify层负责JSON数据编排与多模态AI API并行调用;云端层集成ASR、视觉理解、大语言模型等服务,实现音频与视觉双通道并行处理,全程保留时间戳,最终输出带视频定位与PPT截图的知识点笔记。

  • Harness-Engineering入门

    2026年4月22日 AI CodingHarness

    AI摘要Harness Engineering 是一套让 AI 稳定、可约束、可校验地干活的工程系统,核心论点是不让 AI 更聪明,而是让 AI 更可靠。它由六个逐层叠加的零件组成:SPEC(设计规格文档)、Rule(底线红线)、Skill(标准操作手册)、Sub Agent(专业角色分工)、Workflow(流程规则)和 Scripts(硬约束门禁)。文章建议从零搭建时先写 SPEC 明确边界,再逐步添加 Rule 和 Skill,复杂任务再引入多 Agent 和 Workflow,避免一次搭齐。

标签筛选
全部 vLLM 3ComfyUI 2AI 2ControlNet 2工作流 2AnimeSeg 2自动化 2AI绘图 2Harness-Engineering 1LLM 1LLM-Agent 1Comfy-Cozy 1部署 1AI编程 1Agent 1工程实践 1OpenSpec 1Stable-Diffusion 1视频提取 1AI Coding 1Docker 1FP8 1Qwen 1DGX-Spark 1NVIDIA 1Markdown 1WordPress 1Obsidian 1Harness 1
© 2026 Rico AI学习笔记 蜀ICP备2026019244号