WorkBuddy + 本地 ComfyUI 完全使用手册：从出图到视频生成-拓冰网站优化

WorkBuddy 本地 ComfyUI 完全使用手册从出图到视频生成在本地 MCP 链路跑通后WorkBuddy 能做什么怎么做本文用真实测试案例告诉你——从文生图、文生视频到工作流调用、多阶段管道每个场景都有可直接复制的提示词和参数。本系列持续更新中……Comfy MCP 公测把 Claude、Cursor、CodeX、Hermes 和 WorkBuddy 变成你的创意技术专家Comfy Cloud MCP Server 抢先体验申请图文教程QClaw 配置 Comfy Cloud MCP只需简单几步WorkBuddy 接入 Comfy Cloud MCP 完整实录从 DNS 污染到 31 个工具全部启用WorkBuddy 本地 Comfy MCP 实战用自然语言调生成你的第一张 AI 图片WorkBuddy 连接本地 ComfyUI从零到出图的保姆级教程WorkBuddy 本地 ComfyUI Wan2.1 文生视频实战从连续报错到成功出片的完整踩坑记录目录一、能力总览二、使用前的准备三、场景一文生图SDXL四、场景二文生视频Wan2.1 t2v五、场景三调用已有工作流六、场景四多阶段管道七、场景五图生视频Wan2.2 Animate八、自然语言指令速查表九、参数调优指南十、常见问题与避坑十一、视频生成工作流 JSON 模板一、能力总览WorkBuddy 连接本地 ComfyUI 后你拥有以下能力能力说明典型耗时文生图文字描述 → 图片SDXL/SD3.5/Flux 等8-30 秒文生视频文字描述 → 视频Wan2.1 t2v2-5 分钟图生视频图片提示词 → 视频Wan2.2 Animate5-15 分钟图片放大ESRGAN 超分辨率2x/4x5-15 秒背景移除BiRefNet 智能抠图10-30 秒工作流调用加载已保存的工作流并执行取决于工作流工作流分析可视化工作流结构即时模型管理列出/搜索本地模型即时硬件基础RTX 3090 24GB 320 个自定义节点 57 个 checkpoint 177 个 LoRA 45 个 ControlNet二、使用前的准备2.1 确保两个进程都在运行bash# 终端 1启动 ComfyUI保持窗口开着 cd H:\PythonProjects3\Win_ComfyUI python main.py --enable-manager --enable-assets --enable-triton-backend --async-offload --use-flash-attention --enable-dynamic-vram # 终端 2启动 MCP 服务器保持窗口开着 npx -y comfyui-mcp --http --port 91002.2 在 WorkBuddy 中确认连接器状态打开 WorkBuddy → 右上角连接器管理comfyui-local开关应为绿色已信任显示 113 个工具已启用2.3 验证连接直接对 WorkBuddy 说检查一下本地 ComfyUI 的系统状态WorkBuddy 会调用get_system_stats工具返回 GPU 型号、显存、队列状态等信息。三、场景一文生图SDXL3.1 基本用法直接用自然语言告诉 WorkBuddy用本地 ComfyUI 生成一张赛博朋克城市的图片霓虹灯雨天1024x10243.2 推荐参数组合风格模型采样器步数CFG调度器快速测试sdxl_lightning_4stepeuler41.0normal标准生成sd_xl_base_1.0dpmpp_2m207.5karras高质量sd_xl_base_1.0dpmpp_2m_sde307.0karras动漫风格你的动漫 SDXL 模型euler_ancestral257.0normal3.3 实测案例提示词masterpiece, best quality, a red vintage sports car parked on a coastal highway at sunset, ocean waves in background, golden hour lighting, cinematic, highly detailed, 8k uhd参数sd_xl_base_1.0 / dpmpp_2m / karras / 20 步 / CFG 7.5 / 1024x1024结果8 秒出图质量清晰3.4 ⚠️ Lightning 模型避坑SDXL Lightning 4-step 模型必须使用以下参数否则出白图采样器euler不是 dpmpp_2m_sde 调度器normal不是 karras CFG1.0不是 7.5 步数4四、场景二文生视频Wan2.1 t2v4.1 基本信息项目值模型wan2.1_t2v_1.3B_fp16.safetensors文本编码器UMT5-XXL bf16VAEWan2_1_VAE_bf16.safetensors默认分辨率832×480默认帧数81 帧 20fps ≈ 4 秒采样步数20 步RTX 3090 生成时间约 3 分钟4.2 使用方法直接告诉 WorkBuddy用 Wan 生成一段猫咪追球的 4 秒视频或者更具体用本地 ComfyUI 的 Wan2.1 t2v 模型生成一段 4 秒视频一只橘猫在花园里追红色小球阳光明媚动态运动832x480 分辨率4.3 实测案例提示词a cute orange cat chasing a red ball across a green garden lawn, running playfully, dynamic motion, sunny day, vivid colors, 4k, high quality负面提示词low quality, blurry, deformed, ugly, watermark, text, static, no motion, worst quality, jpeg artifacts参数分辨率832×480帧数81 20fps ~4 秒采样器euler步数20CFG3.5Shift5.0Seed42结果174 秒生成输出 MP4 文件 1.3MB4.4 视频参数调整需求修改更长视频num_frames改为 1216 秒/ 1618 秒帧数必须是 4 的倍数1更高分辨率width/height改为 1280×720显存需求大增更快生成steps改为 15质量略降更高质量steps改为 30时间翻倍不同风格修改positive_prompt固定种子保持seed不变可复现结果4.5 工作流节点结构LoadWanVideoT5TextEncoder ──→ WanVideoTextEncode ──→ WanVideoSampler ──→ WanVideoDecode ──→ VHS_VideoCombine ↑ ↑ WanVideoModelLoader ─────────────────────────────────┘ │ WanVideoEmptyEmbeds ─────────────────────────────────→ ┘ │ WanVideoVAELoader ──────────────────────────────────────────────────────→┘节点说明节点作用关键参数LoadWanVideoT5TextEncoder加载 UMT5-XXL 文本编码器model_name, precision, load_deviceWanVideoModelLoader加载视频扩散模型model, base_precision, quantizationWanVideoTextEncode编码文本提示词positive_prompt, negative_promptWanVideoEmptyEmbeds创建空图像嵌入文生视频用width, height, num_framesWanVideoVAELoader加载 VAE 解码器model_name, precisionWanVideoSampler核心采样器steps, cfg, shift, seed, schedulerWanVideoDecode将潜空间解码为视频帧enable_vae_tiling, tile_x/yVHS_VideoCombine合成视频文件frame_rate, format五、场景三调用已有工作流5.1 查看已有工作流你本地保存了 68 个工作流。告诉 WorkBuddy列出我本地 ComfyUI 的所有视频相关工作流5.2 可用工作流示例工作流文件功能video_wan2_2_14B_animate.jsonWan2.2 动作迁移视频Wan-Animate【动作迁移】换人-高质量高细节.json高质量换人动画Kandinsky 5.0 Video Lite 图生视频video_kandinsky5_i2v.jsonKandinsky 图生视频image_qwen_image_edit_2509.json千问图片编辑flux_kontext_dev_basic.jsonFlux 上下文编辑whisper_video_subtitles_workflow.json视频自动字幕扩图flux_fill_outpaint.json图片扩边5.3 调用方式运行我的 Wan2.2 Animate 工作流用这张图片作为输入WorkBuddy 会list_workflows— 找到工作流analyze_workflow— 分析参数需求提示你提供必要输入如参考图片、提示词enqueue_workflow— 提交执行轮询等待完成六、场景四多阶段管道6.1 概念把多个生成阶段串起来前一步的输出作为后一步的输入。6.2 示例管道生成一只猫的图 → 放大 4 倍 → 抠去背景WorkBuddy 会编排阶段 1: generate_image(a cute cat) → output/cat.png ↓ 阶段 2: upscale_image(cat.png, scale4) → output/cat_4x.png ↓ 阶段 3: remove_background(cat_4x.png) → output/cat_cutout.png6.3 更复杂的管道生成一只猫 → 用 Wan2.2 Animate 做成视频 → 加上字幕阶段 1: generate_image → cat.png 阶段 2: animate_image(cat.png) → cat.mp4 阶段 3: add_subtitles(cat.mp4, A cat playing) → cat_subtitled.mp4七、场景五图生视频Wan2.2 Animate7.1 前提条件你有以下 Wan2.2 模型Wan2_2-Animate-14B_fp8_e4m3fn_scaled_KJ.safetensors— 动作迁移Wan2.2-Animate-14B-Q4_K_S.gguf— GGUF 量化版Wan2.2-Fun-A14B-Control_HighNoise/LowNoise-Q5_K_S.gguf— 控制生成7.2 使用方式Wan2.2 Animate 需要参考视频来提取动作然后将动作迁移到新生成的角色上。用 Wan2.2 Animate 把这个跳舞视频的动作迁移到一只猫身上7.3 注意事项Wan2.2 Animate 是 14B 模型RTX 3090 24GB 需要使用 block swap建议使用 GGUF 量化版Q4_K_S以减少显存占用参考视频建议 5-10 秒分辨率不超过 720p生成时间约 10-30 分钟取决于帧数和分辨率八、自然语言指令速查表8.1 图片生成说法WorkBuddy 会做什么生成一张[描述]的图片选择合适模型构建 txt2img 工作流用 SDXL 生成[描述]1024x1024指定模型和分辨率用 Flux 生成[描述]切换到 Flux 模型换一个种子重新生成修改 seed 值重新提交把这张图放大 4 倍使用 ESRGAN 放大去掉这张图的背景使用 BiRefNet 抠图8.2 视频生成说法WorkBuddy 会做什么用 Wan 生成一段[描述]的 4 秒视频构建 Wan2.1 t2v 工作流生成一段更长的视频8 秒增加 num_frames 到 161提高视频分辨率到 720p修改 width/height用我的 Wan2.2 Animate 工作流加载已有工作流执行8.3 工作流操作说法WorkBuddy 会做什么列出我的所有工作流调用 list_workflows分析我的换头工作流调用 analyze_workflow 可视化检查这个工作流用的模型分析节点参数修改这个工作流的采样步数为 30调用 modify_workflow8.4 系统管理说法WorkBuddy 会做什么检查 ComfyUI 状态调用 get_system_stats查看当前队列调用 get_queue列出本地所有模型调用 list_local_models取消正在运行的任务调用 cancel_job九、参数调优指南9.1 图片生成参数参数作用推荐值steps采样步数越多越精细但越慢20-30标准/ 4Lightningcfg提示词权重越高越忠实提示词7-8标准/ 1.0Lightningsampler_name采样算法dpmpp_2m通用/ eulerLightningscheduler噪声调度karras通用/ normalLightningseed随机种子任意整数固定可复现denoise去噪强度1.0完整生成/ 0.3-0.7图生图9.2 视频生成参数参数作用推荐值num_frames视频帧数4n1814秒/ 1216秒/ 1618秒frame_rate帧率16-24width/height分辨率832×480快速/ 1280×720高清steps采样步数15-25cfg提示词权重3.0-5.0shift噪声偏移3.0-7.0scheduler采样器euler / unipc9.3 显存优化RTX 3090 24GB 的显存管理策略策略设置适用场景T5 编码器卸载load_device: offload_device所有视频生成VAE 分块解码enable_vae_tiling: True高分辨率视频Block Swapblocks_to_swap: 20-3514B 大模型模型精度bf16或fp8_e4m3fn大模型省显存force_offloadTrue采样后释放显存十、常见问题与避坑10.1 视频生成相关Q: T5 编码器报错 fp8 scaled is not supportedA:LoadWanVideoT5TextEncoder不支持 fp8 scaled 模型。使用 bf16 版本的 UMT5-XXL。Q: VAE 加载报错 missing precision argumentA:WanVideoVAELoader必须显式提供precision参数如bf16即使文档标记为 Optional。Q: 生成时间太长A: 1.3B 模型 81 帧 20 步约 3 分钟。如需更快减少步数到 15、降低分辨率到 832×480、减少帧数到 65。Q: 视频质量模糊A: 增加 steps 到 25-30提高 CFG 到 4.0-5.0使用更好的提示词描述。10.2 图片生成相关Q: Lightning 模型出白图A: 必须用euler normal CFG 1.0 4 steps。不能用 dpmpp_2m_sde 或 karras。Q: 中文提示词效果差A: ComfyUI 的 CLIP/T5 编码器主要训练于英文数据。建议用英文提示词。10.3 连接相关Q: WorkBuddy 调用 MCP 工具失败A: 重启 MCP 服务器后WorkBuddy 需要重新连接。去连接器页面关掉再开comfyui-local。Q: EADDRINUSE 端口占用A:netstat -ano | findstr :9100找到 PIDtaskkill /PID PID /F结束再重启。十一、视频生成工作流 JSON 模板以下是实测成功的完整 Wan2.1 t2v 文生视频工作流 JSON可直接通过 ComfyUI API 提交json{ 1: { class_type: LoadWanVideoT5TextEncoder, inputs: { model_name: models_eddy大佬_t5_umt5-xxl-enc-bf16_fully_uncensored.safetensors, precision: bf16, load_device: offload_device } }, 2: { class_type: WanVideoModelLoader, inputs: { model: wan2.1_t2v_1.3B_fp16.safetensors, base_precision: bf16, quantization: disabled, load_device: main_device } }, 3: { class_type: WanVideoTextEncode, inputs: { positive_prompt: YOUR_POSITIVE_PROMPT_HERE, negative_prompt: low quality, blurry, deformed, ugly, watermark, text, static, no motion, worst quality, t5: [1, 0], force_offload: true, model_to_offload: [2, 0] } }, 4: { class_type: WanVideoEmptyEmbeds, inputs: { width: 832, height: 480, num_frames: 81 } }, 5: { class_type: WanVideoVAELoader, inputs: { model_name: Wan2_1_VAE_bf16.safetensors, precision: bf16 } }, 6: { class_type: WanVideoSampler, inputs: { model: [2, 0], image_embeds: [4, 0], text_embeds: [3, 0], steps: 20, cfg: 3.5, shift: 5.0, seed: 42, force_offload: true, scheduler: euler, riflex_freq_index: 0 } }, 7: { class_type: WanVideoDecode, inputs: { vae: [5, 0], samples: [6, 0], enable_vae_tiling: true, tile_x: 256, tile_y: 256, tile_stride_x: 128, tile_stride_y: 128 } }, 8: { class_type: VHS_VideoCombine, inputs: { images: [7, 0], frame_rate: 20, loop_count: 0, filename_prefix: wan_video_output, format: video/h264-mp4, pingpong: false, save_output: true } } }使用方法将YOUR_POSITIVE_PROMPT_HERE替换为你的提示词通过 ComfyUI API 提交POSThttp://127.0.0.1:8188/promptbody 为{prompt: 上述JSON}轮询GEThttp://127.0.0.1:8188/history/{prompt_id} 等待完成完成后视频保存在output/目录附录测试记录汇总测试类型模型参数耗时结果#1文生图sdxl_lightning_4stepdpmpp_2m_sde/karras/CFG1.5/4步8s白图参数错误#2文生图sdxl_lightning_4stepeuler/normal/CFG1.0/4步6s成功偏离提示词#3文生图sd_xl_base_1.0dpmpp_2m/karras/CFG7.5/20步8s成功#4文生视频wan2.1_t2v_1.3Beuler/20步/CFG3.5/81帧174s成功写在最后本地 ComfyUI WorkBuddy 的组合让你在 Claude 封禁中国账号、Comfy Cloud MCP 不可用的情况下依然拥有完整的 AI 图像/视频生成能力。零订阅费、完全离线、全隐私——你的 RTX 3090 就是最好的云端 GPU。

相关新闻

财务章登报遗失声明流程是什么？财务章丢了怎么登报？需要什么资料？

内容摘要：财务章丢了，需要准备营业执照正/副本、法人身份证和授权委托书（线下非法人办理时需要），通过线上登报服务平台或当地报社窗口提交登报，审核缴费后等待见报，并保留好整张报纸原件。本文结…

2026/7/4 0:27:50阅读更多 →

你的Windows个人管家：用Win11Debloat打造专属系统体验

你的Windows个人管家：用Win11Debloat打造专属系统体验【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and cu…

2026/7/4 0:27:50阅读更多 →

开源安全仪表盘：API密钥管理与监控的工程实践

1. 项目概述：为什么技能开发者需要一个安全仪表盘？如果你是一名技能开发者，无论是开发AI应用、构建自动化工作流，还是维护一个微服务架构，你手头大概率攒了一堆API密钥、访问令牌和各种服务的凭证。这些密钥就像你家门…

2026/7/4 0:27:50阅读更多 →

企业短剧制作与私域流量转化实战指南

1. 企业短剧赛道的商业逻辑拆解这两年短视频平台涌现出一批单集1-3分钟、总集数80-100集的竖屏连续剧，单部作品播放量动辄破亿。某服装品牌自制的职场题材短剧，通过小程序投放获客成本比传统信息流降低62%。这种被称为"快餐式内容"的形态&…

2026/7/4 1:53:01阅读更多 →

机器学习模型部署：从Flask到FastAPI的Web API实践

1. 为什么我们需要把机器学习模型变成Web API？去年我帮一家电商客户做商品推荐系统时，遇到一个典型场景：他们的数据科学团队用Python训练了一个效果不错的推荐模型，但前端开发团队却不知道怎么调用这个模型。数据科学家们习惯在Ju…

2026/7/4 1:53:01阅读更多 →

Spring AI集成Chroma向量数据库实战指南

1. Chroma 向量存储实战指南作为一名长期从事AI应用开发的工程师，我最近在多个项目中深度使用了Chroma作为向量存储解决方案。相比其他向量数据库，Chroma以其轻量级、易用性和出色的元数据支持给我留下了深刻印象。今天我就来分享如何在实际Spring AI项目…

2026/7/4 1:53:01阅读更多 →

传统文化文本数据化：先做术语表，再谈模型理解

传统文化文本数据化：先做术语表，再谈模型理解把传统文化文本拿来做 NLP 分析时，最容易犯的错误是直接分词、向量化、聚类，然后解释出一堆玄妙结论。问题是，古文、术语、异体字、注疏体系都很复杂。没有术语表和标注规…

2026/7/4 1:53:01阅读更多 →

HTTP 429状态码在API限流中的实践与优化

1. 为什么API限流需要HTTP 429状态码在传统的企业级开发中，我们经常会看到这样的场景：无论后端发生什么错误，HTTP状态码一律返回200 OK，然后通过JSON响应体中的code或success字段来传递真正的业务状态。这种做法在封闭的内部系统中…

2026/7/4 1:53:01阅读更多 →

NestJS生产部署实战：Docker Compose+MySQL+Redis高可用架构

1. 这不是又一篇“Hello World”教程，而是一份能直接上线的 NestJS 生产部署手册你搜“NestJS 部署教程”，刷出来的十篇里八篇停在npm run start:prod，剩下两篇教你手动拷贝 dist 文件夹到服务器——这根本不是部署，这是给生产环境…

2026/7/4 1:48:01阅读更多 →

管理者的六个层次

2026/7/3 14:38:35阅读更多 →

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/3 14:18:39阅读更多 →

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

引言：审计结束三个月了，审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间，内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中，审计…

2026/7/3 14:38:35阅读更多 →

端到端自动驾驶：从GTC‘26看工程可信落地的核心逻辑

1. 项目概述：当算法工程师走进GTC26展厅，看到的不是芯片，而是“端到端”的呼吸节奏“端到端”这三个字，在GTC’26现场出现的频率，高得像NVLink带宽测试时的峰值曲线——它不再是一个论文里的技术路径选项，而…

2026/7/4 0:02:48阅读更多 →

缺牙修复科普：常见义齿类型与选择参考

缺牙修复科普：常见义齿类型与选择参考牙齿缺失是中老年人群中较为常见的口腔问题，不仅会造成咀嚼不便、进食受影响，长期还可能对营养摄入与日常社交带来困扰。义齿是改善缺牙问题的常用方式，目前市面上的义齿种类较多，…

2026/7/4 0:02:48阅读更多 →

STM32F091RC与LTC6904实现高精度方波信号生成

1. 项目概述：LTC6904与STM32F091RC的精准方波生成方案在嵌入式系统开发中，精确的时钟信号和定时控制往往是项目成败的关键。LTC6904作为一款低功耗、高精度的可编程振荡器芯片，与STM32F091RC这款ARM Cortex-M0内核微控制器的组合，…

2026/7/4 0:02:48阅读更多 →

YOLOv8推理性能优化：从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时，发现推理速度只有可怜的 1-2 FPS，而别人的演示视频却能跑到 30 FPS 以上，那么问题很可能不在模型本身，而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后，会直接使用官方示例…

2026/7/4 1:16:56阅读更多 →

Coze与Dify对比指南：低代码AI应用开发从入门到实战

1. 从零到一：为什么你需要了解 Coze 和 Dify？如果你对 AI 应用开发感兴趣，但一看到“大模型”、“智能体”、“工作流”这些词就头疼，觉得门槛太高，那这篇文章就是为你准备的。很多开发者，包括我自己&#…

2026/7/3 1:36:36阅读更多 →

AI生图工具怎么选？2026年6月版实测对比

做自媒体的朋友应该都有体会：配图一直是个让人头疼的问题。2026年，AI生图工具已经非常成熟了，但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1：速度之王2026年6月11日&#xff0c…

2026/7/3 2:08:15阅读更多 →