[智能体-493]:Coze 工作流:图文生成视频完整流程拆解
这是一套从主题输入→生成绘图提示词→生成参考图→生成分镜脚本→生成动态视频的线性自动化工作流共 5 个节点串联执行全程无分支顺序执行。一、节点顺序与数据流转总览流程链路开始 → 图片提示词大模型节点 → 图像生成节点 → 视频脚本生成大模型节点 → 视频生成节点 → 结束1. 【开始】入口节点输入变量str_zhuti文本主题示例输入美女漫步街头image可选上传原图素材作用接收用户原始输入向下游传递主题文本作为整条工作流的数据源起点。2. 【图片提示词】LLM 大模型节点豆包 1.6 深度思考输入上游传来str_zhuti主题文字输出两个变量str_tishici适配 AI 绘图的专业正向提示词str_reasoning_content生成提示词的思考过程逻辑大模型根据用户主题自动扩写画质、光影、构图、风格等专业绘图关键词给下一阶段绘图使用。运行耗时12s3. 【图像生成】绘图节点通用 - Pro 绘图模型输入上一步输出的str_tishici绘图提示词输出data生成后的图片二进制 / 图片链接作为后续视频的参考底图str_msg绘图执行日志信息逻辑AI 根据扩写好的提示词生成一张静态参考图作为视频画面基底界面自带「图片预览 / 保存图片」功能。运行耗时7s4. 【视频脚本生成】LLM 大模型节点豆包 1.6 深度思考输入上一步绘图产出的data参考图 原始主题输出str_jiaoben完整视频分镜脚本镜头运镜、时长、画面动作、镜头切换描述str_reasoning_content脚本生成推理过程逻辑结合静态参考图画面内容拆分多段动态镜头文案指导视频生成模型做画面动态、运镜、节奏。运行耗时19s5. 【视频生成】视频生成节点doubao-seedance-tie 动态视频模型输入两个核心参数data前面生成的静态参考图参考图片str_jiaoben上一步产出的视频分镜脚本输出video最终生成的动态视频资源str_msg视频生成日志逻辑以静态图为基底按脚本描述添加人物动作、镜头推拉、画面流动生成短视频。运行耗时23s6. 【结束】输出节点输入上游视频节点产出的video、主题等数据输出类型返回变量对外输出成品视频文件 / 链接完成整条链路。二、整套流程核心逻辑总结文本扩图用户简单主题 → AI 扩写专业绘图词 → 生成静态参考图图生分镜参考图 主题 → AI 拆解视频镜头脚本图 脚本生视频静态底图 镜头动作脚本 → 驱动视频模型生成动态短片全链路自动化串联无需人工干预每一步输入一句主题即可全自动出成片。三、变量传递对照表表格当前节点输入变量来源输出变量下游接收用途开始用户输入str_zhuti、image提示词节点图片提示词开始节点 str_zhutistr_tishici、reasoning_content图像生成节点绘图输入图像生成提示词 str_tishicidata (图片)、str_msg脚本节点做画面参考视频脚本生成图像节点 data 图片str_jiaoben (脚本)、reasoning_content视频生成节点运镜指令视频生成data 图片 str_jiaoben 脚本video 成品、str_msg结束节点对外返回

相关新闻

DeepSeek-V4全栈Infra重构:从显存管理到RDMA直通的七层架构解析

DeepSeek-V4全栈Infra重构:从显存管理到RDMA直通的七层架构解析

1. 项目概述:这不是一次常规升级,而是一次基础设施级的“重铸”DeepSeek-V4 技术报告里反复出现的“全栈重构”四个字,绝不是市场部写的漂亮话。我拆过三版DeepSeek的模型权重、搭过五套不同规模的推理服务集群、也踩过Infra层从K8s调度到GPU…

2026/6/22 10:12:50阅读更多 →
现代化RL Infra:面向Agentic工作负载的四层原生架构

现代化RL Infra:面向Agentic工作负载的四层原生架构

1. 这不是“加个RL模块”就能解决的问题:现代Agent对RL Infra的真实诉求你有没有试过在本地跑一个带强化学习的Agent?比如让一个任务规划Agent在复杂工作流中自主决策,或者让一个多智能体协作系统在动态环境中持续优化协作策略。一开始信心满…

2026/6/22 10:07:48阅读更多 →
九大网盘直链下载助手:告别限速困扰,实现高速下载自由

九大网盘直链下载助手:告别限速困扰,实现高速下载自由

九大网盘直链下载助手:告别限速困扰,实现高速下载自由 【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ,支持 百度网盘 / 阿里云盘 / 中国移动…

2026/6/22 10:07:48阅读更多 →
Ubuntu 16.04下Percona XtraBackup生产级部署与增量备份实战

Ubuntu 16.04下Percona XtraBackup生产级部署与增量备份实战

1. 项目概述:为什么XtraBackup是MySQL生产环境备份的“隐形脊梁”在Ubuntu 16.04上配置MySQL备份,很多人第一反应是mysqldump——简单、自带、命令行敲几下就完事。但我在给三家电商客户做数据库运维时发现,一旦单表超过2GB,或者业…

2026/6/22 11:33:25阅读更多 →
DS4 Flash本地AI范式:2/8bit量化+Vector Steering+Flash内存架构

DS4 Flash本地AI范式:2/8bit量化+Vector Steering+Flash内存架构

1. 项目概述:这不是一个“模型评测”,而是一次本地AI体验的范式迁移你点开这个标题,大概率是被“antirez”“DS4”“Deepseek V4 Flash”这几个词组合击中了——它们像一串加密密钥,精准对应着过去半年里本地AI圈最躁动的神经末梢…

2026/6/22 11:33:25阅读更多 →
基于双模态AI与可解释技术的肺癌诊断系统:从数据融合到临床实践

基于双模态AI与可解释技术的肺癌诊断系统:从数据融合到临床实践

1. 项目概述:当AI学会“看图”又“读片”最近在医疗AI圈子里,一个话题的热度持续攀升:如何让AI的诊断不仅准,还能让医生看懂、信服。我手头正在跟进的一个项目,恰好踩在了这个痛点上——基于双模态AI与可解释技术的肺癌…

2026/6/22 11:33:25阅读更多 →
从脆弱数据主体到脆弱化数据实践:AI伦理的技术反思与加固

从脆弱数据主体到脆弱化数据实践:AI伦理的技术反思与加固

1. 项目概述:当技术实践开始审视自身最近和几个做数据产品的老朋友聊天,大家不约而同地提到一个词:“如履薄冰”。这种感觉,不再是早期那种对技术不确定性的担忧,而是一种更深层的、源于实践本身的反思。我们讨论的焦点…

2026/6/22 11:33:25阅读更多 →
Windows 11 LTSC微软商店安装指南:轻松恢复应用生态的完整方案

Windows 11 LTSC微软商店安装指南:轻松恢复应用生态的完整方案

Windows 11 LTSC微软商店安装指南:轻松恢复应用生态的完整方案 【免费下载链接】LTSC-Add-MicrosoftStore Add Windows Store to Windows 11 24H2 LTSC 项目地址: https://gitcode.com/gh_mirrors/ltscad/LTSC-Add-MicrosoftStore 你是否正在使用Windows 11 …

2026/6/22 11:33:25阅读更多 →
DeepSeek-V3工程实践:MoE架构、FP8训练与all-to-all通信全解析

DeepSeek-V3工程实践:MoE架构、FP8训练与all-to-all通信全解析

1. 这不是一份普通的技术报告,而是一份“大模型工程学”的实战教科书如果你最近刷到过“DeepSeek-V3”这个词,大概率是在技术社区看到一句惊叹:“671B参数,37B激活,14.8T训练token,FP8训练,MoE全…

2026/6/22 11:28:23阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/22 6:01:42阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/22 1:15:34阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/22 5:42:46阅读更多 →
Codex本地AI编码代理与CC Switch协议适配实战

Codex本地AI编码代理与CC Switch协议适配实战

1. Codex不是“另一个VS Code插件”,而是本地AI编码代理的临界点Codex这个名字,现在被太多人误读了。它不是ChatGPT那个早已停更的旧模型代号,也不是某个新出的VS Code扩展图标——它是2024年中后期悄然浮出水面的一类本地化AI编码代理&#…

2026/6/22 0:04:18阅读更多 →
从MSP430到Flexis QE128:8/32位MCU无缝迁移与低功耗设计实战

从MSP430到Flexis QE128:8/32位MCU无缝迁移与低功耗设计实战

1. 项目概述:当8位MCU遇到性能瓶颈,我们如何优雅升级?在嵌入式开发领域,尤其是电池供电的便携式设备、工业传感器节点或智能家居终端中,我们常常面临一个经典的两难选择:是选择功耗极低但性能有限的8位微控…

2026/6/22 0:04:18阅读更多 →
大语言模型空间推理能力提升:TEXT2SPACE数据集与ASCII增强技术解析

大语言模型空间推理能力提升:TEXT2SPACE数据集与ASCII增强技术解析

1. 项目缘起:当大语言模型“看”不懂空间 最近在折腾大语言模型(LLM)的各种应用时,我发现一个挺有意思的现象:你让模型写首诗、写代码、甚至做逻辑推理,它可能都表现得有模有样。但一旦涉及到需要理解“空间…

2026/6/22 0:04:18阅读更多 →