
freebeat Agent 音乐视频教程
如果你会点开 freebeat Agent,通常不是因为你只想随便试一个功能,而是因为它展示了一种很少见的能力:把一首歌从最初方向一路推进到成片级音乐视频,而且速度快、结构清楚、创作控制力很强。这份指南不是为了把按钮逐个翻给你看,而是为了带你按真正可落地的方式走完整个流程。从最初设置到最终 `Merge`,每一个阶段都在决定成片会不会更完整、更有力量、更像一支真正的 MV。按顺序走完,你会明显感觉项目不再只是一个模糊想法,而是在一步步长出节奏、镜头感和作品完成度。
1从 Agent 工作区开始
在你真正创建会话之前,先把路径、歌曲、提示词方向和会话控制项锁好。在 freebeat Agent 里,这些都不是装饰性的输入,而是整条生产链的起点,后面的每一步都会立刻建立在它们之上。
如果你第一次使用这个产品,建议从这里开始切换思维方式。不要把自己当成“试工具的人”,而是把自己当成“正在启动一个作品制作流程的人”。前期设置做得认真,不只是能减少返工,更能让整次运行一开始就有方向感和掌控感。
1.1打开 Agent 入口,并停留在主 MV 路径上
打开 /music-video-generator,第一次正式做项目时,从主 Agent 入口开始。这是 freebeat 最完整、最强、最能体现产品能力的主流程路径。如果你想真正理解这个产品在音乐视频创作上的上限,应该先从这条路走一遍。
在主创建框下面,freebeat 还提供了 Singing MV、Storytelling MV、Abstract MV、Viral Short、OnBeat Effect 和 More 等专项模式。这些模式适合目标已经很明确、范围本身就更窄的任务。但如果你想完整体验“一首歌如何被一路推进成一支完整 MV”,第一次请先留在主路径。

你可以这样理解这些模式标签:
Singing MV:当演唱者必须始终是画面中心时,用这条路更合适。它更适合艺人表演感、口型表现、舞台存在感和人物持续聚焦都很重要的作品。Storytelling MV:当歌曲需要更清晰的叙事推进,而不是只靠氛围带动时,选这条路更合适。它更适合需要起承转合、情节推进和明确叙事弧线的 MV。Abstract MV:当你更在意质感、氛围、节奏和视觉情绪,而不是字面故事时,这条路会更合适。它适合做风格化、沉浸式、审美驱动的作品。Viral Short:当输出目标是短平快、首屏就要抓人、节奏必须收得更紧时,这条路更有效。它更偏向短视频平台上的高冲击成品。OnBeat Effect:当节奏反应、打点力度和运动冲击比完整 MV 世界观更重要时,这条路更合适。它适合节奏驱动型、动效驱动型结果。More:当你已经清楚主流程对这个任务来说过宽,可以从这里进入更多更窄、更专的创作工具。
第一次做项目时,不要因为专项模式听起来很酷就立刻切过去。先让完整的 Agent 主流程把一首歌从概念、结构、图片、片段一路推到合成。你会更快理解这套系统真正的控制力在哪。
推荐这样做先锁定路径,再围绕这条路径去建立概念和素材。
不建议这样做概念已经开始成形后又频繁切换模式,还希望前面的设置仍然完全成立。
1.2加入你真正要围绕它做片子的那首歌
点击 Add Music,把这次要做 MV 的准确音频加入进来。如果你还在探索方向,可以先用内置曲库;如果你已经有最终音频,直接用 Upload music;如果你使用链接,务必确认那就是你要制作的那个正式版本。

- 还在比方向时,用曲库会更快。
- 已经有确定音频时,优先用
Upload music。 - 只有在你非常确认来源和版本时,才使用 URL。
不要把这一步当作“先随便放个占位”。freebeat 读取的不是一段背景音乐,而是歌曲的结构、推进、情绪起伏和节奏骨架。后面再换歌,并不是小修小补,而是会影响后续整条链路的判断逻辑。把歌曲放进去之后,至少完整确认一次。这一步越稳,后面的每一层越容易建立得自然、有力,而不是松散地拼接在一起。
1.3给 Agent 一个真正可执行的起始方向
点击主输入框,给 Agent 一个它真的能据此展开的起始方向。你可以直接描述想做的 MV,也可以留空,让 AI 更多地跟着音乐自己展开。如果你选择写 prompt,请保证它足够明确,能给系统方向,同时又足够干净,不会在后续流程里被自己拖垮。

写出一个强起点,最有效的方法是先回答四个实际问题:
- 观众最该盯住的人或主体是谁?
- 这个 MV 应该属于什么样的世界或场景?
- 整体视觉情绪应该是什么?
- 当音乐打开时,能量应该如何推进?
这里不是比谁写得更像诗,而是建立后续流程可以持续继承的第一个创作命令。比如“银色机车服女主、霓虹雨夜城市、镜面质感特写、前段克制、鼓点打开后前冲感更强”这种输入,系统就能更稳定地理解、保留并继续发展。方向越清楚,后面的步骤越像是在放大创意,而不是替前面的模糊补救。
1.4在锁定会话之前,把创建控制项检查清楚
在你点击 Create 之前,先检查 prompt 下方那一排控制项,并只打开这次真正需要的内容。这里决定的是这次运行的边界条件:主体设置、输出比例、输出质量,以及会影响整次运行行为的关键开关。

建议这样理解这些控制项:
Character:如果你想在规划开始之前就先种下明确主角,从这里进入。- 比例,例如
16:9:先想清楚作品最终投放到哪里,再选画幅。 - 分辨率,例如
720p:按这次会话真正的目标来设置输出等级。 Style:当你想在分析开始前就偏向某种审美路线时使用。Captions和Remove watermark:Captions对应字幕选择;同时也在这里判断这次是否在意去水印。Fast或Expert:Fast是更偏速度的快速模式,Expert是更偏细致判断的专家模式。Auto和Public:Auto表示完全自动模式;Public决定这次运行是否对外可见。
这排控制项重要,是因为它们一旦开始运行,就会变成真正的制作约束。如果这只是一个快速试方向的版本,就优先为速度服务;如果这是第一次认真版本,就把它按你愿意保留的方式设好。很多人真正开始感受到 freebeat Agent 的“制作感”,就是从这一排控制项开始的。
1.5创建会话
点击 Create,看一眼确认弹窗。如果还有任何会被锁住的设置不对,现在就停下。继续之后,像比例和分辨率这样的关键项目会直接锁定进这次会话。

把这个弹窗当成一次起飞前检查。如果设置仍然不对,立刻返回去修。如果都对,再点击 Continue,让 freebeat 正式从准备阶段进入执行阶段。这一刻之后,前面的输入就不再是假设,而会开始成为一条真实运行中的创作流程。
推荐这样做把这个弹窗当成最后一次预检,而不是顺手点掉的提醒。
不建议这样做直接快速确认,等跑起来后才发现最基础的比例或分辨率一开始就错了。
2跟着 Agent 工作流往下走
一旦会话启动,工作的性质就变了。你不再是在做准备,而是在一层一层地塑造成片。
这也是 freebeat Agent 开始真正体现“高杠杆感”的地方。每个阶段都控制最终成片中的不同部分:意图、音乐逻辑、视觉语言、概念、参考、结构、画面、运动和最终合成。按顺序去检查,你不只是“看进度”,而是在持续给作品增加完整度、力量和可信度。
2.1Plan
先看 Plan,再急着判断结果。这是你第一次看到整次会话的路线图,也是系统在真正开始产出媒体内容前,先把整条执行路径摊开给你看的地方。

这个阶段最大的价值,在于它让你先理解运行逻辑,而不是等东西都生成出来后才发现方向不对。你现在看到的还不是结果,这正是它有价值的原因。很多大的理解偏差,在最开始就能被看出来,而且成本最低。你会明显感受到:这次运行不是在黑箱里碰运气,而是在按一条可读、可判断的路径推进。
在工作区顶部,你还会一直看到三个视图:
Results:最适合逐阶段审批结果。Editor:当图片和视频片段出现后,用来检查时间线。Canvas:从画布视角查看整个项目结构。

第一次做项目时,建议在媒体真正生成之前都优先停留在 Results。这是最清楚、最适合逐步审批的视图,也最适合在错误继续放大之前把问题截住。
2.2Input Analyzing
在相信这次运行之前,先读 Input Analyzing。这是 freebeat 把你的文字翻译成制作逻辑的第一站。如果这里理解得准,后面整条链路都会更稳;如果这里已经偏了,后面只会把偏差放大。

按这个顺序看:
Your Prompt:系统当前真正使用的起始方向。Key Points:它认为必须保留下来的核心信息。Intent:系统从你的输入里提炼出的创作目标。Suggestions:如果现在就要修方向,它建议你怎么修。Prompt Drift Risk:哪些要点如果不强化,后面可能会丢。
如果主体、气质或世界观在这里就已经不对,请立刻回头修。这是整个工作流里杠杆最高的检查点之一,因为它正好卡在“自然语言”到“结构化执行”之间。这里一旦读准,后面的每一步都会更像顺势推进,而不是不断纠偏。
2.3Music Analysis
在批准任何视觉规划之前,先看 Music Analysis。这是整支 MV 会不会真正建立在歌曲运动逻辑之上的关键。

重点看三层:
- 整体音乐身份:风格感、制作质地、动态变化、节奏特征是否判断准确。
Energy Arc:起伏、打开点、推进感是否符合歌曲本身。Segment Analysis:切分点是不是落在真正该变的地方。
这一阶段会让 freebeat 和一般的“图像生成式工具”拉开差距。这里音乐不是背景,而是结构本身。只要这一层读得准,后面的 scene、storyboard、clip 才会更像“跟着歌长出来”,而不是只是在歌上面铺视觉。
2.4Style & Framework
视觉路线要在这里定,或者在这里改。因为一旦开始生成图片和视频,这个方向就会越来越贵。

把这个阶段当成视觉承诺来看:
Selected Style:系统准备建立的核心外观。Color Palette与Visual Characteristics:这条外观路线会反复使用的视觉语言。Artistic Framework:支撑这条路线的表达逻辑。Alternative Styles:你本来还可以往哪些相邻方向走。
问自己一个很直接的问题:如果整支视频从头到尾都沿着这个方向走,它还适不适合这首歌?如果答案不是肯定的,就在这里改。这里改,代价最低;再往后改,就不再是“换路线”,而是在拆已经生成出来的东西。
2.5Creative Brief
把 Creative Brief 当作作品内部逻辑的批准书来看。如果这里显得空,后面通常也会空。

重点看这四块:
Creative Concept:这支 MV 本质上在讲什么。Core Drive:推动它的情绪发动机是什么。Director's Vision:画面应该如何被感受到。Content Outline:后面会继续展开的阶段性结构。
这一步是 freebeat 把设置、音乐和审美转成“作品观点”的地方。brief 越清晰,后面的结果越像一个有立场、有方向的作品;brief 一旦泛,后面的精致往往也只是表面上的精致。
2.6Reference Images
打开 Reference Images,第一时间判断一致性。这里不是看某一张参考图好不好看,而是要看整块参考板能不能撑起一个稳定的 MV 身份。

把整块板当成一个系统来判断:
- 主体看起来还是不是同一个人?
- 服装、环境、道具和质感是否属于同一个世界?
- 有没有明显更弱、更脏、更偏题的卡片?
如果你已经看到身份漂移或世界观漂移,就在这里用 Modify 修,不要再往后拖。因为后面的 planning 和 generation 只会继续放大这里立下来的视觉锚点。
如果你是在会话开始前为 Character 准备自己的图片素材,请尽量把主体信号做干净:
- 一次只放一个人。 每张图都要让主体一眼就能看清。多人合照、主体不明确的图,会明显削弱身份信号。

- 背景干净,脸清楚。 主体越容易被识别,后面的稳定性通常越高。

- 换造型可以,但脸必须是同一个人。 真正导致身份漂移的,不是换衣服,而是换了人。

2.7Scene Planning
把 Scene Planning 当作整支 MV 的大结构来读。这里决定的是歌曲里大的转折有没有被足够大的视觉段落接住。

按从大到小的顺序检查:
- 先看 scene 名称和时间范围。
- 再看
Scene Style、Lighting、Atmosphere和Narrative Function。 - 最后看段落之间的转场是否跟歌曲推进对得上。
如果整体结构显得太碎、太挤,或者重大音乐转折来得太晚、太弱,就在这里改。节奏问题在 scene 层修,远比到了 shot、storyboard、clip 再修来得轻。
2.8Shot Planning
按顺序读 Shot Planning,确认镜头语言是在推进,而不是在重复。这里开始,MV 从“可以描述”变成“可以导演”。

每一条 shot 都要看三件事:
Start Frame:镜头怎么进入。Action & Camera:人物或画面怎么动,镜头怎么跟。End Frame:镜头最后落到哪里。
如果太多卡片看起来彼此差不多、动作模糊、节奏不够有变化,就在这里停。镜头重复是最适合在这一层解决的问题,等它们已经变成 storyboard 和 clip,再返工就会重很多。
2.9Storyboard
到 Storyboard 时,你第一次能把项目当作“连续画面序列”而不是“文字规划”来看。在当前结果页里,这一块显示为 Scenes,也是很多项目第一次真正开始像一支 MV 的地方。

从左到右看这组图,重点问自己:
- 这些画面还是不是同一个 MV 世界?
- 主体在不同画面里是不是还认得出来?
- 有没有明显坏掉、重复、偏题或显弱的卡片?
如果某一帧不对,就在这里修。用 Select 选中问题帧,单独重新生成,不要把问题拖进视频阶段。Storyboard 是一个极高价值的修正点,因为这里每修好一张,后面的动态片段就会更稳、更有可信度。
推荐这样做一看到 storyboard 漂移就当场修,越早修越精准,成本也越低。
不建议这样做带着已经坏掉的 storyboard 卡片进入 Video Clips,期待运动本身能掩盖上游设计的问题。
2.10Video Clips
先打开 Videos 网格,再去看关键片段本身。不要只根据缩略图批准这一阶段。到这里,项目已经从“想象中的运动”变成“真正的运动”了。

建议分两轮判断:
- 第一轮先扫 clip 卡片,确认主要节奏点都已经被覆盖。
- 第二轮打开关键 clip,看运动本身是不是成立,而不只是静态预览看起来漂亮。
如果某个片段失手了,就局部重生。到了这个阶段,最强的工作方式不是大面积推倒重来,而是精确修弱片段,保留强片段。你会开始明显感受到前面那些结构和审美判断,在这里正变成真实的运动回报。
不要停在 clip 网格。切到 Editor,在时间线上看它们真正拼起来之后的效果。

Editor 会把很多缩略图里看不出的问题直接暴露出来。某个片段单看很漂亮,但放到波形和前后节奏里,可能仍然显得晚、软、急,或者根本不贴歌。
2.11Merge
把 Merge 当成成片审批。当前结果面板里这一阶段会显示为 Final Video,这里是整次工作流真正收束成一支完整视频的地方。

完整看一遍结果,不要只把它当作一个清单去过。
建议按这个顺序使用最终页面:
Preview Mode:先完整看成片,不要边看边打断。Edit:如果节奏或结构还有问题,就回编辑器。Download:只有当它已经像一支真正完成的 MV,而不只是“渲染完了”,再导出。
如果最终预览还是不够好,请回到最早出问题的那个阶段。Merge 只能整合前面所有决定,它不能替上游错误兜底。但如果上游判断是对的,这一刻会很有成就感:你看到的不是“终于跑完了”,而是一支真正站得住的音乐视频已经成形。
3精准回退,而不是盲目重来
项目一旦出现偏差,不要默认整条流程重开。先回到真正拥有这个问题的那个阶段去修。这才是最省 credits、最省时间、也最能保留动能的做法。
这也是 freebeat Agent 分阶段设计最强的一点:每个步骤都有明确职责,所以大多数问题其实都有最合适的修正点。强创作者不是一有偏差就全盘重跑,而是知道该在什么地方精准回退,保住已经成立的部分,只修真正拖后腿的地方。你会越来越清楚地感觉到,这不是一个让你被黑箱拖着走的系统,而是一套让你逐步掌控作品质量的创作工作流。
| 如果出现这个问题 | 先回到这里 | 为什么这里最合适 | 应该怎么做 |
|---|---|---|---|
| 主体开始不像同一个人 | Character 或 Reference Images | 身份问题通常从源图或参考锚点开始 | 先把源图和参考板修稳,再继续往下跑 |
| 节奏和歌曲明显不贴 | Music Analysis 或 Scene Planning | 大多数节奏漂移都在生成前就已经埋下 | 重新检查能量弧线、切段逻辑和 scene 时间 |
| 画面很精致,但完全不适合这首歌 | Style & Framework | 这里决定了整个项目走哪条视觉路线 | 在这里换方向,不要拖到后面补救 |
| brief 写得很满,但画面还是很空 | Creative Brief | 后面的阶段会继承 brief 的强弱 | 收紧概念、情绪驱动和内容提纲 |
| 只有一两张 storyboard 图坏了 | Storyboard | 这是最干净、最便宜的局部修图点 | 选中问题帧,单独重生,然后再看一遍 |
| 只有一两段运动片段比较弱 | Video Clips | 片段强弱应该在 clip 阶段局部修正 | 只重生弱 clip,然后回 Editor 检查 |
| 串起来播放时整支片子还是不顺 | Editor,再往上追到最早出问题的阶段 | 播放会暴露缩略图看不出的节奏问题 | 先找出卡点,再回到真正制造问题的上游阶段 |
| 最终预览仍然不够能发 | 最早开始失真的那个阶段 | Merge 只能整合,不能治上游 | 找源头问题并修掉,再重新合成 |