价格
低至7折
深色梦幻背景中的发光音符与明亮高音谱号。
更新于 2026 年 4 月 16 日

freebeat Agent 音乐视频教程

如果你会点开 freebeat Agent,通常不是因为你只想随便试一个功能,而是因为它展示了一种很少见的能力:把一首歌从最初方向一路推进到成片级音乐视频,而且速度快、结构清楚、创作控制力很强。这份指南不是为了把按钮逐个翻给你看,而是为了带你按真正可落地的方式走完整个流程。从最初设置到最终 `Merge`,每一个阶段都在决定成片会不会更完整、更有力量、更像一支真正的 MV。按顺序走完,你会明显感觉项目不再只是一个模糊想法,而是在一步步长出节奏、镜头感和作品完成度。

1从 Agent 工作区开始

在你真正创建会话之前,先把路径、歌曲、提示词方向和会话控制项锁好。在 freebeat Agent 里,这些都不是装饰性的输入,而是整条生产链的起点,后面的每一步都会立刻建立在它们之上。

如果你第一次使用这个产品,建议从这里开始切换思维方式。不要把自己当成“试工具的人”,而是把自己当成“正在启动一个作品制作流程的人”。前期设置做得认真,不只是能减少返工,更能让整次运行一开始就有方向感和掌控感。

1.1打开 Agent 入口,并停留在主 MV 路径上

打开 /music-video-generator,第一次正式做项目时,从主 Agent 入口开始。这是 freebeat 最完整、最强、最能体现产品能力的主流程路径。如果你想真正理解这个产品在音乐视频创作上的上限,应该先从这条路走一遍。

在主创建框下面,freebeat 还提供了 Singing MVStorytelling MVAbstract MVViral ShortOnBeat EffectMore 等专项模式。这些模式适合目标已经很明确、范围本身就更窄的任务。但如果你想完整体验“一首歌如何被一路推进成一支完整 MV”,第一次请先留在主路径。

主 `Agent` 创建区域和下方专项模式标签的入口界面。
在这里先锁定主路径,再创建会话。

你可以这样理解这些模式标签:

  • Singing MV:当演唱者必须始终是画面中心时,用这条路更合适。它更适合艺人表演感、口型表现、舞台存在感和人物持续聚焦都很重要的作品。
  • Storytelling MV:当歌曲需要更清晰的叙事推进,而不是只靠氛围带动时,选这条路更合适。它更适合需要起承转合、情节推进和明确叙事弧线的 MV。
  • Abstract MV:当你更在意质感、氛围、节奏和视觉情绪,而不是字面故事时,这条路会更合适。它适合做风格化、沉浸式、审美驱动的作品。
  • Viral Short:当输出目标是短平快、首屏就要抓人、节奏必须收得更紧时,这条路更有效。它更偏向短视频平台上的高冲击成品。
  • OnBeat Effect:当节奏反应、打点力度和运动冲击比完整 MV 世界观更重要时,这条路更合适。它适合节奏驱动型、动效驱动型结果。
  • More:当你已经清楚主流程对这个任务来说过宽,可以从这里进入更多更窄、更专的创作工具。

第一次做项目时,不要因为专项模式听起来很酷就立刻切过去。先让完整的 Agent 主流程把一首歌从概念、结构、图片、片段一路推到合成。你会更快理解这套系统真正的控制力在哪。

推荐这样做先锁定路径,再围绕这条路径去建立概念和素材。

不建议这样做概念已经开始成形后又频繁切换模式,还希望前面的设置仍然完全成立。

1.2加入你真正要围绕它做片子的那首歌

点击 Add Music,把这次要做 MV 的准确音频加入进来。如果你还在探索方向,可以先用内置曲库;如果你已经有最终音频,直接用 Upload music;如果你使用链接,务必确认那就是你要制作的那个正式版本。

可浏览热门歌曲、上传音乐或粘贴 URL 的选歌界面。
你可以从曲库中选歌、上传自己的音频,或粘贴支持的链接。
  • 还在比方向时,用曲库会更快。
  • 已经有确定音频时,优先用 Upload music
  • 只有在你非常确认来源和版本时,才使用 URL。

不要把这一步当作“先随便放个占位”。freebeat 读取的不是一段背景音乐,而是歌曲的结构、推进、情绪起伏和节奏骨架。后面再换歌,并不是小修小补,而是会影响后续整条链路的判断逻辑。把歌曲放进去之后,至少完整确认一次。这一步越稳,后面的每一层越容易建立得自然、有力,而不是松散地拼接在一起。

1.3给 Agent 一个真正可执行的起始方向

点击主输入框,给 Agent 一个它真的能据此展开的起始方向。你可以直接描述想做的 MV,也可以留空,让 AI 更多地跟着音乐自己展开。如果你选择写 prompt,请保证它足够明确,能给系统方向,同时又足够干净,不会在后续流程里被自己拖垮。

用于描述视频情绪、视觉方向和节奏推进的 prompt 输入区域。
在 credits 往下游消耗之前,先用这段文字把创意方向定住。

写出一个强起点,最有效的方法是先回答四个实际问题:

  • 观众最该盯住的人或主体是谁?
  • 这个 MV 应该属于什么样的世界或场景?
  • 整体视觉情绪应该是什么?
  • 当音乐打开时,能量应该如何推进?

这里不是比谁写得更像诗,而是建立后续流程可以持续继承的第一个创作命令。比如“银色机车服女主、霓虹雨夜城市、镜面质感特写、前段克制、鼓点打开后前冲感更强”这种输入,系统就能更稳定地理解、保留并继续发展。方向越清楚,后面的步骤越像是在放大创意,而不是替前面的模糊补救。

1.4在锁定会话之前,把创建控制项检查清楚

在你点击 Create 之前,先检查 prompt 下方那一排控制项,并只打开这次真正需要的内容。这里决定的是这次运行的边界条件:主体设置、输出比例、输出质量,以及会影响整次运行行为的关键开关。

显示 character、比例、分辨率、style、captions 与输出控制项的创建设置工具栏。
会话创建前,先在这里检查那些会影响全局的关键开关。

建议这样理解这些控制项:

  • Character:如果你想在规划开始之前就先种下明确主角,从这里进入。
  • 比例,例如 16:9:先想清楚作品最终投放到哪里,再选画幅。
  • 分辨率,例如 720p:按这次会话真正的目标来设置输出等级。
  • Style:当你想在分析开始前就偏向某种审美路线时使用。
  • CaptionsRemove watermarkCaptions 对应字幕选择;同时也在这里判断这次是否在意去水印。
  • FastExpertFast 是更偏速度的快速模式,Expert 是更偏细致判断的专家模式。
  • AutoPublicAuto 表示完全自动模式;Public 决定这次运行是否对外可见。

这排控制项重要,是因为它们一旦开始运行,就会变成真正的制作约束。如果这只是一个快速试方向的版本,就优先为速度服务;如果这是第一次认真版本,就把它按你愿意保留的方式设好。很多人真正开始感受到 freebeat Agent 的“制作感”,就是从这一排控制项开始的。

1.5创建会话

点击 Create,看一眼确认弹窗。如果还有任何会被锁住的设置不对,现在就停下。继续之后,像比例和分辨率这样的关键项目会直接锁定进这次会话。

说明比例和分辨率在开始生成后将被锁定的确认弹窗。
这是 freebeat 正式锁定本次会话设置前的最后一次检查。

把这个弹窗当成一次起飞前检查。如果设置仍然不对,立刻返回去修。如果都对,再点击 Continue,让 freebeat 正式从准备阶段进入执行阶段。这一刻之后,前面的输入就不再是假设,而会开始成为一条真实运行中的创作流程。

推荐这样做把这个弹窗当成最后一次预检,而不是顺手点掉的提醒。

不建议这样做直接快速确认,等跑起来后才发现最基础的比例或分辨率一开始就错了。

2跟着 Agent 工作流往下走

一旦会话启动,工作的性质就变了。你不再是在做准备,而是在一层一层地塑造成片。

这也是 freebeat Agent 开始真正体现“高杠杆感”的地方。每个阶段都控制最终成片中的不同部分:意图、音乐逻辑、视觉语言、概念、参考、结构、画面、运动和最终合成。按顺序去检查,你不只是“看进度”,而是在持续给作品增加完整度、力量和可信度。

2.1Plan

先看 Plan,再急着判断结果。这是你第一次看到整次会话的路线图,也是系统在真正开始产出媒体内容前,先把整条执行路径摊开给你看的地方。

从 `Plan` 一直到 `Merge` 的完整 Agent 工作流路线图。
`Plan` 是整次 Agent 会话的路线图。

这个阶段最大的价值,在于它让你先理解运行逻辑,而不是等东西都生成出来后才发现方向不对。你现在看到的还不是结果,这正是它有价值的原因。很多大的理解偏差,在最开始就能被看出来,而且成本最低。你会明显感受到:这次运行不是在黑箱里碰运气,而是在按一条可读、可判断的路径推进。

在工作区顶部,你还会一直看到三个视图:

  • Results:最适合逐阶段审批结果。
  • Editor:当图片和视频片段出现后,用来检查时间线。
  • Canvas:从画布视角查看整个项目结构。
Agent 工作区顶部的 `Results`、`Editor` 和 `Canvas` 标签。
这三个视图决定你如何在同一个项目上切换审批、编辑和全局查看。

第一次做项目时,建议在媒体真正生成之前都优先停留在 Results。这是最清楚、最适合逐步审批的视图,也最适合在错误继续放大之前把问题截住。

2.2Input Analyzing

在相信这次运行之前,先读 Input Analyzing。这是 freebeat 把你的文字翻译成制作逻辑的第一站。如果这里理解得准,后面整条链路都会更稳;如果这里已经偏了,后面只会把偏差放大。

显示 prompt 总结、关键点、意图、建议和漂移风险的 `Input Analysis` 结果。
`Input Analyzing` 会先告诉你,freebeat 是如何理解这次请求的。

按这个顺序看:

  • Your Prompt:系统当前真正使用的起始方向。
  • Key Points:它认为必须保留下来的核心信息。
  • Intent:系统从你的输入里提炼出的创作目标。
  • Suggestions:如果现在就要修方向,它建议你怎么修。
  • Prompt Drift Risk:哪些要点如果不强化,后面可能会丢。

如果主体、气质或世界观在这里就已经不对,请立刻回头修。这是整个工作流里杠杆最高的检查点之一,因为它正好卡在“自然语言”到“结构化执行”之间。这里一旦读准,后面的每一步都会更像顺势推进,而不是不断纠偏。

2.3Music Analysis

在批准任何视觉规划之前,先看 Music Analysis。这是整支 MV 会不会真正建立在歌曲运动逻辑之上的关键。

包含歌曲身份、能量弧线和分段结果的 `Music Analysis` 页面。
`Music Analysis` 会成为后续画面和节奏结构的音乐骨架。

重点看三层:

  • 整体音乐身份:风格感、制作质地、动态变化、节奏特征是否判断准确。
  • Energy Arc:起伏、打开点、推进感是否符合歌曲本身。
  • Segment Analysis:切分点是不是落在真正该变的地方。

这一阶段会让 freebeat 和一般的“图像生成式工具”拉开差距。这里音乐不是背景,而是结构本身。只要这一层读得准,后面的 scene、storyboard、clip 才会更像“跟着歌长出来”,而不是只是在歌上面铺视觉。

2.4Style & Framework

视觉路线要在这里定,或者在这里改。因为一旦开始生成图片和视频,这个方向就会越来越贵。

展示已选风格、框架和备选方向的 `Style & Framework` 结果页。
`Style & Framework` 是项目正式承诺视觉路线的地方。

把这个阶段当成视觉承诺来看:

  • Selected Style:系统准备建立的核心外观。
  • Color PaletteVisual Characteristics:这条外观路线会反复使用的视觉语言。
  • Artistic Framework:支撑这条路线的表达逻辑。
  • Alternative Styles:你本来还可以往哪些相邻方向走。

问自己一个很直接的问题:如果整支视频从头到尾都沿着这个方向走,它还适不适合这首歌?如果答案不是肯定的,就在这里改。这里改,代价最低;再往后改,就不再是“换路线”,而是在拆已经生成出来的东西。

2.5Creative Brief

Creative Brief 当作作品内部逻辑的批准书来看。如果这里显得空,后面通常也会空。

包含概念、核心驱动、导演视角和内容提纲的 `Creative Brief` 页面。
`Creative Brief` 会把音乐理解和风格选择真正转成可执行的 MV 概念。

重点看这四块:

  • Creative Concept:这支 MV 本质上在讲什么。
  • Core Drive:推动它的情绪发动机是什么。
  • Director's Vision:画面应该如何被感受到。
  • Content Outline:后面会继续展开的阶段性结构。

这一步是 freebeat 把设置、音乐和审美转成“作品观点”的地方。brief 越清晰,后面的结果越像一个有立场、有方向的作品;brief 一旦泛,后面的精致往往也只是表面上的精致。

2.6Reference Images

打开 Reference Images,第一时间判断一致性。这里不是看某一张参考图好不好看,而是要看整块参考板能不能撑起一个稳定的 MV 身份。

展示参考图面板并带有 `Modify` 按钮的 `Reference Images` 阶段。
`Reference Images` 是你判断主体稳定性、世界观和道具体系能否站住的地方。

把整块板当成一个系统来判断:

  • 主体看起来还是不是同一个人?
  • 服装、环境、道具和质感是否属于同一个世界?
  • 有没有明显更弱、更脏、更偏题的卡片?

如果你已经看到身份漂移或世界观漂移,就在这里用 Modify 修,不要再往后拖。因为后面的 planning 和 generation 只会继续放大这里立下来的视觉锚点。

如果你是在会话开始前为 Character 准备自己的图片素材,请尽量把主体信号做干净:

  • 一次只放一个人。 每张图都要让主体一眼就能看清。多人合照、主体不明确的图,会明显削弱身份信号。
单人参考图与多人合照对比示例。
一张图只放一个人,主体信号才会更清楚。
  • 背景干净,脸清楚。 主体越容易被识别,后面的稳定性通常越高。
干净背景人像与复杂偏暗背景人像的对比例子。
背景干净、面部清晰时,freebeat 更容易抓住稳定身份锚点。
  • 换造型可以,但脸必须是同一个人。 真正导致身份漂移的,不是换衣服,而是换了人。
同一人不同造型与不同人物对比的示例图。
如果你上传多套造型,请始终保持同一张脸。

2.7Scene Planning

Scene Planning 当作整支 MV 的大结构来读。这里决定的是歌曲里大的转折有没有被足够大的视觉段落接住。

展示 scene 段落及其时间范围的 `Scene Planning` 结果。
`Scene Planning` 负责把歌曲切成更大的视觉段落。

按从大到小的顺序检查:

  • 先看 scene 名称和时间范围。
  • 再看 Scene StyleLightingAtmosphereNarrative Function
  • 最后看段落之间的转场是否跟歌曲推进对得上。

如果整体结构显得太碎、太挤,或者重大音乐转折来得太晚、太弱,就在这里改。节奏问题在 scene 层修,远比到了 shot、storyboard、clip 再修来得轻。

2.8Shot Planning

按顺序读 Shot Planning,确认镜头语言是在推进,而不是在重复。这里开始,MV 从“可以描述”变成“可以导演”。

包含 shot 卡片、起始帧和动作与镜头说明的 `Shot Planning` 页面。
`Shot Planning` 会把 scene 结构进一步拆成可执行的单个镜头节拍。

每一条 shot 都要看三件事:

  • Start Frame:镜头怎么进入。
  • Action & Camera:人物或画面怎么动,镜头怎么跟。
  • End Frame:镜头最后落到哪里。

如果太多卡片看起来彼此差不多、动作模糊、节奏不够有变化,就在这里停。镜头重复是最适合在这一层解决的问题,等它们已经变成 storyboard 和 clip,再返工就会重很多。

2.9Storyboard

Storyboard 时,你第一次能把项目当作“连续画面序列”而不是“文字规划”来看。在当前结果页里,这一块显示为 Scenes,也是很多项目第一次真正开始像一支 MV 的地方。

在 `Scenes` 面板中展示的 `Storyboard` 四帧结果。
`Storyboard` 是在进入视频生成前,最后一个适合精准重生弱画面的阶段。

从左到右看这组图,重点问自己:

  • 这些画面还是不是同一个 MV 世界?
  • 主体在不同画面里是不是还认得出来?
  • 有没有明显坏掉、重复、偏题或显弱的卡片?

如果某一帧不对,就在这里修。用 Select 选中问题帧,单独重新生成,不要把问题拖进视频阶段。Storyboard 是一个极高价值的修正点,因为这里每修好一张,后面的动态片段就会更稳、更有可信度。

推荐这样做一看到 storyboard 漂移就当场修,越早修越精准,成本也越低。

不建议这样做带着已经坏掉的 storyboard 卡片进入 Video Clips,期待运动本身能掩盖上游设计的问题。

2.10Video Clips

先打开 Videos 网格,再去看关键片段本身。不要只根据缩略图批准这一阶段。到这里,项目已经从“想象中的运动”变成“真正的运动”了。

在 `Videos` 面板中展示的三段已生成视频片段。
`Video Clips` 让你能够只重生薄弱运动段,而不是整条流程重跑。

建议分两轮判断:

  • 第一轮先扫 clip 卡片,确认主要节奏点都已经被覆盖。
  • 第二轮打开关键 clip,看运动本身是不是成立,而不只是静态预览看起来漂亮。

如果某个片段失手了,就局部重生。到了这个阶段,最强的工作方式不是大面积推倒重来,而是精确修弱片段,保留强片段。你会开始明显感受到前面那些结构和审美判断,在这里正变成真实的运动回报。

不要停在 clip 网格。切到 Editor,在时间线上看它们真正拼起来之后的效果。

在视频预览下方显示时间线、clip 轨道和波形的 `Editor` 预览界面。
用 `Editor` 来判断时序、节奏和片段衔接是否真的成立。

Editor 会把很多缩略图里看不出的问题直接暴露出来。某个片段单看很漂亮,但放到波形和前后节奏里,可能仍然显得晚、软、急,或者根本不贴歌。

2.11Merge

Merge 当成成片审批。当前结果面板里这一阶段会显示为 Final Video,这里是整次工作流真正收束成一支完整视频的地方。

`Merge` 阶段里带预览控件、`Edit` 和 `Download` 的 `Final Video` 面板。
`Merge` 是导出成片前的最终审批状态。

完整看一遍结果,不要只把它当作一个清单去过。

建议按这个顺序使用最终页面:

  • Preview Mode:先完整看成片,不要边看边打断。
  • Edit:如果节奏或结构还有问题,就回编辑器。
  • Download:只有当它已经像一支真正完成的 MV,而不只是“渲染完了”,再导出。

如果最终预览还是不够好,请回到最早出问题的那个阶段。Merge 只能整合前面所有决定,它不能替上游错误兜底。但如果上游判断是对的,这一刻会很有成就感:你看到的不是“终于跑完了”,而是一支真正站得住的音乐视频已经成形。

3精准回退,而不是盲目重来

项目一旦出现偏差,不要默认整条流程重开。先回到真正拥有这个问题的那个阶段去修。这才是最省 credits、最省时间、也最能保留动能的做法。

这也是 freebeat Agent 分阶段设计最强的一点:每个步骤都有明确职责,所以大多数问题其实都有最合适的修正点。强创作者不是一有偏差就全盘重跑,而是知道该在什么地方精准回退,保住已经成立的部分,只修真正拖后腿的地方。你会越来越清楚地感觉到,这不是一个让你被黑箱拖着走的系统,而是一套让你逐步掌控作品质量的创作工作流。

如果出现这个问题先回到这里为什么这里最合适应该怎么做
主体开始不像同一个人CharacterReference Images身份问题通常从源图或参考锚点开始先把源图和参考板修稳,再继续往下跑
节奏和歌曲明显不贴Music AnalysisScene Planning大多数节奏漂移都在生成前就已经埋下重新检查能量弧线、切段逻辑和 scene 时间
画面很精致,但完全不适合这首歌Style & Framework这里决定了整个项目走哪条视觉路线在这里换方向,不要拖到后面补救
brief 写得很满,但画面还是很空Creative Brief后面的阶段会继承 brief 的强弱收紧概念、情绪驱动和内容提纲
只有一两张 storyboard 图坏了Storyboard这是最干净、最便宜的局部修图点选中问题帧,单独重生,然后再看一遍
只有一两段运动片段比较弱Video Clips片段强弱应该在 clip 阶段局部修正只重生弱 clip,然后回 Editor 检查
串起来播放时整支片子还是不顺Editor,再往上追到最早出问题的阶段播放会暴露缩略图看不出的节奏问题先找出卡点,再回到真正制造问题的上游阶段
最终预览仍然不够能发最早开始失真的那个阶段Merge 只能整合,不能治上游找源头问题并修掉,再重新合成