
freebeat Agent 音樂視頻教程
如果你會點開 freebeat Agent,通常不是因為你只想隨便試一個功能,而是因為它展示了一種很少見的能力:把一首歌從最初方向一路推進到成片級音樂視頻,而且速度快、結構清楚、創作控制力很強。這份指南不是為了把按鈕逐個翻給你看,而是為了帶你按真正可落地的方式走完整個流程。從最初設置到最終 `Merge`,每一個階段都在決定成片會不會更完整、更有力量、更像一支真正的 MV。按順序走完,你會明顯感覺項目不再只是一個模糊想法,而是在一步步長出節奏、鏡頭感和作品完成度。
1從 Agent 工作區開始
在你真正創建會話之前,先把路徑、歌曲、提示詞方向和會話控制項鎖好。在 freebeat Agent 里,這些都不是裝飾性的輸入,而是整條生產鏈的起點,后面的每一步都會立刻建立在它們之上。
如果你第一次使用這個產品,建議從這里開始切換思維方式。不要把自己當成“試工具的人”,而是把自己當成“正在啟動一個作品制作流程的人”。前期設置做得認真,不只是能減少返工,更能讓整次運行一開始就有方向感和掌控感。
1.1打開 Agent 入口,并停留在主 MV 路徑上
打開 /music-video-generator,第一次正式做項目時,從主 Agent 入口開始。這是 freebeat 最完整、最強、最能體現產品能力的主流程路徑。如果你想真正理解這個產品在音樂視頻創作上的上限,應該先從這條路走一遍。
在主創建框下面,freebeat 還提供了 Singing MV、Storytelling MV、Abstract MV、Viral Short、OnBeat Effect 和 More 等專項模式。這些模式適合目標已經很明確、范圍本身就更窄的任務。但如果你想完整體驗“一首歌如何被一路推進成一支完整 MV”,第一次請先留在主路徑。

你可以這樣理解這些模式標簽:
Singing MV:當演唱者必須始終是畫面中心時,用這條路更合適。它更適合藝人表演感、口型表現、舞臺存在感和人物持續聚焦都很重要的作品。Storytelling MV:當歌曲需要更清晰的敘事推進,而不是只靠氛圍帶動時,選這條路更合適。它更適合需要起承轉合、情節推進和明確敘事弧線的 MV。Abstract MV:當你更在意質感、氛圍、節奏和視覺情緒,而不是字面故事時,這條路會更合適。它適合做風格化、沉浸式、審美驅動的作品。Viral Short:當輸出目標是短平快、首屏就要抓人、節奏必須收得更緊時,這條路更有效。它更偏向短視頻平臺上的高沖擊成品。OnBeat Effect:當節奏反應、打點力度和運動沖擊比完整 MV 世界觀更重要時,這條路更合適。它適合節奏驅動型、動效驅動型結果。More:當你已經清楚主流程對這個任務來說過寬,可以從這里進入更多更窄、更專的創作工具。
第一次做項目時,不要因為專項模式聽起來很酷就立刻切過去。先讓完整的 Agent 主流程把一首歌從概念、結構、圖片、片段一路推到合成。你會更快理解這套系統真正的控制力在哪。
推薦這樣做先鎖定路徑,再圍繞這條路徑去建立概念和素材。
不建議這樣做概念已經開始成形后又頻繁切換模式,還希望前面的設置仍然完全成立。
1.2加入你真正要圍繞它做片子的那首歌
點擊 Add Music,把這次要做 MV 的準確音頻加入進來。如果你還在探索方向,可以先用內置曲庫;如果你已經有最終音頻,直接用 Upload music;如果你使用鏈接,務必確認那就是你要制作的那個正式版本。

- 還在比方向時,用曲庫會更快。
- 已經有確定音頻時,優先用
Upload music。 - 只有在你非常確認來源和版本時,才使用 URL。
不要把這一步當作“先隨便放個占位”。freebeat 讀取的不是一段背景音樂,而是歌曲的結構、推進、情緒起伏和節奏骨架。后面再換歌,并不是小修小補,而是會影響后續整條鏈路的判斷邏輯。把歌曲放進去之后,至少完整確認一次。這一步越穩,后面的每一層越容易建立得自然、有力,而不是松散地拼接在一起。
1.3給 Agent 一個真正可執行的起始方向
點擊主輸入框,給 Agent 一個它真的能據此展開的起始方向。你可以直接描述想做的 MV,也可以留空,讓 AI 更多地跟著音樂自己展開。如果你選擇寫 prompt,請保證它足夠明確,能給系統方向,同時又足夠干凈,不會在后續流程里被自己拖垮。

寫出一個強起點,最有效的方法是先回答四個實際問題:
- 觀眾最該盯住的人或主體是誰?
- 這個 MV 應該屬于什么樣的世界或場景?
- 整體視覺情緒應該是什么?
- 當音樂打開時,能量應該如何推進?
這里不是比誰寫得更像詩,而是建立后續流程可以持續繼承的第一個創作命令。比如“銀色機車服女主、霓虹雨夜城市、鏡面質感特寫、前段克制、鼓點打開后前沖感更強”這種輸入,系統就能更穩定地理解、保留并繼續發展。方向越清楚,后面的步驟越像是在放大創意,而不是替前面的模糊補救。
1.4在鎖定會話之前,把創建控制項檢查清楚
在你點擊 Create 之前,先檢查 prompt 下方那一排控制項,并只打開這次真正需要的內容。這里決定的是這次運行的邊界條件:主體設置、輸出比例、輸出質量,以及會影響整次運行行為的關鍵開關。

建議這樣理解這些控制項:
Character:如果你想在規劃開始之前就先種下明確主角,從這里進入。- 比例,例如
16:9:先想清楚作品最終投放到哪里,再選畫幅。 - 分辨率,例如
720p:按這次會話真正的目標來設置輸出等級。 Style:當你想在分析開始前就偏向某種審美路線時使用。Captions和Remove watermark:Captions對應字幕選擇;同時也在這里判斷這次是否在意去水印。Fast或Expert:Fast是更偏速度的快速模式,Expert是更偏細致判斷的專家模式。Auto和Public:Auto表示完全自動模式;Public決定這次運行是否對外可見。
這排控制項重要,是因為它們一旦開始運行,就會變成真正的制作約束。如果這只是一個快速試方向的版本,就優先為速度服務;如果這是第一次認真版本,就把它按你愿意保留的方式設好。很多人真正開始感受到 freebeat Agent 的“制作感”,就是從這一排控制項開始的。
1.5創建會話
點擊 Create,看一眼確認彈窗。如果還有任何會被鎖住的設置不對,現在就停下。繼續之后,像比例和分辨率這樣的關鍵項目會直接鎖定進這次會話。

把這個彈窗當成一次起飛前檢查。如果設置仍然不對,立刻返回去修。如果都對,再點擊 Continue,讓 freebeat 正式從準備階段進入執行階段。這一刻之后,前面的輸入就不再是假設,而會開始成為一條真實運行中的創作流程。
推薦這樣做把這個彈窗當成最后一次預檢,而不是順手點掉的提醒。
不建議這樣做直接快速確認,等跑起來后才發現最基礎的比例或分辨率一開始就錯了。
2跟著 Agent 工作流往下走
一旦會話啟動,工作的性質就變了。你不再是在做準備,而是在一層一層地塑造成片。
這也是 freebeat Agent 開始真正體現“高杠桿感”的地方。每個階段都控制最終成片中的不同部分:意圖、音樂邏輯、視覺語言、概念、參考、結構、畫面、運動和最終合成。按順序去檢查,你不只是“看進度”,而是在持續給作品增加完整度、力量和可信度。
2.1Plan
先看 Plan,再急著判斷結果。這是你第一次看到整次會話的路線圖,也是系統在真正開始產出媒體內容前,先把整條執行路徑攤開給你看的地方。

這個階段最大的價值,在于它讓你先理解運行邏輯,而不是等東西都生成出來后才發現方向不對。你現在看到的還不是結果,這正是它有價值的原因。很多大的理解偏差,在最開始就能被看出來,而且成本最低。你會明顯感受到:這次運行不是在黑箱里碰運氣,而是在按一條可讀、可判斷的路徑推進。
在工作區頂部,你還會一直看到三個視圖:
Results:最適合逐階段審批結果。Editor:當圖片和視頻片段出現后,用來檢查時間線。Canvas:從畫布視角查看整個項目結構。

第一次做項目時,建議在媒體真正生成之前都優先停留在 Results。這是最清楚、最適合逐步審批的視圖,也最適合在錯誤繼續放大之前把問題截住。
2.2Input Analyzing
在相信這次運行之前,先讀 Input Analyzing。這是 freebeat 把你的文字翻譯成制作邏輯的第一站。如果這里理解得準,后面整條鏈路都會更穩;如果這里已經偏了,后面只會把偏差放大。

按這個順序看:
Your Prompt:系統當前真正使用的起始方向。Key Points:它認為必須保留下來的核心信息。Intent:系統從你的輸入里提煉出的創作目標。Suggestions:如果現在就要修方向,它建議你怎么修。Prompt Drift Risk:哪些要點如果不強化,后面可能會丟。
如果主體、氣質或世界觀在這里就已經不對,請立刻回頭修。這是整個工作流里杠桿最高的檢查點之一,因為它正好卡在“自然語言”到“結構化執行”之間。這里一旦讀準,后面的每一步都會更像順勢推進,而不是不斷糾偏。
2.3Music Analysis
在批準任何視覺規劃之前,先看 Music Analysis。這是整支 MV 會不會真正建立在歌曲運動邏輯之上的關鍵。

重點看三層:
- 整體音樂身份:風格感、制作質地、動態變化、節奏特征是否判斷準確。
Energy Arc:起伏、打開點、推進感是否符合歌曲本身。Segment Analysis:切分點是不是落在真正該變的地方。
這一階段會讓 freebeat 和一般的“圖像生成式工具”拉開差距。這里音樂不是背景,而是結構本身。只要這一層讀得準,后面的 scene、storyboard、clip 才會更像“跟著歌長出來”,而不是只是在歌上面鋪視覺。
2.4Style & Framework
視覺路線要在這里定,或者在這里改。因為一旦開始生成圖片和視頻,這個方向就會越來越貴。

把這個階段當成視覺承諾來看:
Selected Style:系統準備建立的核心外觀。Color Palette與Visual Characteristics:這條外觀路線會反復使用的視覺語言。Artistic Framework:支撐這條路線的表達邏輯。Alternative Styles:你本來還可以往哪些相鄰方向走。
問自己一個很直接的問題:如果整支視頻從頭到尾都沿著這個方向走,它還適不適合這首歌?如果答案不是肯定的,就在這里改。這里改,代價最低;再往后改,就不再是“換路線”,而是在拆已經生成出來的東西。
2.5Creative Brief
把 Creative Brief 當作作品內部邏輯的批準書來看。如果這里顯得空,后面通常也會空。

重點看這四塊:
Creative Concept:這支 MV 本質上在講什么。Core Drive:推動它的情緒發動機是什么。Director's Vision:畫面應該如何被感受到。Content Outline:后面會繼續展開的階段性結構。
這一步是 freebeat 把設置、音樂和審美轉成“作品觀點”的地方。brief 越清晰,后面的結果越像一個有立場、有方向的作品;brief 一旦泛,后面的精致往往也只是表面上的精致。
2.6Reference Images
打開 Reference Images,第一時間判斷一致性。這里不是看某一張參考圖好不好看,而是要看整塊參考板能不能撐起一個穩定的 MV 身份。

把整塊板當成一個系統來判斷:
- 主體看起來還是不是同一個人?
- 服裝、環境、道具和質感是否屬于同一個世界?
- 有沒有明顯更弱、更臟、更偏題的卡片?
如果你已經看到身份漂移或世界觀漂移,就在這里用 Modify 修,不要再往后拖。因為后面的 planning 和 generation 只會繼續放大這里立下來的視覺錨點。
如果你是在會話開始前為 Character 準備自己的圖片素材,請盡量把主體信號做干凈:
- 一次只放一個人。 每張圖都要讓主體一眼就能看清。多人合照、主體不明確的圖,會明顯削弱身份信號。

- 背景干凈,臉清楚。 主體越容易被識別,后面的穩定性通常越高。

- 換造型可以,但臉必須是同一個人。 真正導致身份漂移的,不是換衣服,而是換了人。

2.7Scene Planning
把 Scene Planning 當作整支 MV 的大結構來讀。這里決定的是歌曲里大的轉折有沒有被足夠大的視覺段落接住。

按從大到小的順序檢查:
- 先看 scene 名稱和時間范圍。
- 再看
Scene Style、Lighting、Atmosphere和Narrative Function。 - 最后看段落之間的轉場是否跟歌曲推進對得上。
如果整體結構顯得太碎、太擠,或者重大音樂轉折來得太晚、太弱,就在這里改。節奏問題在 scene 層修,遠比到了 shot、storyboard、clip 再修來得輕。
2.8Shot Planning
按順序讀 Shot Planning,確認鏡頭語言是在推進,而不是在重復。這里開始,MV 從“可以描述”變成“可以導演”。

每一條 shot 都要看三件事:
Start Frame:鏡頭怎么進入。Action & Camera:人物或畫面怎么動,鏡頭怎么跟。End Frame:鏡頭最后落到哪里。
如果太多卡片看起來彼此差不多、動作模糊、節奏不夠有變化,就在這里停。鏡頭重復是最適合在這一層解決的問題,等它們已經變成 storyboard 和 clip,再返工就會重很多。
2.9Storyboard
到 Storyboard 時,你第一次能把項目當作“連續畫面序列”而不是“文字規劃”來看。在當前結果頁里,這一塊顯示為 Scenes,也是很多項目第一次真正開始像一支 MV 的地方。

從左到右看這組圖,重點問自己:
- 這些畫面還是不是同一個 MV 世界?
- 主體在不同畫面里是不是還認得出來?
- 有沒有明顯壞掉、重復、偏題或顯弱的卡片?
如果某一幀不對,就在這里修。用 Select 選中問題幀,單獨重新生成,不要把問題拖進視頻階段。Storyboard 是一個極高價值的修正點,因為這里每修好一張,后面的動態片段就會更穩、更有可信度。
推薦這樣做一看到 storyboard 漂移就當場修,越早修越精準,成本也越低。
不建議這樣做帶著已經壞掉的 storyboard 卡片進入 Video Clips,期待運動本身能掩蓋上游設計的問題。
2.10Video Clips
先打開 Videos 網格,再去看關鍵片段本身。不要只根據縮略圖批準這一階段。到這里,項目已經從“想象中的運動”變成“真正的運動”了。

建議分兩輪判斷:
- 第一輪先掃 clip 卡片,確認主要節奏點都已經被覆蓋。
- 第二輪打開關鍵 clip,看運動本身是不是成立,而不只是靜態預覽看起來漂亮。
如果某個片段失手了,就局部重生。到了這個階段,最強的工作方式不是大面積推倒重來,而是精確修弱片段,保留強片段。你會開始明顯感受到前面那些結構和審美判斷,在這里正變成真實的運動回報。
不要停在 clip 網格。切到 Editor,在時間線上看它們真正拼起來之后的效果。

Editor 會把很多縮略圖里看不出的問題直接暴露出來。某個片段單看很漂亮,但放到波形和前后節奏里,可能仍然顯得晚、軟、急,或者根本不貼歌。
2.11Merge
把 Merge 當成成片審批。當前結果面板里這一階段會顯示為 Final Video,這里是整次工作流真正收束成一支完整視頻的地方。

完整看一遍結果,不要只把它當作一個清單去過。
建議按這個順序使用最終頁面:
Preview Mode:先完整看成片,不要邊看邊打斷。Edit:如果節奏或結構還有問題,就回編輯器。Download:只有當它已經像一支真正完成的 MV,而不只是“渲染完了”,再導出。
如果最終預覽還是不夠好,請回到最早出問題的那個階段。Merge 只能整合前面所有決定,它不能替上游錯誤兜底。但如果上游判斷是對的,這一刻會很有成就感:你看到的不是“終于跑完了”,而是一支真正站得住的音樂視頻已經成形。
3精準回退,而不是盲目重來
項目一旦出現偏差,不要默認整條流程重開。先回到真正擁有這個問題的那個階段去修。這才是最省 credits、最省時間、也最能保留動能的做法。
這也是 freebeat Agent 分階段設計最強的一點:每個步驟都有明確職責,所以大多數問題其實都有最合適的修正點。強創作者不是一有偏差就全盤重跑,而是知道該在什么地方精準回退,保住已經成立的部分,只修真正拖后腿的地方。你會越來越清楚地感覺到,這不是一個讓你被黑箱拖著走的系統,而是一套讓你逐步掌控作品質量的創作工作流。
| 如果出現這個問題 | 先回到這里 | 為什么這里最合適 | 應該怎么做 |
|---|---|---|---|
| 主體開始不像同一個人 | Character 或 Reference Images | 身份問題通常從源圖或參考錨點開始 | 先把源圖和參考板修穩,再繼續往下跑 |
| 節奏和歌曲明顯不貼 | Music Analysis 或 Scene Planning | 大多數節奏漂移都在生成前就已經埋下 | 重新檢查能量弧線、切段邏輯和 scene 時間 |
| 畫面很精致,但完全不適合這首歌 | Style & Framework | 這里決定了整個項目走哪條視覺路線 | 在這里換方向,不要拖到后面補救 |
| brief 寫得很滿,但畫面還是很空 | Creative Brief | 后面的階段會繼承 brief 的強弱 | 收緊概念、情緒驅動和內容提綱 |
| 只有一兩張 storyboard 圖壞了 | Storyboard | 這是最干凈、最便宜的局部修圖點 | 選中問題幀,單獨重生,然后再看一遍 |
| 只有一兩段運動片段比較弱 | Video Clips | 片段強弱應該在 clip 階段局部修正 | 只重生弱 clip,然后回 Editor 檢查 |
| 串起來播放時整支片子還是不順 | Editor,再往上追到最早出問題的階段 | 播放會暴露縮略圖看不出的節奏問題 | 先找出卡點,再回到真正制造問題的上游階段 |
| 最終預覽仍然不夠能發 | 最早開始失真的那個階段 | Merge 只能整合,不能治上游 | 找源頭問題并修掉,再重新合成 |