折腾文生视频踩了个反直觉的坑:写提示词的时候总忍不住“上强度”,焦段、镜头号、第几秒干嘛逐秒堆满,再加上“体积流体模拟”“SSS 皮肤材质”,结果还不如老老实实两句话讲清楚故事。
后来想明白了:模型越强,提示词反而越要简单——你把故事、画面、情绪讲清楚,运镜、光线、节奏交给模型自己来。这套思路是字节随 Seedance 2.0 一起提出来的,叫「 Vibe Creating 」。
放个同场景对比体会一下:
改写前:特写 85mm f1.4 ,120fps ,推轨 0.6x ,1/250 定格汗珠…
改写后:「深夜大排档,厨师颠勺,锅里腾起一团橘红火焰照亮他汗湿的脸,面条翻飞,他把面盛进碗里抬手擦汗。」
同一个模型,后面那版瞬间有了烟火气。
我把它整理成了一个开源、能直接装进 agent 的小工具:它会把你“上强度”或者太潦草的提示词,改写成模型真正拍得更好的版本。更省心的是它知道什么时候别乱改——要对口型、做 UI 演示这种需要精准控制的,它不会硬改,直接让你保持原样。支持 Seedance 2.0 / 可灵 / Veo / 海螺 / Wan / Vidu 等任意文生视频模型。
仓库有 before/after 对比视频: https://github.com/Alisa0808/vibe-creating-skill |安装:npx github:Alisa0808/vibe-creating-skill
后来想明白了:模型越强,提示词反而越要简单——你把故事、画面、情绪讲清楚,运镜、光线、节奏交给模型自己来。这套思路是字节随 Seedance 2.0 一起提出来的,叫「 Vibe Creating 」。
放个同场景对比体会一下:
改写前:特写 85mm f1.4 ,120fps ,推轨 0.6x ,1/250 定格汗珠…
改写后:「深夜大排档,厨师颠勺,锅里腾起一团橘红火焰照亮他汗湿的脸,面条翻飞,他把面盛进碗里抬手擦汗。」
同一个模型,后面那版瞬间有了烟火气。
我把它整理成了一个开源、能直接装进 agent 的小工具:它会把你“上强度”或者太潦草的提示词,改写成模型真正拍得更好的版本。更省心的是它知道什么时候别乱改——要对口型、做 UI 演示这种需要精准控制的,它不会硬改,直接让你保持原样。支持 Seedance 2.0 / 可灵 / Veo / 海螺 / Wan / Vidu 等任意文生视频模型。
仓库有 before/after 对比视频: https://github.com/Alisa0808/vibe-creating-skill |安装:npx github:Alisa0808/vibe-creating-skill