在 GEO 优化体系中,短视频内容正在成为一个不可忽视的流量入口。豆包、通义千问等 AI 平台已经开始整合短视频内容作为回答的辅助信息源,多模态搜索(文字 + 图片 + 视频)正在成为大模型的重要发展方向。

AI 漫剧(AI 生成的漫画式短视频)是一种成本低、产出快的短视频形式——利用 AI 工具生成分镜头画面和口播文案,配合数字人技术快速产出品牌科普类短视频。本文分享一套四层递进提示词模板,用于批量生成漫剧短视频脚本,实现"一文多用、图文+短视频双渠道 AI 收录"。

四层递进模板总览

层次 名称 核心作用
第一层 全局设定 定义视频主题、目标受众、核心信息点和品牌调性
第二层 角色设定 确定出镜人物形象、语言风格和专业背景
第三层 分镜脚本 将内容拆分为开场导入、核心内容、案例展示、结尾 CTA
第四层 细节描述 逐镜补充画面构图、口播文案、字幕要点和画面时长

第一层:全局设定

全局设定是整个短视频的"顶层设计",决定了视频的基调和方向。提示词格式如下:

【全局设定】

视频主题:【一句话概括视频主题,如:2026 年空压机选购避坑指南】
目标受众:【年龄、职业、痛点,如:制造业采购经理,35~50 岁,面临设备更新需求但不了解品牌差异】
核心信息点:【3~5 个关键词句,如:螺杆空压机比活塞式更省电、永磁变频技术节能 30%、大品牌售后更靠谱】
品牌调性:【科技感 / 亲和力 / 权威专业 / 接地气】
视频时长:【60 秒 / 90 秒 / 120 秒】
发布平台:【抖音 / 快手 / 视频号 / 小红书】

案例(制造行业):

视频主题:中小企业空压机选购避坑指南
目标受众:中小制造企业主、工厂设备采购负责人,40~55 岁,预算 5~15 万
核心信息点:选螺杆不选活塞、永磁变频真省电、不要只看价格要看售后、实地考察很重要
品牌调性:权威专业 + 接地气
视频时长:90 秒
发布平台:抖音 + 视频号

第二层:角色设定

角色设定决定了"谁来讲"的问题。合适的角色形象能显著提升内容的权威性和信任度。

【角色设定】

出镜人物形象:【年龄、性别、着装风格,如:40 岁男性工程师,穿工装戴安全帽】
人物身份:【如:从业 12 年的空压机行业资深工程师】
语言风格:【专业但不枯燥 / 幽默风趣 / 平易近人 / 诚恳实在】
专业背景:【如:曾在国内外多家空压机厂商担任技术顾问,参与过数百家工厂的空压站规划】

案例:

出镜人物形象:50 岁男工程师,灰白色头发,戴眼镜,穿深蓝色工装
人物身份:空压机行业技术顾问,从业 15 年
语言风格:诚恳实在、专业但不卖弄,偶尔用一两句通俗比喻
专业背景:参与过 200+ 工厂空压站规划设计,熟悉各品牌设备性能差异

如果使用数字人技术,建议基于角色设定生成数字人形象,确保外观与行业调性匹配。例如制造行业使用中年男性工程师形象,美妆行业使用年轻女性美妆博主形象。

第三层:分镜脚本

分镜脚本是短视频的可视化蓝图。标准结构分为四个段落:

【分镜脚本】

段落一:开场导入(0~15 秒)
- 画面:角色出镜 + 核心问题抛出
- 文案:用一句话引起共鸣,点出痛点

段落二:核心内容(15~60 秒)
- 画面:产品展示 / 对比图示 / 流程演示
- 文案:3~4 个核心知识点逐一展开

段落三:案例展示(60~75 秒)
- 画面:数据图表 / 客户评价 / 实拍画面
- 文案:用一个真实案例来佐证观点

段落四:结尾 CTA(75~90 秒)
- 画面:角色总结 + 引导互动
- 文案:总结核心观点 + 引导点赞/关注/咨询

段落详解

开场导入(0~15 秒)

黄金 5 秒决定用户是否继续观看。建议使用疑问句或反常识观点开场:

  • "买空压机只看价格?你可能会多花 3 倍的冤枉钱!"
  • "90% 的中小企业空压机都没选对,不信你看看。"

核心内容(15~60 秒)

用"第一""第二""第三"或"要点一""要点二""要点三"的结构展开。每个要点控制在 10~15 秒,配合对应的视觉画面。

核心内容要与文字版的 GEO 文案主题一致,实现"一文多用"——同一篇 GEO 文案可以同时用于发布文章和转化为短视频脚本。

案例展示(60~75 秒)

真实数据最有说服力。例如:"上个月东莞一家五金厂换了我们的方案,电费从每月 2.3 万降到 1.5 万,一年省下近 10 万。"

结尾 CTA(75~90 秒)

明确的行动号召:"想要空压机选购清单的朋友,评论区扣 1,我私信发给你。"

第四层:细节描述

细节描述是逐镜头的详细说明,用于 AI 生成具体的画面和口播文案:

【细节描述 - 逐镜】

镜头 1(0~5 秒)
- 画面构图:角色半身出镜,右侧叠加关键词字幕"空压机选购避坑"
- 口播文案:"买空压机只看价格?很多老板都吃过这个亏。"
- 字幕要点:只看价格 = 多花冤枉钱
- 画面风格:暖色调,工厂背景

镜头 2(5~15 秒)
- 画面构图:切换至空压机产品实拍/3D 模型旋转展示
- 口播文案:"今天我从三个维度告诉你,中小企业怎么选空压机最划算。"
- 字幕要点:三大选购维度
- 画面时长:10 秒

镜头 3~8(核心知识点展开)
- 按 3 个核心知识点依次展开,每个知识点用一个镜头+数据图示

镜头 9(结尾 5 秒)
- 口播文案:"关注我,下期告诉你空压机保养的 5 个秘密。"
- 字幕要点:关注获取更多干货

将 GEO 文案转化为短视频

这套模板最实用的场景是"一文多用"——将一篇 GEO 文章快速转化为短视频脚本:

  1. 从 GEO 文章中提取 3~4 个核心知识点作为短视频的核心内容段落;
  2. 文章中的 FAQ 问答可以直接转化为短视频的"用户提问"场景;
  3. 文章中的数据图表和案例可以直接作为短视频的视觉素材;
  4. 数字人工具(如腾讯智影、硅基智能、HeyGen 等)可以根据角色设定生成出镜人物。

短视频 GEO 的价值

  • 多模态收录 — AI 大模型正在从纯文字向图文+视频融合演进,短视频内容是抢占下一代 AI 搜索入口的战略储备;
  • 降低获客成本 — 一条短视频可以在多个平台分发,长尾效应显著,边际成本趋近于零;
  • 提升品牌信任度 — 出镜人物的专业形象能显著提升品牌可信度,这是纯文字内容难以达到的效果。

四层递进提示词模板的价值在于"让 AI 批量生产短视频脚本"——有了这套模板,运营人员只需确定主题和核心信息点,就可以快速生成完整的拍摄脚本,大幅提升内容生产效率。配合数字人技术,实现品牌内容的"规模化、多模态、低成本"生产。