它们都是生成推理阶段的重要控制项,不同取值会直接影响生成质量、风格、速度和稳定性。
1. 推理(Inference)
意思:
推理就是在已经训练好的模型上,根据输入(文字提示、图像、音频等)生成结果的过程。
这里的推理速度和质量主要取决于采样步数、引导尺度、模型大小和硬件性能。设置建议:
一般不需要直接设置“推理”这个词本身,而是调整它相关参数(比如采样步数、采样算法)。
如果要追求速度,可选择“快速采样”模式或减少采样步数;追求质量可用更多步数。
2. 引导尺度(Guidance Scale / CFG Scale)
意思:
控制生成结果对你的提示词(Prompt)的依赖程度。低值 → 模型更自由,会添加它自己理解的细节,但可能偏离你的提示。
高值 → 模型更严格遵循提示,但画面可能僵硬或细节怪异。
数值参考(SD / T2V 常见区间):
5–7:自然平衡,既有提示内容,又保留模型创意(推荐大多数情况)。
8–12:更严格遵循提示,适合需要高度一致性的任务(角色、精确构图)。
<4:更随意、梦幻或艺术化,但可能跑题。
注意:
过高(>15)可能导致画面失真、色块、重复元素。
3. 采样步数(Sampling Steps)
意思:
生成过程中扩散模型反复去噪的迭代次数。步数越多,模型有更多机会修正细节。影响:
少步数(4–10) → 快速,但细节可能模糊或噪点多(如 Lightning T2V 的 4 步就是极限加速)。
中步数(15–30) → 常规高质量生成范围。
多步数(>40) → 细节更精致,但收益递减,速度明显下降。
建议:
文生图:20–30 步一般足够。
追求速度(视频/大量生成):8–12 步。
极限清晰度:40 步以上,但要有强硬件支持。
4. 采样偏移(Sampling Offset)
意思:
控制采样过程中噪声调度的起始点或偏移量,相当于在生成曲线中提前或延后介入去噪过程。
有时也叫eta offset
或noise offset
。作用:
改变画面的纹理、锐度、对比度等细节特征。
不同模型对偏移的敏感度不同,有些几乎没差,有些会显著影响风格。
数值参考:
0 或默认:标准生成。
0.5–1:纹理更柔和。
1.5+:更强对比和锐度,但可能带来颗粒感。
建议:
不知道用啥就留默认(通常 0)。
想调风格时小幅微调(0.3–1.0 区间)。
✅ 综合设置建议(T2V / SDX / Lightning 模型参考)
场景 | 采样步数 | 引导尺度(CFG) | 偏移 |
---|---|---|---|
极速预览 | 4–8 | 5–7 | 0 |
标准高质量 | 20–30 | 6–8 | 0–0.5 |
角色/风格精确 | 25–35 | 8–10 | 0–0.5 |
艺术/自由创作 | 15–25 | 4–6 | 0.5–1 |
上篇:
即梦提示词撰写10个硬核技巧
下篇:
controlnet-canny, controlnet-depth 场景介绍
1 DeepSeek如何颠覆短视频创作?三步生成内容,人人都是导演 2 大模型无非就这点东西 3 原来即梦也能用视频首尾帧功能。做妖兽变身很丝滑 4 免费制作!AI切水果万物皆可切!解压又有趣 5 秦始皇的一生!AI制作历史人物解说视频,很多人喜欢 6 AI苗疆少女暗黑古风,第一自拍视角,一分钟教会你 7 即梦制作两个小孩吃饺子视频,把生活的碎片视频化 8 一个万能的AI提示词反推公式 9 用豆包搞定连贯分镜头视频,超简单 10 即梦3.0即可实现,多分镜人物一致性的视频! 11 controlnet-canny, controlnet-depth 场景介... 12 AI推理: 引导尺度, 采样步数, 采样偏移