它们都是生成推理阶段的重要控制项,不同取值会直接影响生成质量、风格、速度和稳定性。
1. 推理(Inference)
意思:
推理就是在已经训练好的模型上,根据输入(文字提示、图像、音频等)生成结果的过程。
这里的推理速度和质量主要取决于采样步数、引导尺度、模型大小和硬件性能。设置建议:
一般不需要直接设置“推理”这个词本身,而是调整它相关参数(比如采样步数、采样算法)。
如果要追求速度,可选择“快速采样”模式或减少采样步数;追求质量可用更多步数。
2. 引导尺度(Guidance Scale / CFG Scale)
意思:
控制生成结果对你的提示词(Prompt)的依赖程度。低值 → 模型更自由,会添加它自己理解的细节,但可能偏离你的提示。
高值 → 模型更严格遵循提示,但画面可能僵硬或细节怪异。
数值参考(SD / T2V 常见区间):
5–7:自然平衡,既有提示内容,又保留模型创意(推荐大多数情况)。
8–12:更严格遵循提示,适合需要高度一致性的任务(角色、精确构图)。
<4:更随意、梦幻或艺术化,但可能跑题。
注意:
过高(>15)可能导致画面失真、色块、重复元素。
3. 采样步数(Sampling Steps)
意思:
生成过程中扩散模型反复去噪的迭代次数。步数越多,模型有更多机会修正细节。影响:
少步数(4–10) → 快速,但细节可能模糊或噪点多(如 Lightning T2V 的 4 步就是极限加速)。
中步数(15–30) → 常规高质量生成范围。
多步数(>40) → 细节更精致,但收益递减,速度明显下降。
建议:
文生图:20–30 步一般足够。
追求速度(视频/大量生成):8–12 步。
极限清晰度:40 步以上,但要有强硬件支持。
4. 采样偏移(Sampling Offset)
意思:
控制采样过程中噪声调度的起始点或偏移量,相当于在生成曲线中提前或延后介入去噪过程。
有时也叫eta offset或noise offset。作用:
改变画面的纹理、锐度、对比度等细节特征。
不同模型对偏移的敏感度不同,有些几乎没差,有些会显著影响风格。
数值参考:
0 或默认:标准生成。
0.5–1:纹理更柔和。
1.5+:更强对比和锐度,但可能带来颗粒感。
建议:
不知道用啥就留默认(通常 0)。
想调风格时小幅微调(0.3–1.0 区间)。
✅ 综合设置建议(T2V / SDX / Lightning 模型参考)
| 场景 | 采样步数 | 引导尺度(CFG) | 偏移 |
|---|---|---|---|
| 极速预览 | 4–8 | 5–7 | 0 |
| 标准高质量 | 20–30 | 6–8 | 0–0.5 |
| 角色/风格精确 | 25–35 | 8–10 | 0–0.5 |
| 艺术/自由创作 | 15–25 | 4–6 | 0.5–1 |
上篇:
即梦提示词撰写10个硬核技巧
下篇:
controlnet-canny, controlnet-depth 场景介绍
1 谁敢信!用豆包生成8篇小说全部过签了 2 Ai 新玩法,手把手教你用DeepSeek做十二星座视频教程 3 AI生成《乌鸦喝水》的成语故事,提问方法+实操 4 即梦智能多帧长达45s视频!连续创作 5 打戏万能提示词!古风电视剧片段 6 即梦4.0制作一家三口旅游视频!人物一致性高度统一 7 豆包新功能4.0来了!全免费,案例实测 8 爱了这个万能PPT制作方法,解决行业需求!一键生成只需3S搞定 9 读书博主的福音!小云雀制作读书视频几分钟一个 10 AI短剧不花钱!电影级的感觉出来了。场面宏大镜头感强 11 一分钟教会你如何制作财神临门视频,简单出效果 12 很多人不会,即梦首尾帧的高级玩法!小短剧片段