它们都是生成推理阶段的重要控制项,不同取值会直接影响生成质量、风格、速度和稳定性。
1. 推理(Inference)
意思:
推理就是在已经训练好的模型上,根据输入(文字提示、图像、音频等)生成结果的过程。
这里的推理速度和质量主要取决于采样步数、引导尺度、模型大小和硬件性能。设置建议:
一般不需要直接设置“推理”这个词本身,而是调整它相关参数(比如采样步数、采样算法)。
如果要追求速度,可选择“快速采样”模式或减少采样步数;追求质量可用更多步数。
2. 引导尺度(Guidance Scale / CFG Scale)
意思:
控制生成结果对你的提示词(Prompt)的依赖程度。低值 → 模型更自由,会添加它自己理解的细节,但可能偏离你的提示。
高值 → 模型更严格遵循提示,但画面可能僵硬或细节怪异。
数值参考(SD / T2V 常见区间):
5–7:自然平衡,既有提示内容,又保留模型创意(推荐大多数情况)。
8–12:更严格遵循提示,适合需要高度一致性的任务(角色、精确构图)。
<4:更随意、梦幻或艺术化,但可能跑题。
注意:
过高(>15)可能导致画面失真、色块、重复元素。
3. 采样步数(Sampling Steps)
意思:
生成过程中扩散模型反复去噪的迭代次数。步数越多,模型有更多机会修正细节。影响:
少步数(4–10) → 快速,但细节可能模糊或噪点多(如 Lightning T2V 的 4 步就是极限加速)。
中步数(15–30) → 常规高质量生成范围。
多步数(>40) → 细节更精致,但收益递减,速度明显下降。
建议:
文生图:20–30 步一般足够。
追求速度(视频/大量生成):8–12 步。
极限清晰度:40 步以上,但要有强硬件支持。
4. 采样偏移(Sampling Offset)
意思:
控制采样过程中噪声调度的起始点或偏移量,相当于在生成曲线中提前或延后介入去噪过程。
有时也叫eta offset或noise offset。作用:
改变画面的纹理、锐度、对比度等细节特征。
不同模型对偏移的敏感度不同,有些几乎没差,有些会显著影响风格。
数值参考:
0 或默认:标准生成。
0.5–1:纹理更柔和。
1.5+:更强对比和锐度,但可能带来颗粒感。
建议:
不知道用啥就留默认(通常 0)。
想调风格时小幅微调(0.3–1.0 区间)。
✅ 综合设置建议(T2V / SDX / Lightning 模型参考)
| 场景 | 采样步数 | 引导尺度(CFG) | 偏移 |
|---|---|---|---|
| 极速预览 | 4–8 | 5–7 | 0 |
| 标准高质量 | 20–30 | 6–8 | 0–0.5 |
| 角色/风格精确 | 25–35 | 8–10 | 0–0.5 |
| 艺术/自由创作 | 15–25 | 4–6 | 0.5–1 |
上篇:
即梦提示词撰写10个硬核技巧
下篇:
controlnet-canny, controlnet-depth 场景介绍
1 2026 年 AI 创业全景指南:给渴望借 AI 逐梦的人! 2 扣子(Coze)工作流实战:篇篇10W+的小林漫画,用Coze实现了爆款流水线生... 3 用AI自动生成爆款文案的完整流程 4 人工智能 AI 在电商全链条的12个主要应用场景 5 信息差搬砖:用AI把小红书火帖变“付费文档”,日入500+ 6 地理空间AI应用:YOLO vs. SAM 7 AI应用快速原型开发:FastAPI + htmx ——无需React,为了快 8 剖析Mini-SGLang,打开LLM推理引擎的黑盒世界 9 智能目标检测:用 Rust + dora-rs + yolo 构建“机器之眼” 10 快到2026啦 必须掌握的AI智能体全栈技术! 11 2025年AI大模型六大行业风口 12 vLLM + FastAPI:一个高并发、低延迟的Qwen-7B量化服务搭建实录...