AI推理: 引导尺度, 采样步数, 采样偏移
0 ihunter 2025/08

它们都是生成推理阶段的重要控制项,不同取值会直接影响生成质量、风格、速度和稳定性。


1. 推理(Inference)

  • 意思
    推理就是在已经训练好的模型上,根据输入(文字提示、图像、音频等)生成结果的过程
    这里的推理速度和质量主要取决于采样步数引导尺度、模型大小和硬件性能。

  • 设置建议

    • 一般不需要直接设置“推理”这个词本身,而是调整它相关参数(比如采样步数、采样算法)。

    • 如果要追求速度,可选择“快速采样”模式或减少采样步数;追求质量可用更多步数。


2. 引导尺度(Guidance Scale / CFG Scale)

  • 意思
    控制生成结果对你的提示词(Prompt)的依赖程度。

    • 低值 → 模型更自由,会添加它自己理解的细节,但可能偏离你的提示。

    • 高值 → 模型更严格遵循提示,但画面可能僵硬或细节怪异。

  • 数值参考(SD / T2V 常见区间)

    • 5–7:自然平衡,既有提示内容,又保留模型创意(推荐大多数情况)。

    • 8–12:更严格遵循提示,适合需要高度一致性的任务(角色、精确构图)。

    • <4:更随意、梦幻或艺术化,但可能跑题。

  • 注意
    过高(>15)可能导致画面失真、色块、重复元素。


3. 采样步数(Sampling Steps)

  • 意思
    生成过程中扩散模型反复去噪的迭代次数。步数越多,模型有更多机会修正细节。

  • 影响

    • 少步数(4–10) → 快速,但细节可能模糊或噪点多(如 Lightning T2V 的 4 步就是极限加速)。

    • 中步数(15–30) → 常规高质量生成范围。

    • 多步数(>40) → 细节更精致,但收益递减,速度明显下降。

  • 建议

    • 文生图:20–30 步一般足够。

    • 追求速度(视频/大量生成):8–12 步。

    • 极限清晰度:40 步以上,但要有强硬件支持。


4. 采样偏移(Sampling Offset)

  • 意思
    控制采样过程中噪声调度的起始点或偏移量,相当于在生成曲线中提前或延后介入去噪过程。
    有时也叫 eta offsetnoise offset

  • 作用

    • 改变画面的纹理、锐度、对比度等细节特征。

    • 不同模型对偏移的敏感度不同,有些几乎没差,有些会显著影响风格。

  • 数值参考

    • 0 或默认:标准生成。

    • 0.5–1:纹理更柔和。

    • 1.5+:更强对比和锐度,但可能带来颗粒感。

  • 建议

    • 不知道用啥就留默认(通常 0)。

    • 想调风格时小幅微调(0.3–1.0 区间)。


综合设置建议(T2V / SDX / Lightning 模型参考)

   场景            采样步数                 引导尺度(CFG)           偏移
极速预览4–85–70
标准高质量20–306–80–0.5
角色/风格精确25–358–100–0.5
艺术/自由创作15–254–60.5–1
收藏 有帮助 没帮助

上篇: 即梦提示词撰写10个硬核技巧
下篇: 没有了

相关主题
 IT博客索引
 AI软件索引
 猜你喜欢
热门
焦点
视点
头条