8 术语平实语言2026 更新

AI 图像词汇表

阅读 AI 图像文档、博文和提示词指南时遇到的技术术语的平实中文定义。

LoRA

LoRA 是一个小附加文件 (通常 50-200 MB),在不重新训练整个模型的情况下教会基础 AI 图像模型一种特定风格、角色或视觉概念。基础模型保持冻结;LoRA 在生成时注入少量训练参数。CivitAI 上的 Stable Diffusion 生态系统就是通过 LoRA 让你按需复现特定艺术家风格、动漫美学或虚构角色。在消费级 GPU 上训练自己的 L…

查看完整定义 →

ControlNet

条件控制网络

ControlNet 是一种附加架构,可以约束 AI 图像生成遵循特定姿势、深度图、边缘图或构图。不依赖单独的提示词,你给模型第二个输入——火柴人姿势、Canny 边缘轮廓、深度图——输出会尊重该结构。ControlNet 是大多数专业 AI 图像工作流的技术基础,因为它让设计师在保持构图不变的同时迭代风格。最初为 Stable Diffusion 构建;F…

查看完整定义 →

Diffusion Model

现代 AI 图像生成器背后的架构

扩散模型从纯噪声开始,通过许多小步骤逐渐去噪,直到出现一张连贯的图像。模型通过反转向真实训练图像添加噪声的前向过程来学习这个去噪过程。2026 年几乎所有主要 AI 图像模型——Stable Diffusion、Midjourney、Flux、DALL-E、Imagen、Nano Banana、Seedream——都是扩散模型或其紧密衍生品。主要例外是像旧的…

查看完整定义 →

CFG Scale

无分类器引导

CFG Scale 控制 AI 图像模型严格遵循你的提示词与采取多少创意自由之间的平衡。低值 (1-4) 产生宽松、梦幻般的结果,可能忽略提示词部分内容。中值 (5-9) 是大多数主题的最佳点。高值 (10-20) 强迫模型遵循每个词但通常产生过饱和、塑料感的输出。Stable Diffusion 将此暴露为滑块;Midjourney 通过 --styliz…

查看完整定义 →

Negative Prompt

你希望模型避免的内容

Negative Prompt 是一个单独的文本框,列出模型不应包含在图像中的内容。可用于避免水印、多余手指、模糊伪影和不需要的风格元素。Negative Prompt 在 Stable Diffusion 和 Flux 2 上效果显著,但在 GPT Image-2 和 Imagen 4 上效果小或为零,因为它们训练目标不同。Midjourney 使用 --…

查看完整定义 →

Inpainting

编辑已有图像的特定区域

Inpainting 让你遮罩图像的特定区域,让 AI 仅重新生成该区域,而保持其余部分不变。经典用例是删除不需要的对象、换脸、改背景、修复在其他方面良好的生成上的一只坏手。Nano Banana 2 通过对话完成此操作 ("把杯子换成玻璃杯")。Stable Diffusion 和 Flux 通过专用 inpainting 模型和 ComfyUI、Auto…

查看完整定义 →

Image-to-Image

用已有图像作为起点

Image-to-Image (通常缩写为 img2img) 从已有图像而非纯噪声开始扩散过程。模型保留输入的粗略构图和颜色,但应用文本提示词来转换风格、主题或细节。可用于将照片转换为绘画、将草图细化为成品插图、生成起始图像的一致变体。每个主要模型都支持某种形式的 img2img;实现和强度滑块有所不同。…

查看完整定义 →

Seed

生成的随机起点

Seed 是决定扩散模型开始去噪的初始噪声模式的随机数。在相同模型上使用相同种子和相同提示词每次产生几乎相同的图像——对可重复性、角色一致性和迭代精修至关重要。Midjourney 通过信封反应显示种子;Stable Diffusion 在每个 UI 中直接暴露;Flux 平台在 API 响应中包含。不同模型用相同种子仍产生不同图像。…

查看完整定义 →

AI 图像 词汇表

LoRA

ControlNet

Diffusion Model

CFG Scale

Negative Prompt

Inpainting

Image-to-Image

Seed

顶级 AI 图像模型一站集合

AI 图像词汇表