AI 图像生成的提示词工程积累了比证据更多的民间传说。我们在 2026 年 5 月做了一个受控实验:60 个提示词在五个主题类别中,在 Midjourney v7、Flux 2 Pro 和 Imagen 4 各跑两次——一次应用 "规则",一次不应用——并按盲法 1-10 质量评分。
四条规则通过了测试。三条没有。
持续有效的规则
**1. 主体在前,修饰词在后。** 把名词放在最前,然后堆叠风格、光照和相机细节,平均三模型得分提升 18%。模型从左到右 tokenize,早期 token 权重更高。
**2. 指定镜头或焦距。** 添加 '85mm 人像镜头'、'24mm 广角' 或 '微距 100mm' 按主题改善构图质量 12-22%。数字对模型不重要——但它们编码了训练数据中的相机式构图。
**3. 每次生成只用一个风格参考。** '伦勃朗风格的油画带水彩点缀和像素艺术着色' 产出糊状物。挑一个主导风格加纹理词 ('柔和'、'锐利'、'painterly') 比混三个风格参考更好。
**4. Negative Prompt 只在 Stable Diffusion 和 Flux 有效。** Midjourney 的 --no 参数效果不错。GPT Image-2 和 Imagen 4 一般忽略显式否定,对正面改写响应更好——用 '宁静' 代替 '无混乱'。
没有差异的规则
**1. 添加艺术家姓名。** 大多数模型过滤或重混艺术家签名,命名特定艺术家不再可靠改善输出质量。风格描述词 ('印象派'、'art nouveau') 更有效。
**2. 神奇后缀词。** '4k'、'masterpiece'、'best quality' 曾在 Stable Diffusion 1.5 上提升输出。在现代模型上这些是训练集噪声,什么也不加。
**3. 相机机身型号。** 'Shot on Canon EOS R5' vs 'shot on Sony A7R IV' 产生统计上相同的结果。镜头、光照和主体距离重要——机身名字不重要。
起步模板
人像:[主体]、[姿势和表情]、[光照]、[镜头]、[风格描述词]、[情绪/氛围]。
例子:一个饱经风霜的渔民,凝视风暴地平线,被金色时光夕阳侧光照亮,85mm 人像镜头,painterly 油画风格收尾,忧郁和反思。
浏览我们的提示词库,有 50+ 跨人像、logo 和动漫类别的实测例子。