摘要 :
ComfyUI 中使用提示词进行图生图,即根据已有图像和文字提示生成新的图像,是一种强大且常用的功能。以下为你详细介绍其流程及相关要点:
工作流步骤
1. 加载必要资源
……

ComfyUI 中使用提示词进行图生图,即根据已有图像和文字提示生成新的图像,是一种强大且常用的功能。以下为你详细介绍其流程及相关要点:
- 图像加载:使用 “Load Image” 节点,从本地选择要作为基础的原始图像。该图像将作为生成新图像的参考和起点。
- 模型加载:通过 “Checkpoint Loader” 节点加载合适的模型。不同的模型在生成图像的风格、细节等方面有差异,例如 Stable Diffusion 系列的不同版本模型,或者针对特定风格(如动漫、写实等)优化的模型。
将加载的原始图像连接到 “VAE Encode” 节点,将图像编码为潜在空间表示。这一步是为了让模型能够更好地处理图像信息,以便后续基于此进行生成。
- 正向提示词:在 “CLIP Text Encode” 节点中输入正向提示词。正向提示词用于描述你期望生成图像的特征,包括风格(如 “水彩画风格”“油画风格”)、主题(如 “森林中的城堡”“海边的日落”)、色彩(如 “暖色调”“冷色调”)、构图元素(如 “远景”“特写”)等。提示词越详细,生成的图像越有可能符合你的预期。例如:“水彩画风格,美丽的海边沙滩,远处有帆船,天空是粉色和橙色的渐变,暖色调”。
- 反向提示词:同样在 “CLIP Text Encode” 节点中输入反向提示词。反向提示词用于排除你不希望在生成图像中出现的元素,如 “模糊的画面”“奇怪的颜色搭配”“不协调的比例” 等。通过设置反向提示词,可以提高生成图像的质量和准确性。
在 “K Sampler” 节点中设置采样相关的参数:
- 采样器类型:不同的采样器在生成速度和图像质量上有所不同,常见的采样器有 DPM++ 2M Karras、Euler a 等。你可以根据自己的需求进行选择和尝试。
- 采样步数:采样步数决定了模型在生成图像过程中的迭代次数。步数越多,生成的图像可能越精细,但也会增加生成时间。一般来说,20 – 50 步是比较常用的范围。
- CFG Scale:该参数控制提示词对生成图像的影响程度。值越高,生成的图像越接近提示词的描述,但可能会导致图像的多样性降低;值越低,图像的随机性会增加。通常取值在 7 – 12 之间。
将编码后的图像、处理好的提示词以及设置好的采样参数连接到相应的节点,确保连接正确后,点击 “Queue Prompt” 按钮开始生成图像。模型会根据原始图像、提示词和采样参数,在潜在空间中生成新的图像表示,最后通过 “VAE Decode” 节点将其解码为可视的图像。
如果生成的图像不符合预期,可以调整提示词、采样参数等,再次进行生成。还可以使用 ComfyUI 中的其他节点对生成的图像进行后期处理,如调整色彩、对比度、清晰度等,以获得更满意的效果。
- 具体明确:尽量使用具体的词汇来描述你想要的图像特征,避免模糊的表述。例如,用 “红色的玫瑰” 代替 “花”。
- 分层描述:可以按照不同的维度对图像进行描述,如先描述整体风格,再描述主题内容,最后描述细节特征。
- 参考优秀示例:可以参考其他用户分享的优秀提示词,学习他们的表述方式和技巧。同时,也可以在一些社区中与其他用户交流,获取更多关于提示词的经验和建议。
还没有评论呢,快来抢沙发~