Copax TimeLessXL – SDXL1.0于2023年7月26日由Stability AI发布。这一版本在多个方面实现了重大突破,并带来了显著的性能提升。以下是对该模型特点和参数要求的详细介绍。

模型特点

SDXL 1.0 包含两个主要组件:基本文本到图像生成模型(sdxml-base-1.0)和精细化处理器(sdxml-refiner-1.0)。基础模型负责初步生成1024 x 1024分辨率的图像,而精细化处理器则进一步优化这些初始结果,以提高图像质量。这种两阶段架构能够在不牺牲速度或过多计算资源的情况下,提供更高保真度、更具视觉冲击力的输出。

文本编码与提示

SDXL 1.0 使用 OpenCLIP-ViT/G 和 CLIP-ViT/L 两种不同类型的文本编码器进行输入提示符解析,这使得它能更好地理解复杂概念并生成准确图片。此外,该模型还能通过较少文字描述来产生高质量内容,大大简化了用户操作。然而,77个令牌限制依然存在,因此需要注意这一点。

图像质量

默认情况下,SDXL 1.0 能够本地生成色彩鲜艳、照明效果良好的1024 x 1024分辨率图片,使主体物体通常位于中心位置,非常适合新手使用。在艺术风格应用上,该版本表现出色,可以根据特定艺术家的风格调整画面构成,从而满足多样化创作需求。例如,通过简单提示可以得到具有梵高风格的一幅宇航员骑马作品。

参数要求

为了运行 SDXL 1.0,需要至少8GB VRAM 的消费级 GPU。然而,与以前版本相比,新架构增加了更多参数,包括3.5B 参数量级别文本到图像转换模块及6.6B 参数量级别精细化处理模块。因此,对于内存 (VRAM) 要求有所增加,同时推理时间也相应延长,但仍旧保持了相对较低门槛,让普通用户也能体验其强大功能。

此外,由于该新体系结构,不同插件需重新训练以便兼容集成。因此整个生态系统需要重建,这将耗费大量时间与资源。同时,目前组合控件如 T2I 和 ControlNet 尚未支持,但正在开发中,将来会无缝整合进工作流程中使用。

C 站地址:https://civitai.com/models/118111?modelVersionId=164378 ↗

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。