稳定人工智能发布SDXL 09文字生成图片模型，图像质量大幅提升人工智能文字转图片

发表时间：2023-06-28 08:25:46

稳定人工智能发布SDXL 09文字生成图片模型，图像质量大幅提升

【ITBEAR科技资讯】6月25日消息，稳定人工智能(StabilityAI)近日正式发布了他们旗下的文字生成图片模型SDXL0.9。这一版本在图像内容和构图细节方面经过了重大改进，并且可以在消费级GPU上高效运行。

据悉，SDXL0.9在所有开源图像模型中具备最多的参数数量，其中包括一个基础模型和一个附加模型，分别拥有35亿参数和66亿参数。稳定人工智能团队采用了渐进式的工作过程，首先使用基础模型生成初步细节，然后通过附加模型对图像进行精细化处理。如果读者曾经使用过稳定扩散(StableDiffusion)技术，可能会对这种渐进式的工作过程感到熟悉。

稳定人工智能表示，SDXL0.9采用了两个CLIP模型，其中包括了目前体积最大的OpenCLIP模型之一，名为vitg/14。借助这个模型，稳定扩散能够生成更深、分辨率更高的逼真图像。

据ITBEAR科技资讯了解，稳定人工智能团队计划在接下来发布一篇研究博客，详细介绍SDXL0.9的模型规格和更多参数细节。预计该模型将于7月发布1.0正式版本，并在GitHub上开源。这将进一步推动人工智能技术的发展和应用。

稳定人工智能的SDXL0.9文字生成图片模型的发布，标志着他们在图像生成领域取得了重要的进展。这一版本的改进将使用户能够更加轻松地创建逼真的图像，并为消费级GPU用户提供了更好的性能。随着SDXL0.9的进一步发展和1.0版本的发布，我们可以期待更多创新和应用场景的出现，这将极大地推动图像生成技术的发展。

近日人工智能的特长之一“文字转图片”很火，顺手给大家介绍一个也在做这件事情的人工智能机构。独立研究机构Stability

来源：雪球App，作者：谭婧在充电，（https://xueqiu.com/1359776485/228648130）

近日人工智能的特长之一“文字转图片”很火，顺手给大家介绍一个也在做这件事情的人工智能机构。独立研究机构StabilityAI成立于2020年，背后出资人是数学家，计算机科学家，著名投资人莫斯塔克（EmadMostaque）。StabilityAI是凭借他个人的私人财富建立，他成立这个机构是希望能够培育一个人工智能的开源研究社区。这家机构总部位于硅谷LosAltos。StabilityAI有钱到动不动为服务器配置了4000个英伟达（Nvidia）A100GPU。莫斯塔克曾在孟买投顾公司ReligareCapitalMarkets任首席中东暨北非策略师。莫斯塔克（EmadMostaque）曾经这样评论利比亚，他表示：“利比亚是个有钱到不行的国度，他们需要的不是外资，而是技术。”也许正是由于他在资金和技术之间看到了技术的奇妙价值。他现在则表示：“除了我们的75名员工之外，没有任何其他人拥有决策权——无论是亿级富翁，大型基金机构，还是政府机关，我们完全独立。我们计划加速基础人工智能开源发展。”这家机构刚刚发布了一个可以免费使用的AI图片生成产品StableDiffusion。人工智能让文本描述从而生成图像的技术，自2021年初以来快速发展。从OpenAI的DALL-E1和CLIP，到2022年的DALL-E2，再到谷歌Imagen和Parti。而下图是StabilityAI和RunwayML，LMUMunich，EleutherAI以及LAION机构的科学家合作的结果“赛博京剧”

稳定人工智能发布SDXL 09文字生成图片模型，图像质量大幅提升 人工智能文字转图片