稳定人工智能发布SDXL 09文字生成图片模型,图像质量大幅提升
【ITBEAR科技资讯】6月25日消息,稳定人工智能(StabilityAI)近日正式发布了他们旗下的文字生成图片模型SDXL0.9。这一版本在图像内容和构图细节方面经过了重大改进,并且可以在消费级GPU上高效运行。
据悉,SDXL0.9在所有开源图像模型中具备最多的参数数量,其中包括一个基础模型和一个附加模型,分别拥有35亿参数和66亿参数。稳定人工智能团队采用了渐进式的工作过程,首先使用基础模型生成初步细节,然后通过附加模型对图像进行精细化处理。如果读者曾经使用过稳定扩散(StableDiffusion)技术,可能会对这种渐进式的工作过程感到熟悉。
稳定人工智能表示,SDXL0.9采用了两个CLIP模型,其中包括了目前体积最大的OpenCLIP模型之一,名为vitg/14。借助这个模型,稳定扩散能够生成更深、分辨率更高的逼真图像。
据ITBEAR科技资讯了解,稳定人工智能团队计划在接下来发布一篇研究博客,详细介绍SDXL0.9的模型规格和更多参数细节。预计该模型将于7月发布1.0正式版本,并在GitHub上开源。这将进一步推动人工智能技术的发展和应用。
稳定人工智能的SDXL0.9文字生成图片模型的发布,标志着他们在图像生成领域取得了重要的进展。这一版本的改进将使用户能够更加轻松地创建逼真的图像,并为消费级GPU用户提供了更好的性能。随着SDXL0.9的进一步发展和1.0版本的发布,我们可以期待更多创新和应用场景的出现,这将极大地推动图像生成技术的发展。
近日人工智能的特长之一“文字转图片”很火,顺手给大家介绍一个也在做这件事情的人工智能机构。独立研究机构Stability
来源:雪球App,作者:谭婧在充电,(https://xueqiu.com/1359776485/228648130)
近日人工智能的特长之一“文字转图片”很火,顺手给大家介绍一个也在做这件事情的人工智能机构。独立研究机构StabilityAI成立于2020年,背后出资人是数学家,计算机科学家,著名投资人莫斯塔克(EmadMostaque)。StabilityAI是凭借他个人的私人财富建立,他成立这个机构是希望能够培育一个人工智能的开源研究社区。这家机构总部位于硅谷LosAltos。StabilityAI有钱到动不动为服务器配置了4000个英伟达(Nvidia)A100GPU。莫斯塔克曾在孟买投顾公司ReligareCapitalMarkets任首席中东暨北非策略师。莫斯塔克(EmadMostaque)曾经这样评论利比亚,他表示:“利比亚是个有钱到不行的国度,他们需要的不是外资,而是技术。”也许正是由于他在资金和技术之间看到了技术的奇妙价值。他现在则表示:“除了我们的75名员工之外,没有任何其他人拥有决策权——无论是亿级富翁,大型基金机构,还是政府机关,我们完全独立。我们计划加速基础人工智能开源发展。”这家机构刚刚发布了一个可以免费使用的AI图片生成产品StableDiffusion。人工智能让文本描述从而生成图像的技术,自2021年初以来快速发展。从OpenAI的DALL-E1和CLIP,到2022年的DALL-E2,再到谷歌Imagen和Parti。而下图是StabilityAI和RunwayML,LMUMunich,EleutherAI以及LAION机构的科学家合作的结果“赛博京剧”