机器之心报道
编辑:小舟、蛋酱
开源是永远的必杀技。
(资料图片)
自从文本到图像开源模型 Stable Diffusion 最初版本发布以来,DreamStudio 一直是 Stability AI 新模型和功能的主要界面。迄今,用户已经借助 DreamStudio 创建了数百万张图像。
最近,DreamStudio 还升级到了 SDXL,实现了比其前身 Stable Diffusion 2.1 更详细的图像和构图,并能用较短的 prompt 来创建描述性图像。
就目前来说,DreamStudio 已经可以生成这样的图像,效果不输 Midjourney 5.1:
尽管 DreamStudio 提供了几乎没有门槛的图像生成方法,但它也有一个条件:付费。SDXL 版本的定价甚至还要更高一些。
而且,对一部分技术过关的开发者来说,他们也希望能够在 DreamStudio 的基础上进行一些应用扩展。
或许是听到了网友们的心声?刚刚,Stability AI 发布了 DreamStudio 的开源版本 ——StableStudio。
开源地址:https://github.com/Stability-AI/StableStudio
「我们相信,扩大技术落地的最佳方式是通过开放、社区驱动的开发,而不是闭源产品的私有化迭代。」Stability AI 表示。
在该公司的规划中,StableStudio 的目标是进行更广泛的社区合作,为生成式 AI 打造一个世界级的用户界面,让用户能够充分控制。尽管 DreamStudio 仍将是 Stability 公司托管的 StableStudio 的实现,但最终目标是培养一个能够超越任何由单一公司开发的项目。
具体来说,StableStudio 和 DreamStudio 有什么区别?
Stability AI 做了一些调整,使得该项目对社区更加友好。包括:
删除了 DreamStudio 专属品牌; 所有在线 API 调用都已被插件系统取代,用户可以轻松更换后端; 删除了专属于 Stability 的帐户功能,例如计费、API 密钥管理等。扩展功能
DreamStudio 最初被设想为 Disco Diffusion 的动画 studio,2022 年 Stable Diffusion 发布之后,DreamStudio 的重点就转向了图像生成。
受今年爆火的对话模型启发,4 月 Stability AI 发布了开源 LLM StableVicuna。DreamStudio 的开源版本 StableStudio 将和 StableVicuna 结合,推出聊天界面。
StableVicuna 对话示例。
Stable Diffusion XL 生成的「Stable Vicuna」。
Stability AI 表示,StableStudio 未来可能会更新以下功能:
通过 WebGPU 进行局部推理 通过 stable-diffusion-webui 进行局部推理 桌面安装 ControlNet 工具安装与使用
StableStudio 项目已在 GitHub 上线,其中包含快速安装方法。
项目地址:https://github.com/Stability-AI/StableStudio
要使用 StableStudio,用户需要先安装 Node.js 和 Yarn。然后按照如下命令克隆 StableStudio 存储库
git clone https://github.com/Stability-AI/StableStudio.gitcd StableStudioyarnyarn dev
默认情况下,StableStudio 在 localhost:3000 上运行。用户需要准备 API 密钥才能使用默认的 Stability API 插件;如果没有,则需要在 DreamStudio 上创建帐户并获取密钥。
图像生成主流模型
无论是 DreamStudio,还是开源版本的 StableStudio,其背后的基础模型都是当前大火的图像生成模型 Stable Diffusion。Stable Diffusion 因其能在消费级 GPU 上快速生成高质量图像而得到广泛使用。
Stable Diffusion 模型的技术最早来源于发表在 CVPR 2022 中的一篇论文《High-Resolution Image Synthesis with Latent Diffusion Models》。为了训练出 Stable Diffusion,研究团队动用了 4000 个 A100 Ezra-1 AI 超大集群, Stability AI 公司提供了这些算力。
2022 年 8 月,Stability AI 宣布发布 Stable Diffusion 并开源,11 月,他们又发布了 Stable Diffusion 2.0 版本。现在,Stable Diffusion 已取代 GAN 成为图像生成领域主流模型。
下一篇:最后一页
对于百日笛子千日箫下一句这个问题感兴趣的朋友应该很多,这个也是目前大家比较关注的问题,那么下面小好小
波导股份:波导股份关于召开2022年年度股东大会的通知
1、歌词2、世界上有许多干扰3、生死难料,寂寞难耐。4、你能飞多高?5、黎明还有多远?6、在梦境中受苦7、
近日,市场监管总局在全国范围开展企业信用监管数据质量全面提升行动,计划用一年半时间解决企业信用监管数
人民网北京5月18日电(记者孙红丽)2023年5月31日是第36个世界无烟日。记者从国家卫生健康委获悉,今年世界
松花江网,是经国家互联网信息办公室批准的国家一类新闻网站,吉林省重点新闻网站。松花江网以江城日报社的
1、在魅力之城——吉林市的东南部,丰满旅游开发区境内,一座极具现代化特色的教育园区掩映在青山绿水之间
编者按:2023年3月30日,高等教育专业评价机构软科正式发布“2023软科中国大学排名”,晋中信息学院凭借新
2023年5月17日哈尔斯(002615)发布公告称公司于2023年5月17日召开业绩说明会。
古井烧鹅、杜阮凉瓜、台山膏蟹……5月16日晚,2023华侨华人粤港澳大湾区大会欢迎晚宴在江门举行,来自90个
X 关闭
粤省事App“团体码”服务升级 “指尖管”更便捷
福建不强制学生统一参加中小学课后服务
浙江柯桥本轮疫情为2起独立疫情 2人有进口快递接触史
河南新增本土确诊病例1例 本土无症状感染者28例
黑龙江本土感染者清零
5月24日0时至24时 天津新增17名本土阳性感染者
X 关闭