您的位置：首页 >要闻 > 正文

每日关注!Stability AI新文本到图像模型DeepFloyd IF 拥有深度文本理解能力

来源：站长之家时间：2023-05-08 16:36:12

编程客栈（）5月8日消息:Staphpbility AI及其多模态 AI 研究实验室 DeepFloandroidyd 宣布发布 DeepFloyd IF 研究版php，这是一种尖端的文本到图像级联像素android扩散模型，并且可以智能地将文本集成到图像中该模型最初仅限于非商业、研究许可使用场景，但计划在未来发布开源版本。

DeepFloyd IF 拥有几个显着的特点，包括:

(相关资料图)

深度文本指提示词理解能力:该模型使用T5-XXL-1.1作为文本编码器，具有多个文本-图像交叉注意力层，确保提示和图像之间更好的对齐。

连贯清晰的文本和生成的图像:DeepFloyd IF 可以生成包含具有不同属性和空间关系的对象的图像。

高度逼真:该模型在 COCO 数据集上取得了令人印象深刻的零样本 FID 分数6.66。

纵横比转换:该模型可以生成非标准纵横比的图像，包括垂直、水平和标准方形纵横比。

零样本迁移能力实现图像到图像的转换:该模型可以修改图像的样式、图案和细节，同时保留其基本形式。

以下是 DeepFloyd IF 创建的一些示例:

DeepFloyd IF 的模块化、级联、像素扩散设计由多个协同交互的神经模块组成。该模型在像素空间中工作，使用不同分辨率的单独训练模型以级联方式处理高分辨率数据。这涉及生成低分辨率样本的基本模型和生成高分辨率图像的连续超分辨率模型。

该模型是在包含10亿（图像、文本）对的自定义高质量 LAION-A 数据集上训练的，LAION-A 数据集是 LAION-5B 数据集英文部分的一个子集。DeepFloyd 的自定义过滤器用于删除带水印、NSFW 和其他不当内容。

最初，DeepFloyd IF 是根据研究许可发布的。研究人员旨在鼓励跨领域（如艺术、设计、讲故事、虚拟现实和可访问性）开发新颖的应用程序。为了激发潜在的研究，他们提出了几个技术、学术和伦理研究问题。

技术研究问题包括:

优化 IF 模型以增强性能、可扩展性和效率。

通过改进抽样、指导或微调模型来提高输出质量。

将用于修改稳定扩散输出的技术应用到 DeepFloyd IF。

学术研究问题包括:

探索预训练对迁移学习的作用。

增强模型对图像生成的控制。

通过集成多种模式，将模型的功能扩展到文本到图像合成之外。

评估模型的可解释性，以提高对生成图像视觉特征的理解。

伦理研究问题包括:

识别和减轻 DeepFloyd IF 中的偏差。

评估模型对社交媒体和内容生成的影响。

开发利用该模型的有效假js图像检测器。

DeepFloyd "s hugs Face空间网址: https://huggingface.co/DeepFloyd。

DeepFloyd IF 网址:https://deepfloyd.ai/deepfloyd-if

DeepFloyd IF github项目地址:https://github.com/deep-floyd/IF

免责声明：本文不构成任何商业建议，投资有风险，选择需谨慎！本站发布的图文一切为分享交流，传播正能量，此文不保证数据的准确性，内容仅供参考

关键词：

资讯

再添荣誉！飞宇蝎子稳定器征服132位评委获得德国iF设计大奖！ 近日，被誉为设计界奥斯卡的德国iF设计奖公布了2023年度获奖名单，飞宇蝎子稳定器荣获2023年iF产品设计大奖！德国iF设计大奖至今已走过70
科大讯飞智能办公本体积小随身携带更方便，适合多场景办公 面对动辄一整天的会议，现代职场人不仅会坐得腰酸背痛，就连手腕也会因为长时间手写会议记录而发酸发胀。而想要摆脱这样的尴尬处境，就要调
自驾游0焦虑不是梦，选择瑞虎7 PLUS新能源就是选择无忧出行 五月来临，又到一年美好初夏出游时。在刚刚过去的五一假期，我们不管是置身去郊外的青山绿水看看袅袅炊烟，又或是跨省来一个说走就走的旅行
河南食在味至餐饮管理有限公司的东芳叶品牌与《速度与激情10》联名推广 河南食在味至餐饮管理有限公司亲历打造的东芳叶品牌已经与环球影业达成合作，将引进好莱坞大片《速度与激情10》在中国内地院线上映。这是继
车主眼中的瑞虎3x有何魅力？看看宝妈怎么说 大部分女性或许都会拥有一种身份：妈妈。那么新时代的妈妈负担和能量到底能有多大呢？来自河北的钱女士说，作息比上班族卷，几乎没时间吃口
田朴珺对话查理·芒格，体会一代投资大师的人生智慧 2023年巴菲特股东大会，5月6日在奥马哈CHI Health Center Omaha举行。对话查理·芒格给人以无限智慧和启发2017年，我参加过一次巴菲特

每日关注!Stability AI新文本到图像模型DeepFloyd IF 拥有深度文本理解能力

热门资讯

文章排行

最新图文