Meta 推出了自己的文本到图像生成引擎

2022-07-15 14:37:04

在元宇宙中，会有不同于我们所生活的宇宙的规则。实际上，任何人都可以创造任何想到的东西。从某种意义上说，不会有规则。但当我们谈论的是一个新世界，计算机和人类将并肩生活和工作时，了解这种合作将如何进行是合理的。其中一项合作是文本到图像的生成。现在很流行。例如，OpenAI提供了 Craiyon，而谷歌则拥有 Imagen AI。昨天，该领域的领先者之一 Meta 宣布了其自研的 AI 图像生成引擎。正如该公司所说，新引擎将帮助人们在虚拟世界中创造更多身临其境的艺术。

在纸面上，文本到图像的生成是一件简单的事情。例如，当您说出关键字“医院里有一匹马”时，引擎首先将其通过一个变压器模型、一个神经网络，然后它“理解”您所说的内容，并对它们之间的关系形成上下文理解. 一旦它完成了上述所有步骤并意识到你的意思，它将在AI的帮助下使用一组 GAN(生成对抗网络)创建图像。

由于机器学习的发展及其自我训练的能力，文本到图像生成引擎能够创建您想要的任何废话。我们可以说所有引擎的工作原理都是一样的。但是，它们在 AI 处理方面有所不同。

例如，谷歌的 Imagen更喜欢 Diffusion 模型，“它学习将随机点的图案转换为图像。这些图像一开始是低分辨率，然后逐渐提高分辨率。” 另一方面，谷歌的 Parti AI “首先将一组图像转换为一系列代码条目，类似于拼图。然后将给定的文本提示翻译成这些代码条目，并创建一个新图像。”

但是，您应该知道，作为用户，您无法控制输出图像的特定方面。“为了实现人工智能推动创意表达的潜力，”Meta 首席执行官马克扎克伯格在周二的博客中表示，“人们应该能够塑造和控制系统生成的内容。”

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时候联系我们修改或删除，多谢

标签：