Meta 推出了自己的文本到图像生成引擎

在元宇宙中,会有不同于我们所生活的宇宙的规则。实际上,任何人都可以创造任何想到的东西。从某种意义上说,不会有规则。但当我们谈论的是一个新世界,计算机和人类将并肩生活和工作时,了解这种合作将如何进行是合理的。其中一项合作是文本到图像的生成。现在很流行。例如,OpenAI提供了 Craiyon,而谷歌则拥有 Imagen AI。昨天,该领域的领先者之一 Meta 宣布了其自研的 AI 图像生成引擎。正如该公司所说,新引擎将帮助人们在虚拟世界中创造更多身临其境的艺术。

在纸面上,文本到图像的生成是一件简单的事情。例如,当您说出关键字“医院里有一匹马”时,引擎首先将其通过一个变压器模型、一个神经网络,然后它“理解”您所说的内容,并对它们之间的关系形成上下文理解. 一旦它完成了上述所有步骤并意识到你的意思,它将在AI的帮助下使用一组 GAN(生成对抗网络)创建图像。

由于机器学习的发展及其自我训练的能力,文本到图像生成引擎能够创建您想要的任何废话。我们可以说所有引擎的工作原理都是一样的。但是,它们在 AI 处理方面有所不同。

例如,谷歌的 Imagen更喜欢 Diffusion 模型,“它学习将随机点的图案转换为图像。这些图像一开始是低分辨率,然后逐渐提高分辨率。” 另一方面,谷歌的 Parti AI “首先将一组图像转换为一系列代码条目,类似于拼图。然后将给定的文本提示翻译成这些代码条目,并创建一个新图像。”

但是,您应该知道,作为用户,您无法控制输出图像的特定方面。“为了实现人工智能推动创意表达的潜力,”Meta 首席执行官马克扎克伯格在周二的博客中表示,“人们应该能够塑造和控制系统生成的内容。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢