Imagen

功能及特点

  • 使用大型预训练的文本编码器,能够有效地完成文本 - 图像任务。
  • 与其它模型相比,Imagen 更注重预训练文本编码器的规模,而不是扩大扩散模型的规模。
  • 引入了新的阈值扩散采样器,能够实现大型无分类器的引导权重。
  • 引入了新的高效 U-Net 架构,计算效率高、内存占用低、收敛速度快。
  • 在 COCO 数据集上,Imagen 实现了新的 COCO FID(Fréchet Inception Distance)的最佳成绩,同时在人类评估中也表现出色。

Imagen

Imagen 是一款由Google开发的具有前所未有的逼真度和深度语言理解能力的图像生成模型,能够将文本描述转化为高质量的图像。

基本信息:

收费方式: 该模型未商业化。
分类:
frameworkimage-generationapiopensource