Stable Diffusion是一个文本到图像的潜在扩散模型,机器学习模型,由CompVis、Stability AI和LAION的研究人员和工程师创建。它经过训练可以逐步对随机高斯噪声进行去噪以获得感兴趣的样本,例如生成图像。
它使用来自LAION-5B数据库子集的512x512图像进行训练。使用这个模型,可以生成包括人脸在内的任何图像,因为有开源的预训练模型,所以我们也可以在自己的机器上运行它,进行图像生成。
GitHub代码地址:github.com/CompVis/stable-diffusion
Loading...
colab运行地址:点击此处 ,可以试用进行学习
github运行示例地址:点击此处
使用的prompt:
Wes Anderson style Red Panda, reading a book, super cute, by kanō tan'yū, highly detailed and colored, in the art style of ukiyo - e, inspired by utagawa kuniyoshi
生成的图片: