2023年仅过去四分之一,人工智能(AI)领域几乎可以说是迎来了重大变革。
先是有聊天机器人ChatGPT(3.5/4.0版本)、文心一言的发布,后有智能绘图工具Midjourney(v5版本)的公测。人工智能的飞速发展,将训练一次就会消耗数百万美元的“AI大模型”推上了风口浪尖。
今天,我们来了解下强大的智能绘图大模型 Midjourney v5。
Midjourney是一个人工智能程序和服务,由一个名为Midjourney的独立研究实验室创建和托管。Midjourney能够将人类输入的自然语言描述转换为图像,与OpenAI的DALL-E和百度的文心一格功能相同。
Midjourney采用的核心算法是一种基于双边滤波技术的去噪算法,能够去除图像中的高频噪声并保留图像的细节和边缘,同时保持图像的平滑。
基于双边滤波技术的去噪算法是一种图像处理方法,可以帮助去除图像中的杂乱噪声,同时保留图像的细节和边缘信息,让图像更加清晰和自然。与传统的处理方法不同,这种算法会考虑像素之间的位置距离以及它们的灰度相似性,两者结合起来进行处理,可以去除高频噪声,同时保持图像的平滑和细节。
例如:当我们拍摄一张照片时,由于各种原因(如相机传感器的噪声、光线等),照片中可能会出现一些杂乱的噪点,这些噪点会影响照片的质量和观感效果。为了去除这些噪点,我们可以使用基于双边滤波技术的去噪算法。
具体来说,这种算法会考虑像素之间的位置距离和灰度值相似性,它将这两个因素结合起来进行处理。如果两个像素之间的距离很近,并且它们的灰度值很相似,那么它们就很可能是同一个物体的一部分,不应该被去除。相反,如果两个像素之间的距离很远,并且它们的灰度值差别很大,那么它们就可能是背景中的噪点,应该被去除。
接下来,来看一下 Midjourney生成的图片:
评论留言