AI图片生成与编辑：画笔交给你，灵感交给AI —— 第二章

《人工智能辅助的数字媒体创作》· 第二章

引言：一幅画改变世界对AI的认知

2022年8月，游戏设计师Jason Allen用Midjourney生成的画作《太空歌剧院》夺得科罗拉多州博览会艺术比赛金奖，引发全球轰动。无论你是支持还是质疑，这一事件标志着AI图像生成正式进入主流视野。从那时起，Stable Diffusion、DALL·E、Midjourney三大平台引领了一场"文生图"革命。这一章，我们将深入探索AI如何重新定义"作画"这一古老的人类行为。

第一节：人工智能与图片的关系

从像素处理到语义理解

传统的图像处理软件（如Photoshop）操作的是像素：亮度、对比度、色相、饱和度。而AI图像生成引擎操作的是语义：理解"一只穿着宇航服的柴犬在月球上行走"这句话的含义，并创造出对应的视觉。

核心技术：从GAN到扩散模型

GAN时代（2014-2021）：StyleGAN生成逼真人脸，BigGAN生成多样物体。优势是生成速度快，劣势是训练不稳定、多样性有限。
扩散模型时代（2022-至今）：从随机噪声出发，通过逐步"去噪"还原出符合文字描述的图像。Stable Diffusion、DALL·E 2/3、Midjourney均基于此。优势是多样性高、可控性强，但生成需要多次迭代。

关键概念：Latent Space与条件控制

Latent Diffusion：不像传统扩散模型直接在像素空间操作，Stable Diffusion在压缩后的"潜空间"（latent space）进行扩散，极大降低了计算成本。
CLIP引导：OpenAI的CLIP模型负责理解文本描述，将文字编码为模型可用的条件信号，指导扩散方向。
ControlNet：在Stable Diffusion基础上增加额外的控制条件（如边缘检测图、人体骨骼图、深度图），实现精确的构图控制。

第二节：如何使用AI生成和编辑图片

三大主流平台对比

平台	优势	适合场景
Midjourney	美学品质最高，默认出图惊艳	艺术创作、概念设计、插画
Stable Diffusion	完全开源、可本地部署、高度可控	专业创作、批量生产、定制工作流
DALL·E 3	文字理解最精准、长文本服从性好	复杂场景、含文字的设计
通义万相	中文理解最佳、免费额度丰富	中文创意、电商设计
文心一格	中国风格表现优秀	国风创作、传统文化视觉化

提示词工程：从入门到精通

一个好的图像生成提示词（Prompt）是创作成功的关键。以Midjourney为例，推荐结构：

[主体描述] + [环境/场景] + [艺术风格] + [光照/色彩] + [构图/视角] + [画质参数]

例如：

A young Chinese woman in traditional Hanfu, standing in a bamboo forest at sunrise, ink wash painting style, soft golden light filtering through leaves, misty atmosphere, full body shot, 8K, masterpiece --ar 3:4 --v 6

图片编辑：超越生成

Inpainting（局部重绘）：选中图像中的某个区域，用文字描述替换内容。如"把背景中的汽车换成喷火龙"。
Outpainting（扩展画布）：在图像边缘外扩展内容，AI自动补全。适合将竖版图片扩展为横版。
Image-to-Image（图生图）：输入一张参考图作为基础，AI根据文字描述进行风格迁移或细节调整。
Remove Background（去背景）：AI自动分离主体和背景，精确度远超传统抠图工具。

课程思政：AI技术在中国山水画创作中的探索

中国山水画讲究"外师造化，中得心源"，追求的不是客观复现，而是意境的传达。AI在这一点上展现出惊人的契合度——扩散模型天然具有一种"模糊美学"，与中国画的"似与不似之间"有着精神上的共鸣。

近年来，不少中国数字艺术家开始用Stable Diffusion训练专属的中国山水画模型。他们不是简单地让AI模仿古画，而是用现代的视角重新诠释传统。例如，用"赛博朋克 + 千里江山图"生成的作品，既保留了中国青绿山水的色彩体系，又融入了未来主义元素，成为传播中国文化的新媒介。

这提醒我们：AI不是让传统消亡的威胁，而是让传统焕发新生的机遇。关键在于，操控AI的人是否有足够的文化自觉和审美素养。

本章小结

AI图像生成从GAN进化到扩散模型，实现了从"像"到"美"的跨越
三大主流平台各有侧重：Midjourney重审美、SD重可控、DALL·E 3重理解
好的提示词 = 主体 + 场景 + 风格 + 光照 + 构图 + 参数
AI不仅是生成工具，更是图片编辑利器（Inpainting、Outpainting、去背景）
AI与中国传统艺术的碰撞，不是替代，而是创新融合

课后练习：使用任意AI绘图工具，以"中国传统元素+未来主义"为主题创作一幅作品，附200字创作思路。
下一篇预告：第三章 · AI视频生成与编辑——让创意动起来
作者：AIGC研究者与教育者 | 2026年6月

菜单

分享

AI图片生成与编辑：画笔交给你，灵感交给AI —— 第二章

引言：一幅画改变世界对AI的认知

第一节：人工智能与图片的关系

从像素处理到语义理解

核心技术：从GAN到扩散模型

关键概念：Latent Space与条件控制

第二节：如何使用AI生成和编辑图片

三大主流平台对比

提示词工程：从入门到精通

图片编辑：超越生成

课程思政：AI技术在中国山水画创作中的探索

本章小结

评论

AI交互媒体设计：艺术与科技的双向奔赴 —— 第八章

AI人体姿态捕捉：让数字角色活起来 —— 第六章

AI视频生成与编辑：让创意动起来 —— 第三章

人工智能与数字媒体创作的新纪元

AI游戏场景生成：一键构建虚拟世界 —— 第七章

AI三维模型生成：从平面到立体的跨越 —— 第四章

AI声音生成与编辑：从文本到旋律的魔法 —— 第一章

深入理解 Transformer 架构：从 Attention 到现代大模型

AI动画生成与编辑：角色的灵魂由AI赋予 —— 第五章

AI图片生成与编辑：画笔交给你，灵感交给AI —— 第二章