AI生图生视频使用经历和经验分享

从"意大利面"到"以假乱真"

这两年AI生图生视频越来越可怕了。从一开始吃意大利面的搞笑视频（我记得那个时候生成图像已经很强了），到现在 Veo3、Sora2、Nano Banana 的出现，已经可以在以假乱真的前提下，生成一些现实不存在的、但是非常"真实"的图片了。

听说当初Sora2刚出来的时候，有人用家里老人的形象生成一段视频，然后拿给老人看，告诉老人这个视频是假的，但是老人却笃定说这是真的；还有大学男生做了一段自己在非洲敞篷车上自拍的视频，发给家里看，家里急的报警了，以为小孩被拐卖了（笑）。

我清楚记得Sora2是从25年9月31号发布的，那个时候正好下班，看到Sora2在发兑换码，于是先买了一个玩玩。在10月1号的晚上正式上传了自己的形象，然后便一发不可收拾，玩到国庆结束。

那个时候Sora里面已经到处可见奥特曼的恶搞视频了，再到后来国内平台抖音、小红书都是Sora上的恶搞视频，比如：

现在Sora2虽然开始了收费模式，但是付费用户毕竟是少数，而且生成视频的数量和并发也从刚开始的100个/天到后来50个，现在只有30个了（之前看的，后来就没用过了）。

在这波AI视频浪潮下，我也把小红书账号成功起号，专门发AI视频，尤其是一些动漫结局不好的，我会做最完美的大结局和一些"杀青梗"（演员谢幕，表示一个角色都没死）。

Sora2版权炮+收费之后就很难做AI视频了，于是我将目光投向Gemini下的 Nano Banana 生图模型。当初这个模型就是和Sora2一样，凭借着人物一致性而出名的。

最恐怖的是，可以将自己的脸+网上找的衣服，就可以生成一张自己试衣服的照片，那段时间AI试衣也火了一阵子。

那个时候的Nano Banana生成中文还不是很行，基本上会出现乱码和火星文，中文只有豆包能够生成，但是也要试好几次。主要是豆包生图那个时候水平就在那里，就算中文比较好，背景图片也很差，经常需要将Nano Banana的图片传入豆包来生成文字。

再到后来，Nano Banana Pro 伴随着Gemini 3横空出世，解决了中文一致性的问题，生成相关的图片再也不是问题。

从高级的一道菜的拆解展示，到使用Chiikawa形象的景区旅游导图，再到后来堪比摄影大师拍摄的画面——让我这个非常羡慕艺术生的理工科学生也手痒痒想尝试尝试。

本人本身就有一些摄影的小爱好，略微有那么一些些审美，再加上本身vibe coding就比较多，一些生图的提示词还是能够写出来的。

于是我创作了这些图片：

我本人没有任何绘画经验，语文也不是很好，也没有写过小说，但是前段时间制作了一篇原创的Chiikawa漫画中篇故事，从故事大纲、页面分镜到四格漫画和漫画面，在Nano Banana Pro的帮助下，我一个人就完成了。

简单来说创作流程就是：

我个人非常偏爱迷幻、梦境这类风格，这种氛围感往往是提示词中最难描述的部分。一张AI生成的好照片，如果让人一眼无法看穿其背后的Prompt，那它就成功了一半。

这种"不可名状"的创意，其实是一种知识壁垒。虽然现在的反推工具很强大，但原创的灵感和审美是独一无二的。想要提升这方面的能力，我非常推荐大家关注 刺猬星球。

刺猬星球：丰富的提示词教程与案例库

比如其中的【提示词创作第四节】：模拟真实设备与纪实瞬间，就详细讲解了如何通过添加胶卷滤镜（如 Fujifilm Pro 400H）来营造偏冷调的日常抓拍感，或者迁移摄影大师的风格。将这些不同的技巧组合起来，就能碰撞出属于你自己的独特画风。

除了娱乐创作，AI生图正在真实地改变生产流程。除了 GitHub 上有 awesome nanobanana 这样的项目，还有很多网站收纳了非常多的提示词。不过也不要过多的依赖别人的东西，提示词都是人试出来的，如果你也有奇思妙想，你也可以试试。

我在工作中就遇到了一个典型的工业可视化需求：将复杂的工厂2D设计图纸，转化为直观的伪3D风格展示图，用于电厂的大屏监控系统。

传统工作流痛点：

AI工作流方案：

我将原图拆分为核心图例和局部结构，通过上传参考图（Image-to-Image）配合精准的 Prompt，让 AI 理解工艺流程，直接生成高质量的伪 3D 效果图。

输入：原始 2D 工业图纸

输出：AI 生成伪 3D 监控图

这种流程不仅效率提升了数倍，生成的图片后续能够用于大屏交互，管理员点击设备即可查看状态，完美实现了从"看图纸"到"看实景"的跨越。

AI生图生视频给我的整体感受就是：工具在进化，创作的门槛在降低，AI在让创作平权——但创意永不会平权，创意和审美永远是人类的专属。