arrow_back 返回博客
AI Jan 4, 2026 8 min read

AI生图生视频使用经历和经验

AI只是工具,人之所以为人是因为会使用工具。

Yui

Yui

开发者 & 创作者

AI生图生视频使用经历和经验

从"意大利面"到"以假乱真"

这两年AI生图生视频越来越可怕了。从一开始吃意大利面的搞笑视频(我记得那个时候生成图像已经很强了),到现在 Veo3、Sora2、Nano Banana 的出现,已经可以在以假乱真的前提下,生成一些现实不存在的、但是非常"真实"的图片了。

听说当初Sora2刚出来的时候,有人用家里老人的形象生成一段视频,然后拿给老人看,告诉老人这个视频是假的,但是老人却笃定说这是真的;还有大学男生做了一段自己在非洲敞篷车上自拍的视频,发给家里看,家里急的报警了,以为小孩被拐卖了(笑)。


Sora2:我的AI视频起点

我清楚记得Sora2是从25年9月31号发布的,那个时候正好下班,看到Sora2在发兑换码,于是先买了一个玩玩。在10月1号的晚上正式上传了自己的形象,然后便一发不可收拾,玩到国庆结束。

那个时候Sora里面已经到处可见奥特曼的恶搞视频了,再到后来国内平台抖音、小红书都是Sora上的恶搞视频,比如:

  • 家门口监控视角,拍摄门口小猫拿着机枪和喷火器扫射主人
  • 家里冲出来一头巨大无比的河马,沿途将客厅和走廊的墙壁和家具全部撞坏
  • ……

现在Sora2虽然开始了收费模式,但是付费用户毕竟是少数,而且生成视频的数量和并发也从刚开始的100个/天到后来50个,现在只有30个了(之前看的,后来就没用过了)。

在这波AI视频浪潮下,我也把小红书账号成功起号,专门发AI视频,尤其是一些动漫结局不好的,我会做最完美的大结局和一些"杀青梗"(演员谢幕,表示一个角色都没死)。


Nano Banana:从生图到生漫画

Sora2版权炮+收费之后就很难做AI视频了,于是我将目光投向Gemini下的 Nano Banana 生图模型。当初这个模型就是和Sora2一样,凭借着人物一致性而出名的。

最恐怖的是,可以将自己的脸+网上找的衣服,就可以生成一张自己试衣服的照片,那段时间AI试衣也火了一阵子。

那个时候的Nano Banana生成中文还不是很行,基本上会出现乱码和火星文,中文只有豆包能够生成,但是也要试好几次。主要是豆包生图那个时候水平就在那里,就算中文比较好,背景图片也很差,经常需要将Nano Banana的图片传入豆包来生成文字。


Nano Banana Pro:创作的新可能

再到后来,Nano Banana Pro 伴随着Gemini 3横空出世,解决了中文一致性的问题,生成相关的图片再也不是问题。

从高级的一道菜的拆解展示,到使用Chiikawa形象的景区旅游导图,再到后来堪比摄影大师拍摄的画面——让我这个非常羡慕艺术生的理工科学生也手痒痒想尝试尝试。

本人本身就有一些摄影的小爱好,略微有那么一些些审美,再加上本身vibe coding就比较多,一些生图的提示词还是能够写出来的。

于是我创作了这些图片:

小红书AI视频作品1
小红书AI视频作品2
AI生成作品3
AI生成作品4

我的Chiikawa漫画创作经历

我本人没有任何绘画经验,语文也不是很好,也没有写过小说,但是前段时间制作了一篇原创的Chiikawa漫画中篇故事,从故事大纲、页面分镜到四格漫画和漫画面,在Nano Banana Pro的帮助下,我一个人就完成了。

简单来说创作流程就是:

  1. 生成故事大纲 - 先把整体故事框架定下来
  2. 粗生成一遍 - 快速生成初版画面
  3. 上传参考图 - 提供角色参考
  4. 细调人物一致性 - 确保角色形象统一
Chiikawa漫画作品1
Chiikawa漫画作品2

进阶之路:审美积累与提示词魔法

我个人非常偏爱迷幻、梦境这类风格,这种氛围感往往是提示词中最难描述的部分。一张AI生成的好照片,如果让人一眼无法看穿其背后的Prompt,那它就成功了一半。

这种"不可名状"的创意,其实是一种知识壁垒。虽然现在的反推工具很强大,但原创的灵感和审美是独一无二的。想要提升这方面的能力,我非常推荐大家关注 刺猬星球

刺猬星球主页 - 提示词与审美积累

刺猬星球:丰富的提示词教程与案例库

比如其中的【提示词创作第四节】:模拟真实设备与纪实瞬间,就详细讲解了如何通过添加胶卷滤镜(如 Fujifilm Pro 400H)来营造偏冷调的日常抓拍感,或者迁移摄影大师的风格。将这些不同的技巧组合起来,就能碰撞出属于你自己的独特画风。


生产力革命:从娱乐到工业落地

除了娱乐创作,AI生图正在真实地改变生产流程。除了 GitHub 上有 awesome nanobanana 这样的项目,还有很多网站收纳了非常多的提示词。不过也不要过多的依赖别人的东西,提示词都是人试出来的,如果你也有奇思妙想,你也可以试试。

我在工作中就遇到了一个典型的工业可视化需求:将复杂的工厂2D设计图纸,转化为直观的伪3D风格展示图,用于电厂的大屏监控系统。

传统工作流痛点:

  • 设计人员需要读懂复杂的2D图纸
  • 手动绘制或建模3D图形,极其耗时
  • 修改成本高,响应速度慢

AI工作流方案:

我将原图拆分为核心图例和局部结构,通过上传参考图(Image-to-Image)配合精准的 Prompt,让 AI 理解工艺流程,直接生成高质量的伪 3D 效果图。

原始2D设计图纸

输入:原始 2D 工业图纸

AI生成伪3D效果图

输出:AI 生成伪 3D 监控图

这种流程不仅效率提升了数倍,生成的图片后续能够用于大屏交互,管理员点击设备即可查看状态,完美实现了从"看图纸"到"看实景"的跨越。


AI生图生视频给我的整体感受就是:工具在进化,创作的门槛在降低,AI在让创作平权——但创意永不会平权,创意和审美永远是人类的专属。

标签: AI生图 AI视频 Sora2 Nano Banana Chiikawa
分享文章: