今天跟大家唠唠我这几天搞的“痴汉电车3”,别想歪了,这可不是真的痴汉,是我用AI搞的图像生成项目。
起因是这样的: 最近AI图像生成火得不行,我寻思着也得赶赶潮流,玩点刺激的。正好之前看过一些关于电车场景的艺术作品,就想着能不能用AI生成一些类似的,带点故事性的画面。
第一步:准备素材。 这步最关键,没好的素材,AI也巧妇难为无米之炊。我先是在网上搜罗了一大堆电车内部、人物、表情的图片,然后自己也拍了一些,比如挤地铁时候的场景,各种人物的姿势等等。反正越多越让AI有的学。
第二步:选择AI工具。 市面上AI工具太多了,我试了好几个,选定了一个叫“Stable Diffusion”的,这玩意儿开源,可定制性强,就是配置起来稍微麻烦点。我吭哧吭哧装了一天,总算是跑起来了。
第三步:Prompt Engineering。 这步是灵魂! 你得告诉AI你想生成什么样的画面。我一开始直接输入“电车痴汉”,结果出来的都是些不可描述的东西,吓得我赶紧关了。 后来我学聪明了,用更详细的描述,比如“拥挤的电车车厢,一个穿着制服的年轻女孩,表情惊恐,旁边站着一个戴眼镜的男人,眼神闪烁”。 还要加一些风格描述,比如“动漫风格”,“写实风格”,“油画风格”等等。
第四步:反复尝试,不断调整。 AI生成出来的东西,一开始肯定是不尽人意的。要么人物变形,要么场景不对,要么就是风格跑偏。 这时候就要不断调整Prompt,改参数,重新生成。 这是一个漫长的过程,我每天都要花好几个小时在上面,不停地试错。
遇到最大的坑: 就是人物的手! AI生成人物,最容易出错的就是手,经常会多出一根手指,或者手指扭曲。 我查了很多资料,发现可以通过一些技巧来改善,比如在Prompt里强调“正确的手”,或者用一些专门修复手的模型。 修手是个体力活,得一点一点地抠。
经过几天的努力,我总算是生成了一些比较满意的作品。 虽然还不够完美,但是已经能看出一些故事性了。 我把这些图分享到一些论坛上,引来不少争议,有人觉得我是在宣扬不良信息,也有人觉得我只是在搞艺术创作。 对于这些评论,我只能说,见仁见智。
- AI图像生成是个很有意思的东西,但是也要注意伦理问题。 不要用它来做一些违法乱纪的事情。
- 建议: 如果你也对AI图像生成感兴趣,不妨自己动手试试。 这是一个学习新技术的绝佳机会。
额外收获: 除了生成图像,我还学会了很多关于AI的知识,也认识了一些志同道合的朋友。 这回实践,对我来说是一次很有意义的经历。
还没有评论,来说两句吧...