今天跟大家唠唠我鼓捣“街山美穗”的过程,纯属个人瞎折腾,各位看个乐呵就行。
一开始我对街山美穗这名字都没啥概念,就觉得好像在哪儿听过,有点耳熟。后来一搜,!原来是她!日本庆应大学毕业的,拍过写真,还演过戏。行,那就从写真开始入手,看看能不能搞点有意思的东西。
是找图!这年头,找点高清图可不容易。我先是各种搜图引擎轮番上阵,什么度娘、360,能用的都用上了。找到一些,但质量参差不齐,很多都是糊的,没法用。后来我灵机一动,去了几个比较冷门的图站,还真淘到了一些不错的,像素也够高,看着舒服多了。
图有了,下一步就是怎么利用了。一开始我想着要不就直接做个壁纸包?简单粗暴,直接把图一股脑儿丢进去,完事儿。但转念一想,这样也太没技术含量了,体现不出我的实力!
于是我决定搞点更复杂的。我想着能不能用 AI 技术,把她的照片做成动态效果?比如,让照片里的人物眨眨眼,或者稍微动一下,这样看起来更有意思。说干就干!
我先是找了一些 AI 相关的软件和网站,试了好几个,效果都不太理想。要么就是效果太假,看着很别扭;要么就是操作太复杂,我搞了半天都没弄明白。后来我找到一个在线的 AI 动画工具,操作还算简单,效果也还可以,就决定用它了。
接下来就是漫长的调参过程。一张张照片导入,然后调整各种参数,比如眨眼频率、嘴巴张合幅度、头部转动角度等等。这个过程非常枯燥,而且很费时间,但为了最终的效果,我也只能硬着头皮上。不停地试,不停地改,力求做到最
搞了好几天,终于把几张比较满意的照片做成了动态效果。虽然效果还不是很完美,但比起静态的照片,确实生动了不少。看着照片里“街山美穗”微微一笑,感觉一切的努力都值了!
做完动态照片,我又开始琢磨,能不能把她的声音也搞过来?我想着能不能用 AI 语音合成技术,模拟她的声音,然后让她“说”一些话?
这个难度就更大了。我得找到她的声音素材。但她在国内的资料实在太少了,视频也音频也都不好找。后来我翻墙去了YouTube,终于找到了一些她参加节目的视频。我把视频下载下来,然后用音频提取工具,把她的声音提取出来。
有了声音素材,接下来就是 AI 语音合成了。我找到一个在线的 AI 语音合成平台,把她的声音素材上传上去,然后输入一些文字,让 AI 模拟她的声音说出来。但效果很不理想,AI 合成的声音很机械,听起来一点都不像她本人。
我尝试了各种方法,调整了各种参数,但效果始终不尽如人意。我只能放弃了。看来,AI 语音合成技术还是不够成熟,要模拟一个人的声音,还是有很大的难度。
虽然语音合成失败了,但我并没有气馁。我想着既然不能让她“说”话,那就让她“唱”歌!我找到一些比较简单的日语歌曲,然后用 AI 变声软件,把我的声音变成“街山美穗”的声音,然后录下来。
效果肯定是很搞笑的。我的日语发音本来就不标准,再加上 AI 变声的加持,简直是惨不忍睹。但我自己听着觉得挺好玩的,就当是自娱自乐了。
我把做好的动态照片和“街山美穗”唱的歌,做成了一个小视频,传到了B站上。虽然播放量不高,但还是有一些人点赞和评论,说我很有创意。听到这些鼓励,我心里还是挺开心的。
这回折腾“街山美穗”的过程,虽然遇到了一些困难和挫折,但还是学到了很多东西。AI 技术确实很强大,但要真正应用到实际中,还有很长的路要走。不过我相信,随着技术的不断发展,未来肯定会有更多有趣的应用出现。
这回就分享到这里,下次有机会再跟大家分享我的其他折腾经历。
还没有评论,来说两句吧...