看着电脑屏幕上那有关三光头联系的讨论,向坤背靠电脑椅,一脸的生无可恋。
本以为他那装b的做菜视频很快就会被网友遗忘,没想到冒出一堆恶搞配音的玩法。
本以为这种恶搞配音的玩法用不了多久网友就会玩腻,去寻找新的素材,没想到居然又把他之前的“背影图”和“见义勇为视频”给关联了起来。
他不用去看那些评论、搜那些相关内容,就知道会是什么样的讨论情况了。
看来这热度,一时半会又是降不下去了。
也好在是他这几个月变化很大,又成了光头,以前的同学、熟人什么的一般都认不出他来——连亲妈都认不出来,其他人要认出来的难度可想而知。
能从这图片和视频分辨出他真实身份的,就那么寥寥数人。
否则的话,怕是他的真实身份,早就被人给直接扒出来了。
现在怎么整?
算了,继续凉拌吧,反正他是不可能主动去冒头收这个热度的。
不过脑子里飞快地计算了一下,向坤却是冒出了个点子,觉得或许可以用用。等天亮后,跟游猛商量商量。
向坤又想起了自己的ai助手计划,他打开一个输入界面,看起来就像一个简单的文本编辑器一样,只是文本输入界面最下方有几个简单的按键,整个界面基本没有什么ui设计可言。
向坤文本框里输入了一行字:“大家好,我是唐小娜。”
然后按下了下面的播放按钮。
接下来那句话,便以唐宝娜的声音说了出来,声音柔和、语气平淡,但听起来发音还是十分地自然顺滑,乍听之下,并不会有任何的违和感,更不会想到不是真人说出。
不过以向坤的耳朵,还是听出了很多的问题。
他的“ai助手”计划虽然很早前就已经做出了整个的框架,基本确定了体系结构、数据结构、关键算法和模块功能。
但实际有开始去做的,只有语音合成这部分功能,因为向坤其实对他所做的这个“ai助手”计划,依然还是不满意。
其主要核心,依然都还是现有的、成熟的各种方案,他只是在做更好的整合和修改。
先不说以后成品的功能是否能满足他的需要,单就这实现的过程,就还需要大量的时间和其他成本,不是他一个人一时半刻能做好的。
而现在经过几个月的变异进化后,向坤莫名地觉得,自己花费那么多时间和成本去做出来的“ai助手”,不应该“只是这样”而已。
所以他一直只是在做“ai助手”的门面工作——合成声。
在中秋那晚,向坤就向唐宝娜提出了为他提供语音样本的请求,后者也答应了,而样本采集很早就已经完成,他也已经对已有的一个开源语音合成模型进行针对性的修改,然后经过训练,它成功模仿唐宝娜的声音。
虽然这段时间都是断断续续地在做,但经过一个多月时间,基本上已经算是完成了。
不过向坤对于这个完成结果还是有些不太满意,虽然整体对文本朗读的流畅度、对语境的理解程度、词法分析、句法分析、语用分析,都比原版的语音合成模型有了非常大的提升。
但整体而言,并没有真正地超出当前最顶尖的水平,不论是国外还是国内,单纯的阅读文本的语音合成ai,都已经做得很不错。而它们所面临的一些瓶颈,向坤做的这个东西,也依然没有突破。
所以现在对于自己的这个“ai助手计划”,向坤真是有些“食之无味弃之可惜”的感觉。
有些无聊地看着那输入框,向坤忽然抬手在里面输入了一句话:“向坤,你好帅。”
然后取消掉“根据语境自动转换语气”,而在特定语气选项中,选择了“温柔”。
“向坤,你好帅~~”
听着唐宝娜的声音柔和轻缓地说着这句话,向坤不由得起了鸡皮疙瘩,竟然觉得有点尴尬。
想了一下,又把语气选为“生气”:
“向坤!你好帅!”
虽然话音很重,听起来饱含怒火,但向坤却听得乐了起来,因为脑子里想着唐宝娜的样子,莫名有种反差萌。不论是前一个温柔,还是后一个生气,都是他很少从现实里的唐宝娜口中听到的语气。
总共有六种特定语气,向坤一一试过后,忽然觉得自己选这句话来读,有点猥琐啊。
意兴萧索地关掉了窗口后,向坤换了衣服,出去冲冲山,锻炼一下身体。现在那座小山,都已经被他冲出了几条山路来了。
去“锻炼”完回来,天已大亮,虽然没怎么流汗,但冲山还是弄了不少的泥土,依然要洗个澡清理一下。
重新坐在电脑前,看时间差不多了,向坤便拨通了游猛的电话,他知道开店以后,游猛早上都很早起,因为每天都要准备食材。
“起了来没?在做什么,买菜么?”电话一接通,向坤就问道。
“起来了,店暂时要关起来了,没去买菜,你怎么这么早打电话?对了,你看过我老婆之前帮我拍的视频了么,按你弄的脚本拍的。”游猛有些奇怪地问道。
“嗯,看了,那个以后再说,你的厨房还没装修吧?”向坤问道。
“还没呢,刘主任之前听了我要专弄兔肉的打算后,说可以联系看看,说不定能用便宜的价钱换个更好的位置,反正现在整条商业街的店生意都不好,价格都低,至于这边就不用再投钱装修了。”
“还是