UTAU中文音源录制发音细节的建议
前言:
当前有的UTAU中文音库的发音多有各种问题,oto技术外,还需要在录音时发音细节上改进。
关注到这些细节,为了描述它们,就会总结出发音结构上的一些知识。
不希望此文成为看着想睡觉的“文章”。但终究是想传递某些知识,让人看懂……
此人语文不好,先展开后总结写太多读着就想睡觉,写太精简看不懂会让人觉得智商捉急,自以为合适了,联系读者听反馈效果又觉得好像改善基本没有。
遂压力巨大。
所有“中文”只指普通话。
对各位注重咬字的专业训练过的中之人:这些修改的结果并不是要强行加改口音,台湾腔或者流行腔。这里的建议主要是揭示任何口音都会出现的,唱歌和说话念字之间的自发的习惯性变化。
“如果想要以最有毒的方式体验的话”
大口型的范例,关注e i u v的口型,以及韵头韵尾与想象中的区别。
什么还不够毒?
于魁智 羽泉 奔跑(以及其他分P——【合集】民美戏曲家们演唱通俗歌曲)
“只要普通话正常,唱歌再差的人,也至少学得来适合唱歌的咬字”
停不下来的话【大老师京味版 林允儿韩式中文(并不)版
最简形式:
各方面,稳定和统一。
以歌声中较为快速部分的字词,连续起来的感觉发音。
而不要带着“认真对待,强调咬字”的观念去发音。
不知道怎么发,就想两句带这个音节的歌词。
原理分解:
·清擦音短
·送气短
·韵头短
·送气短
·韵头短
·某些韵母的口音
·开口度稳定、口型不过度
·开口度稳定、口型不过度
·辅音松紧度统一
·音色稳定统一
·韵尾明显影响韵腹,且偏长(已过时)
·浊辅音稍长(已过时)
细节教程说明:
·清擦音短
拼音里面的x s sh f h,找一下它们有什么共同点,这些就是纯擦音。j q z c zh ch是塞擦音,区别是在擦音之前有塞住。
当读单独的一个字,或者强调一个字的时候,擦音的长度就会不自觉的变长(实际情况q c ch这些送气的塞擦音也会很长)。对于zi ci si zhi chi shi来说,由于辅音过后不改变口型,于是擦音经常更长。
在唱歌中,口型不大、速度较快处擦音会明显变短一些。
可以试着读“撒(这是反例)”“[肥]料[掺]了[金]坷垃,一袋能顶两袋[撒]”“四是四十是十十四是十四四十是四十”。
用音频软件查看,前面一段非规律振动的就是擦音(表现为杂音)。
·送气短
拼音b d g j z zh和p t k q c ch的区别就是,前面6个是不送气的,后面6个是有送气的。送气时间可以看作从气流开始通过到声带开始震动中间的时间。
声带不震动感觉类似于“h”。同样是在单独读一个字的时候有可能会无意识拉长。
但是在唱歌过程中一般会一直比较短。
可以试着读“操!(这是反例)”“啪啪啪~啪啪啪啪~啪啪啪~啪啪啪啪~”“八百标兵奔北坡,北坡炮兵并排跑”。
用音频软件查看,从开始有明显波形(擦音则是在擦音之后)到开始明显规律震动中间会有音量较小的杂音,就是送气的声音。
·韵头短
韵头又名拼音中的介母、介韵。bao biao gei gui的区别就是无韵头和有韵头。韵头一般是i u v(音标y,拼音正确形式ü)。
特殊的、不太容易被注意到的是,单韵母e[7]经常也会带有一个软腭近音[M\7],这也正是录音表中“的呢了”“得讷勒”的区别(之一)。
并且在韵腹为单o/e,且没有韵尾的时候,习惯性地韵头会发得更长,如*e *ie *uo *ve。需要注意bopomofo的发音也是有一个韵头u的。
同样也是,当单独读一个字或者强调一个字的时候,这一部分会不自觉的变长。
在唱歌中,一般会为了更清晰的韵腹,而让口形区别基本与辅音(声母)结合起来,i偏向颚化、u偏向圆唇化辅音的感觉,而不像是作为三坨元音中的一个。
再准确一点,可以说其实不全是短,同时也是“口型程度低”,就如用日穿中时i和u韵头多用e和o一样,起步的时候韵头感就已经没有那么到位了,这样作为歌声会自然些。
可以试着读“Biu!一下全被擦了(这是反例)”“七万个嫂夫人挨个来Biu他!(这个字飙了高音有了一些唱歌性质所以韵头变得非常短)”“nyanyanyanyanyanyanyanya(自行彩虹,此处省略一万nya)”。
·某些韵母的口音
最著名的也许就是ing了(与之相辅的还有in),
也许是受“普通话是北方语音为基础的”的影响。这句话是对的,但是看到这句话,同时加上脑内“认真发音”,结果,偏南人民大力回忆模仿印象中的普通话演示导致扭曲过度,偏北人民自豪地掺入了自己以为“这才是更准普通话”的北方特色,于是铸就了南北人民都能录出ieng的美好局面。
北方ing、in的后部会有eng、en的痕迹,但歌声中ing和in韵腹区别是不太大的,基本只在韵尾位置有区别,也许普通话话音也会。但是这样发音放入中文歌声,效果并不对。
然后是e(这个韵母涉及方方面面……重复度好高啊……总之就是不要(词穷))。
更多细节……还是来这里的附录吧:数字语音学基础姿势参考
例子:“漫天回忆该如何去[聆][听](这是反例(大雾))”“[今]天[明]天都是好日子,赶上了盛世咱享太[平]”以及最顶上的修炼手册(
·开口度、口型程度
参见关于金坷垃音源效果的分析。
如果可以录出每个发音包含不同口型的音库,那当然效果会更上一层楼,但是目前似乎能录稳定一个口型类别都是不太容易的事情。
进阶多开口度录音,参考上面提到的结合金坷垃音源分析开口度的作用。
相关联的一个问题是元音的口型程度。以前叫“开口度”,不知道该用个什么词来指代。其实可以说跟前面说的是一个东西,之所以不确定该叫啥,因为此开口非真正的“开”,对e i u v来说甚至是更“闭”。还是理解为一种“姿势”“特异”“狰狞”“丧病”的“程度”吧。
形象(个屁)一点描述就是a巨大,e要死(e的问题还跟“的、德”之分有关),i很细,u o圆浑,v怪物;主要问题也就出在后四个。也是由于“强调说一个字”的感觉,导致发音姿势过分了,用到连续歌声中就很突兀。
但是这并不是代表着要让发音“糊、懒、不正”,而是要符合唱歌时的口型变化特点。
唱歌中元音要朝各个方向变,所以这些比较极端的元音,其间的距离要稍微小一点才自然。
以屁牌伪语音学的方式阐述我的理解:
有一种能用元音格表达的“前后开闭”——关系到这是哪一个音那一个字有什么口音(意味着咬字的正确与口音风格统一),
也有一种元音格不能表达的“前后开闭”——唱法、姿势风格的切换,也就是口型程度的整体偏移(开、后:传统/美声/丧病;闭、前:卖萌卖萌卖萌疯狂卖萌)。
录制歌声声库需要保持元音格不能表达的那种前后开闭尽量靠近一个位置,但是同时要把元音格能表达的前后开闭发正确。
解法还是只有想想唱歌的状态。一句例子很多的歌词是“请[赐][予][我][无]限爱[与]被爱[的][力]量”。
·辅音松紧度统一
最新研究成果(个屁)。对应vocaloid的塞音问题。跟气息强度也有关。
效果参考言和、巡音LUKA V2等声库。前者结束的时候,气息到塞音的地方有放松,而后者是塞得紧的塞音,(这样原声中,是应该停顿时间很长的,因为松塞紧开,中间需要气息压力聚集的过程。然而默认停顿时间做那么长,拿来唱歌也会奇怪(一跳一跳的感觉)),如果强行剪短中间的空白时间,如言和,两者合一起效果根本不对。
而连续歌声气息多数是稳定的,字的结尾气息音量并不应该有降落。辅音也不会很紧(偶有,见下),多数阻塞时间短于“认真念”的结果(其实跟前面的清擦音短也是一个道理)
在通浊辅音还稍有变化(l m n y w r)。类似地,气息也不会有下落,而此时是保持发声的。同时,y w口型也不能过头,音量几乎不变。实际UTAU库录音在y w r上每个字放松一下气息的情况很常见,也许是脑内想“隔开每个字”,然而放入歌声就知道不对了。
所以要注意控制塞音的松紧度,包括塞前气息状态不能降下去,塞的时间不能久,开塞力度(前者最容易被忽略)(后者其实也())。
例子:“我[]不愿再放纵”(这是反面例子,前松后紧,这种情况是与调子、节拍有关的,【不】是强拍、高音、强调字)
“我[]不是一粒沙子”(这是前后统一的,唱歌中最常出现的是这种)
“八百标兵奔北坡”(当歌唱,不然极易过紧)
同样,首先稳住一个,如有探索精神,可测试分两个三个松紧度。
·音色统一
捂脸这个真的只有靠专业技能了,屁牌语音学并不涉及此方面。
·浊辅音稍长(只适用于单字整音,连续录音中已不推荐)
这里浊辅音包括声母l m n y w r (e [M7]中的M)。在一句话的句首,浊辅音常常很短,并且与气息开始的过程重合,音量瞬间加大,气息足够后很短时间内就变为元音。而在两个字中间,上一个字韵母结束以后通常不会减低音量而口型变为浊辅音,保持一定时间之后切换至元音。名曰浊辅音就是在辅音过程中也发声,且中文浊辅音都不是塞音,更加明显。
如果在该连接起来的地方只有一个瞬间启动的浊辅音,用于合成的话,感觉就是气息突然断掉然后蹦了一下出来【语文处理器已死】,感觉“机械”(其实不正常发音一般就是机械有木有),人很难做到这样的声音。
所以录制的时候,注意这些辅音的存在感,一个办法是连读两次,后一次就一定是没问题的。但是这样就已经可以做更高端的音源了……所以录整音音源的话,体会一下这个感觉,注意在开始发声前面加一点对应辅音。
可以试着读:“nyanyanyanyanyanya……”“俺痒痒痒痒痒”“[药]~[药]~切克[闹]”
·韵尾明显(只适用于单字整音,连续录音中已不推荐,因为实际CVVC录出来还常常过长)
韵尾即是ai ao ei ou an en ang eng等中的后部分。韵尾发音一般是[I](ai ei)、[U](ao ou)、[n](an en)、[N](ang eng)。
当单独读一个字或者强调一个字的时候,会将韵腹发的特别突出并延长,并且在发音快结束的时候才偏向韵尾口型,而悲剧的是这时候音量也开始放松。于是韵尾占整个音的长度、音量都会使得,虽然单独听很清晰,但是被放到较为快语速的地方,韵尾就基本消失听不见了。
连续发音中间,韵尾的音量直到塞音塞住或者转为其他音之前是不会减小的(远不是想象的那种一个音结束了要慢慢降低音量),并且会远在下一个辅音到来之前就转换好口型以表示存在,只有一句(或者一小段,总之就是不想把两个发音连起来的时候)的最后一个字会很晚才开始口型倾向韵尾同时音量减小。
在唱歌时,快速发音中(相对于一个字一个字读来说很快;而实际上跟读词语的语速差不多,可能还不到说话的速度),韵尾长度(包括转换过程)占整个发音的比例是很大的。一般速度也大概是韵腹韵尾各一半,并且韵腹的发音是会根据韵尾而变的,比如ao一开始就会有轻微圆唇,而ang中部就会稍有鼻音化,等等。
可以试着读“我不[艹]你爸”“[好好好好好]别着急啊”“八百标兵奔北坡,北坡炮兵并排跑”“时光的沙漏被我踩[碎]”(尾字特殊表现)。
一般情况下,规律振动部分形状会在元音改变后明显改变,所以最后一段形状比较统一的就是韵尾。如果最后有均匀变化并且同时逐渐变小了的话,就是本段开头所述读单字的结果。
读的一个字在大部分情况下都是比唱歌中的发音长的,韵头长度有固定区域保护不会被压缩,而韵尾就必须得有足够长度和音量,保证被稍微压短之后还是明显的。
韵尾音量不要降低,试着想象是在读一个词语,后面还接着一个字,但是结尾不要真的偏向任何一个辅音的口型。
想象不出来的话可以录一个词语,无限鬼畜只听其中前一个字,模仿这种感觉。还不行的话就试着拉长韵尾吧……
或者尝试“读的很短但是清晰坚决”的感觉。
小结后记注释
以上这些要求并不是绝对适用于任何歌曲的,这些是针对一般歌曲中大部分音节的发音特点,与“像念咒语一样”录音效果的区别总结而成。
稳定统一不意味着“小心、保守、死板、面瘫、放不开”,有特色就让每个音都有这个特色即可,只要不是某个本该一样的动作(气息量,同一辅音松紧度,同一元音开口度,等等)在不该变的地方变了,就没问题。
如果观察仔细,会发现某些韵尾会跟着下一个辅音跑。这是语流音变正常现象,按照顺口的方式去发。常用的CVVC录音方式正是设计来保留这些变化的。
如有疑问及实践详情联系作者,掐卡免费典韦【滚
浙公网安备 33010602011771号