No Man's Sky Procedural Audio 声音设计

作者:转载小公举
2016-08-02
4 4 2

引言

来自 The New Yorker 的文章,有关游戏 No Man’s Sky 利用 Procedural Audio 技术进行声音设计的幕后故事。文末附有声音设计师 Paul Weir 的演讲视频和 PPT 浏览链接。

编译:@SounDoer
来源:译文地址
原文链接:What a Dinosaur’s Mating Scream Sounds Like

正文

两年前,来自吉尔福德镇的游戏开发者 Sean Murray 和他的小型团队,公布了之前一直处于秘密研发状态的满怀雄心的游戏:一款名为 No Man’s Sky 的全方位宇宙探索游戏。当整个数字化宇宙全部完成时,它将包含超过18*10艾(译者注:10的18次方)个星球,一个玩家需要花数十亿年的时间才能全部探索完毕。为了创造一个如此浩瀚的宇宙空间,Murray 和他的 Hello Games 团队使用了 Procedural Generation 技术:利用随机数(Random Numbers)来创造恒心系统、星球、动植物群落等自然景观。

今年早些时候拜访 Hello Games 时,我本以为会见到一大群人商量着整体世界看上去该是怎样,以及相关的运行机制。我之前没有想到的一点是这款游戏的声音。实际情况是,No Man’s Sky 团队在这一点上提出了一个非常复杂的问题:如何给如此浩瀚的世界设计自然和谐的声音,从恐龙的咕噜声到星级飞船的引擎声?这问题难以回答。游戏中的声音设计,与电影类似,都是从明确的对象开始的;当年 Steven Spielberg 拍摄《侏罗纪公园》时确定影片中会出现迅猛龙(Velociraptors)和霸王龙(The Tyrannosaurus Rex)后,声音团队马上就知道需要为此类生物创造真实可信的声音。然而,游戏 No Man’s Sky 中的世界,是以随机形态为架构、由无数虚构的生物和受偶然因素影响的环境构成的;其中会有各种模块化的飞船,未知大小和形状的建筑等。游戏中所有的一切,都只在遇到时才会被生成。

据我了解,解决这个问题的重任落到了作曲家兼声音设计师 Paul Weir 身上,他一直专注于电影、游戏和其他大型故事作品的音频设计工作,比如 Harrod’s 等。某天早上,我爬上小木梯来到了 Hello Games Studio 的二层,音频团队正在一间梯形小房间里工作。Paul Weir 坐在一台两侧放置了音箱的电脑前,他身材紧凑结实,在小房间里腾挪游刃有余。(他是整个工作室里唯一一个系领带的人。)作为音频总监(Audio Director),他与 Microsoft Studios 伦敦办事处尚有从属关系,他也非常精通科幻(Science Fiction)。除此之外,Paul Weir 还参与过 BBC Radio 的一部以 The Hitchhiker’s Guide to the Galaxy(银河系漫游指南)为主题的戏剧。

Image01

那天上午,Paul Weir 和两位程序员一起讨论有关如何解决游戏中出现不必要的混响的问题。跟该游戏中的其他部分一样,Paul Weir 的音频系统也经历着不断拆卸和重组的迭代过程。在脱离图形参考的情况下,他已经独自工作数月来调整游戏中的声音,而现在他需要把音频系统中的关键元素与游戏的 Master Build 版本联系起来。我走进去的时候,Paul Weir 正在测试一艘宇宙飞船的声音。这个声音是多维度的,由不同音调交替变化的噪声叠加而成,泛音也非常丰富。“我喜欢声波的复杂性”,Paul Weir 说。这个声音的素材最初是来自一部手持干燥机。“我总是会带着一部便携式录音机。对于许多项目,特别是类似于这样的游戏来说,我遵循一条规则:声音素材是要百分百原创的。许多游戏会使用音效库素材,但我们没有使用任何此类资源。”

No Man’s Sky 广泛利用了各种氛围(Atmospheric)音效。当天空中飞过一簇星星时,你会听到一阵有闪烁感的声音,赋予整个宇宙珠宝晶莹的感觉。这款游戏中还包括了由乐队 65daysofstatic 在一所旧教堂中录制的音乐。其中有些音乐还被分割成细小的部分,然后再通过算法进行重组,与游戏中的环境声景相融合。

Paul Weir 告诉我,游戏 No Man’s Sky 在音频方面最大的挑战是各种生物的声音。影片《侏罗纪公园》中各种恐龙的声音素材是来自实地录音的,对鲸鱼或者小猎犬的声音进行各种处理(比如霸王龙的吼叫就用了一头大象宝宝的声音)。但 Paul Weir 没有预算来为这些独特的动物进行高质量的实地录音;或者说,即使这么做也并没什么用,因为你无法预测游戏中的生物到底长什么样,以及它们是处在怎样的环境中。因此,Paul Weir 决定赋予每一种生物各自独特的数字化发声道(Digital Vocal Tract),来模仿与其外观相一致的声音。与其同游戏复杂的算法相抗衡,倒不如顺应其特点做相应的设计。Paul Weir 了解到目前还没有其他游戏做过类似的事情,他认为需要一些程序员来协同完成代码工作。然后,他找到了来自苏格兰的程序员和游戏设计师 Sandy White(1983年 Sandy White 制作的游戏 Ant Attack 是最早一批运用 3D 图形的游戏)—— 他在两个月内完成了必要软件的编写工作。
dinosaurrrr_by_poxel-d7for4w(RGB)(scale)(x2.000000)

Sandy White 从爱丁堡飞过来,与 Paul Weir 一同为此项目工作。“问题在于,如何让这些通过合成手段创造的声音听上去不像是人造的?” Sandy White 说,“因为,这些声音很可能会听着像是 Stephen Hawking 。”

人脑非常善于感知各种模式(Patterns);合成语音(Synthetic Voices)听上去人工痕迹重的原因在于,合成声音中带有非常规律的频率成分:固定的上下起伏调制(Modulations)是典型的无机特征。Sandy White 认为,如果创建一个数字化的声带(Digital Vocal Chords,受数字化的模拟空气刺激来驱动),那么音频系统就能实现自然的发声效果。“最初的实际效果像是一只玩具狗发出的吱吱声”,Sandy White 说,其实这是在意料之中的:这效果就跟往单簧管的吹口吹气但却不经过乐器本身一样。然后他增加了一个数字化的咽腔(Pharynx),该结构位于口腔和鼻腔的后部,作为一个共鸣器来放大由声带产生的声音,并改变其声音质感。最初发出的简单的吱吱声就被拉长了。Sandy White 把该系统称为 Trumpety-chicken-duck-whale-car-horn Phase。等到一月底,在 Sandy White 开始编程的几周之后,他加入了一个数字化的口腔结构,一个基本的虚拟发声道的必要部件。这样他就可以开始着手创造各种语音了。

每一个元音(Vowel)的发音都是由很窄的频段所决定的,通常称之为“共振峰(Formant)”;它是由整个发声道中所有结构的共鸣来完成的。Sandy White 找到了一份1962年的论文《英式英语单元音共振峰研究》(A Study of Formants of the Pure Vowels of British English)。该论文基于对25位男性对象的录音展开研究,其中还附有一份相关数据的表格。某天晚上在爱丁堡的工作室里,Sandy White 把有关一个元音“/a/ hard”的数据导入到他设计的音频系统中;这个基于人类发声原理构建起来的虚拟发声道,输出的结果感觉像是令人毛骨悚然的尖叫声。这语音听上去破败扭曲,高声的时候还非常嘶哑。Sandy White 给了我一份 MP3 小样,我让其他两个不知情的人听了一下。他们都觉得这声音可能来自某种动物;其中一人怀疑是否是某人被拷打时发出的惨叫声,另一个人觉得可能是山羊的叫声。Sandy White 回忆道:“凌晨两点,我带着耳机,它突然发出了 Aaaaahhhhh 的叫声。我吓得出了一声冷汗;但我也很高兴这种方法是可行的!”

自此,Sandy White 开始调整整体系统使其更具适应性,以便用于各种类型和大小的生物。在我去拜访的前一周,他设计了一个 iPad 应用程序,可以让 Paul Weir 操控该软件来创造声音,并在之后以代码的形式整合到游戏中去。这款工具有着一个混搭的用户界面:一部分是笔记本式的触控板,一部分是 MIDI 键盘,还有一部分则像是泰勒明琴(Theremin)。“玩家是永远不会看到这些的。”Paul Weir 解释道,他只对生物原型做发声设计;然后算法会对其做调整,来适应游戏中生成的富有无数变化的生物形象。这种处理方式与游戏中的图形设计类似;设计师使用 Photoshop 等工具绘制生物原型,然后由算法来完成之后的各种变化。

Paul Weir 举着 iPad 说:“这就像是一件乐器。”他在屏幕上滑动手指调节各种参数,比如体重、攻击性、气管长度、湿度、尖叫声度、粗糙声度等。(这款工具可以基于大约一百多种不同的参数来创造声音。)然后,他用两个大拇指同时调节 Vowel Map 和 Pitch 图形框,来生成一段语音发声(Vocalization)。iPad 屏幕上的物理移动决定了发声的能量大小;移动的弧度决定了发声的弧度。

Image02

伴随着一声打哈欠般的隆隆声,像是某种食草动物的咕噜声,Paul Weir 说:“我可以改变它的大小。”他在 iPad 上做了调整,声音的整体频率都变高了;声音质感也变得更加粗糙了。然后,他又加入了上升感的音调和强度变化。这声音听上去像是某种热带物种交配时发出的叫声。

“你看,你需要演奏它,”Paul Weir 说,他正与一名工程学博士候选人合作开发一款定制版的硬件来代替 iPad;他希望能借此创造出更为流畅和真实的发音,“我们想要传达情感。”

Paul Weir 继续调节着 iPad,“如果你一直调高某个参数,听上去就像是鸟叫声了。”Sandy White 眉头紧锁,“这听上去有点合成感了。其中有一个非常规律的颤音。”他暂时把这个颤音当做占位符(Placeholder),之后会用 Perlin Noise 代替,一种在电影和游戏中用于计算机图像生成自然表面材质的算法。

Paul Weir 调节各种参数,生成了更多不同的声音:某种蹄类动物遭遇突然疼痛的叫声;从尖叫声往下降至低频的语音声,像是某种喉部的呼吸声。这些声音听上去都非常真实,如同在外星球动物园里一般。

“这个听起来像是从悬崖上掉下去了。”Paul Weir 笑着说。

“那这个就像是马叫了。”Sandy White 说道。

Paul Weir 建议说:“我们甚至还可以在森林中的每一棵树上都放置一只鸟,你只有在离得足够近的情况下才能听到。然后我们让其在森林中自然繁衍,这样整体空间中的听感就正确了。”他非常兴奋,Sandy White 补充说,“这应该会非常具有音乐性。我们为何不把它们做得更偏向于音乐性?至少也可以是和声。”

语音小样试听:(Soundcloud,请科学上网)
The first trial of Sandy White’s digital vocal tract, designed for No Man’s Sky.

在我拜访 Hello Games 时,Paul Weir 已经完成了音频部分与游戏主版本的整合工作。上述链接是一段由软件生成的语音样本。

相关阅读

Paul Weir – Never Ending Music
http://proceduralaudionow.com/paul-weir-never-ending-music/(内附演讲视频和 PPT)
https://vimeo.com/130008821
http://www.tudou.com/programs/view/QfBvplnXjds/
‘Never Ending Music’ – Paul Weir’s presentation at Procedural Audio Now! – Skype, London, May 28th 2015

No Man’s Sky Sounds Amazing Literally
http://www.vice.com/en_uk/read/no-mans-sky-sounds-amazing-literally-514