前几天看到有人贴神奇的翻译器的视频,你说一句话,它能把这句话翻译成其它语言。翻译器的第一步就是要把采集到的声音信号识别成语言,这个过程离不开声音信号的频谱分析。
那什么是频谱分析?频谱分析是一种将多频复合信号分解为单频信号组合的技术。相比女性的声音,男性的声音低频部分多一点,高频部分少一点,所以听起来声音比较低沉。简单地讲频谱就是把信号表达成不同频率上的幅度。
智能手机上下载一个频谱分析软件,你就能以图形方式看到以上的过程了。我用的是免费软件 Spectroid。这个软件不仅可以实时地给你做频谱分析,并且还能记录频谱历史,也就是频谱随时间的变化。虽然不同的人声调不一样,但是讲同一句话时的频谱图样却是大致相同的。这个就是语音识别的基础。比如这张图里分别是女儿和我说的“Brown bear brown bear, what do you see?”,女儿的音调高一点,我的音调低一点,但图样却是相像的。

小朋友很快就用Spectroid玩起了另外的游戏。第一个游戏是用声音来画线。我们比赛,谁能在Spectroid的频谱历史图上画出来来回回的折线来。下面这个图是我们的“冠军”作品。

第二个游戏是用Spectroid来测Fidget spinner 的转速。Fidget spinner是今年小朋友们玩得最疯的玩具,其实它是好无聊的一个旋转的小东西。小朋友们比谁的fidget转得快,转得时间长。Fidget 旋转得很快,不用仪器没法知道它的转速。恰好频谱分析仪可以测出空气振动的频率,我们把fidget放在手机话筒前,旋转fidget,果然测量出了它的旋转频率!而且这个频率逐渐降低,从一开始的84 Hz 到30秒后的50 Hz。因为空气振动是由fidget的三个翼引起的,所以转速是振动频率的三分之一,起始转速应该是 84/3 = 每秒28转。
