欧维动态
返回
列表

喂~真的不是机器人的耳朵! 揭秘人工耳蜗的工作原理

文章出处:欧维动态 网责任编辑: 欧维斯(深圳)科技贸易有限公司 阅读量: 发表时间:2021-09-29 19:30:35

听到"人工电子耳"这五个字你会想到什么呢? 既是「人工」又是「电子」的耳朵,大概就像义肢或义眼吧,会有着与原器官相似的外型,若一不小心开启妄想小宇宙,各种以机器人为题材的科幻电影马上浮现......,先等一下! 这误会可大了!

帮助听损者重拾听力的高科技

人工电子耳其实是听力损失者在助听器之外,可选择使用的听觉辅具之一。 「听见声音」对常规听力正常的人来说,是在出生前就已经开始累积的感官经验,胎儿的听觉系统在孕期 6 个月左右就发育完成(Graven & Browne, 2008),而听觉也是人们离世时最后消失的感官功能(Blundon, Gallagher, & Ward, 2020),可说是在五感当中陪伴人一生最久的感官。 然而,有许多人因为各种先天或后天的因素而有程度不同的听力损失。 随着科技发达,要重拾听觉已不再是遥不可及的事。

就像是大部分长辈因老化而造成的重听,程度相对较轻,可以透过佩戴助听器矫正听力;但重度或极重度以上的听损,采用助听器这种放大声音的方式很可能已无法满足需求。 这时,植入人工电子耳则是另一种可以恢复听觉的选择。

人工电子耳如何产生听觉?

     

image
人工电子耳构造示意图。 图/Wikipedia

人工电子耳的原文为cochlear implant,也有人称为「人工耳蜗」。 从图一中可以看到,医生透过手术将电极(Electrode)植入到内耳的耳蜗当中,而佩戴在耳朵上的声音处理器(Sound processor)将接收到的声音讯号,依照音量和频率分布做计算、并转换为电讯号,再透过佩戴在头上的线圈,经电磁感应传送到植入体(Internal implant),越过受损的内耳, 透过电极以电流刺激听神经(Hearing nerve)而产生听觉(Loizou, 1999)。 所以人工电子耳的外型和耳朵并不相似,而是有一部份佩戴在耳朵上、一部份植入在头部内的。 近年更有一体成形机(可参考网页),佩戴在外部的所有元件都组合在一起,佩戴起来更加轻巧。

当代人工电子耳的发展可回溯到1960年代,一开始发展时许多学者其实并不看好,认为只透过少数几个电极,不可能将复杂的声音讯号与特性真实地呈现,并传递给大脑诠释为有意义的讯息。 然而经过研发与临床试验,许多植入电子耳的听损者可以有好的成效(Eshraghi et al., 2012),植入后一年时测验句子听辨,平均正确率可达到约 90%(Wilson & Dorman, 2008)。 美国 FDA(U.S. Food and Drug Administration;相当于卫福部食药署)也分别在1980年和2000年正式通过成人和1岁以上孩子植入电子耳,至2019年底全球登记在案的电子耳数量超过73万(NIDCD,2021)。

原来耳蜗就像钢琴键盘

虽然电子耳确实能将重度听损者带回有声世界,一开始不看好的学者,其实也对电子耳恢复听觉的表现感到惊叹。 声音的信号十分复杂,究竟是如何只通过 16〜22 个电极,就完成了传递声音信号的任务呢? 要回答这个问题,就要了解声音的两大特性、以及分别如何用电流来呈现。

声音的两大特性就是「音量大小」及「频率高低」,在电子耳的讯号处理中,音量可用电流的大小来呈现,而频率则可以利用电极在耳蜗中的位置来呈现,其原理是因为人的耳蜗原本就有「音调排列(tonotopic)」的特性。

人的耳蜗长度大约 3.5 公分,形状有点像蜗牛壳(所以叫耳蜗嘛! ),盘绕大约 2 圈半。 所谓的音调排列,就如同图二所示,若想象将耳蜗拉直后,耳蜗的底部负责高频的声音、顶端则负责低频的声音,就像是对应钢琴键盘上按照声音频率高低而排列的琴键。 因此,声音讯号并不是全部一起送到所有的电极,而是声音处理器会将声音分解为数个不同的频段,再分别送到对应的电极。

image
耳蜗的音调排列说明示意图。 若将耳蜗拉直来看,底部(Oval window base)负责高频(high frequency)的声音,而顶部(Apex)则对应低频(low frequency)的声音 。 图二/Wikipedia

在耳蜗植入的电极数量,决定声音处理器会将输入的声音分解为几个频段。 例如,澳洲电子耳大厂Cochlear公司的Neucleus电子耳,一般来说会在耳蜗内植入22个电极,那么声音处理器就会将声波分解为22个频段,再以电流脉冲(pulses)进行编码,并分别去刺激对应的电极。 也就是说,大约在 100-300 Hz 这个频率带的声音,在进行编码后就会被传送到植入在耳蜗最顶端的电极;而大约在 6000-8000 Hz 这个频率带的声音,则会透过耳蜗最底端的电极来刺激听神经®[注1]

上述说明的是理论上最理想的状况,然而在实际上,可能因组织构造、听损本身造成的神经存活状态、电极间电流的互相干扰(此为电流本身之特性)等种种原因,造成呈现特定声音频率带的电脉冲并不是(只)刺激原本所设定、负责某频段的听神经,使得声音有失真和扭曲的现象。 所幸人类的大脑具有可塑性,在植入电子耳后,透过听能训练和日常不断累积聆听经验,许多电子耳使用者都能逐渐适应、并提升听辨的表现。

电极数越多、一定听得越好?

那么,通过电子耳的声音听起来到底是如何呢? 在网络上有不少电子耳声音模拟[注2]的视频可以参考,这里介绍美国达拉斯大学提供的网页(Loizou, n.d.)。 其中提供了不同频道数(channel = 频道;概念上相当于电极数)、以及不同植入深度的声音模拟。 以频道数来说,若逐个试听,会发现愈多频道时语音会愈清楚。 不过受限于耳蜗体积、电极相近时会互相干扰等因素,植入的电极数能增加数量有限,如前述一般是植入16 – 22个电极。 此外,虽然在理论上愈多频道(电极)声音会愈清晰,但由于各种复杂的影响因素[注3],实际上这样的关系并不是绝对的,尤其不同的电子耳产品间、或不同个案间,不能直接以电极数来评断声音/聆听质量的优劣。

植入深度也是影响因素

除了频道数外,网站上还提供了不同植入深度的模拟。 电子耳的植入手术中,是将电极从耳蜗的底端插入,理想的植入深度是大约25毫米。 这样的情况下,特定频率带的声音就可以通过对应的电极,去刺激负责那段频率的听神经。 如果植入的深度不够,代表电极的位置是比较偏底端的,根据前面提到的音调排列特性,特定频率带的声音就会被送往较接近底端、偏向较高频率的电极和听神经了。

image
植入深度不足对语音处理的影响示意图。 图三/参考数据 7(Figure 1)

植入深度不足的情况可参考图三,图的上半部示意理想植入深度,因此声音处理器的声音分解(Analysis bands)和刺激电极在耳蜗的分布(Carrier bands)是能够完全对应的。 而图三的下半部,则是植入深度极端不足(16 毫米)的示意图。 在这情况下,大约200-360 Hz这段频率的声音(Analysis bands最左边的小方块),会被传送到负责大约1000-1400 Hz这段频率带的电极及听神经(Carrier bands最左边的小方块),因此声音听起来会变得很高、很尖很细,而有扭曲的现象。 你可以在声音模拟的网站试听看看,植入深度愈浅(22 mm)时,声音听起来会愈尖。

透过训练,让大脑适应电子耳的声音

除此之外,你可能也会发现,若先听过原始的语音(original speech/original sentence)、再听模拟的声音,会发现听起来变得容易理解得多,尤其是参数条件较好的模拟语音,也就是较多频道、或植入深度较深的模拟语音。 如果反复再多听几次,甚至会发现,即使是频道数较少、植入深度较浅的模拟语音,也不像第一次听到时感觉那么难以辨识了。 这样反复练习聆听的过程,可说是电子耳术后听能复健的缩影。

听损者在植入电子耳后,对于大脑来说,并无法马上就能诠释透过电刺激所传送的讯号,而是要透过不断地练习,包括正式的听能复健、以及日常生活中持续累积聆听经验,才能将手术前透过声波所理解的各种声音,再重新与电刺激所呈现的声音进行配对。

电子耳术后复健是关键

电子耳植入后是否能成功地通过听理解日常对话,背后有许多的影响因素,其中关键的两点,是植入前是否有听能和语言的基础,以及植入后的听能复健与日常练习[注4]。 若植入前有听语基础,像是学语后失聪的成人、或植入前有稳定佩戴助听器的聆听经验等,因为已具备语言知识和语音聆听经验,大脑的听觉区有持续地接收刺激,所以在植入后,可以在既有的听语基础上,去建构更好的听能技巧。 而植入后的听能复健与日常练习更是至关重要,透过不断地练习,并配合听语专业人员的复健课程,让大脑可塑性发挥作用,去辨识进而理解透过电子耳传递的语音。

2017 年电子耳纳入健保给付后,许多医生和家长都会积极地为听损孩子植入电子耳。 然而,这里要提醒的是,虽然电子耳确实有许多成功的案例,但在决定手术之前,仍应审慎评估风险与成效,并了解术后复健所需投入的时间与心力,才能在植入后达到最好的聆听成效。

注解

  • 注 1:本文所说明的声音处理方式是经典的策略,随着各家厂商研发新技术,声音讯号处理的方式会有所变化,但在概念上大致相似。

  • 注2:电子耳声音模拟呈现的仍然是声波,与电子耳透过电刺激所传递的方式有本质上的不同,所以并无法真实呈现电子耳用户聆听的感受。 声音模拟的真正用途是在学术研究与技术研发,让学者和电子耳公司,能透过改变模拟的参数进行实验,来找寻更好的电子耳声音处理策略。

  • 注 3:影响因素包括:先天内耳构造、电极间的电流交互作用、耳蜗死区、听神经存活率、电子耳调频图的各项参数......

  • 注 4:植入后的另一项关键因素是定期调频(mapping;另一译名为「调机」),即听力师依个案需求,调整电子耳声音处理策略的各项参数及电流量,一开始植入后需较密集地调频,应配合听力师建议定期进行,稳定后亦应每年调频一次。 受限于篇幅本文未深入说明。


欧维听觉请您
免费试用30
公众号二维码
咨询热线 400-7777-277