据英国《自然·通讯》杂志30日发表的一项神经学研究,美国加州大学旧金山分校科学家报告了神经解码器方面的最新进展,其可以将问答对话的相关脑活动,实时转化为文字记录。
大脑皮层包含不同的区域,其中的神经活动会编码语音感知与生成。此前研究表明,这种脑活动可以被解码,但是一直以来的研究都侧重于将听说任务分开进行解码。
此次,研究人员爱德华·张(音译)及同事,在模拟的问答对话试验中,通过脑活动解码了语音感知与生成。研究的被试者为3名正在接受癫痫治疗的患者,他们要听一系列问题,并通过一套规定的答案,口头回答问题。研究团队则将被试在这个过程中的脑皮层活动记录下来,之后这些数据被用于训练语音检测和解码模型。随后,被试再听一系列问题,并大声地用自己所选的答案作答。
结果显示,仅使用在对话中记录下的神经信号,研究团队便能够检测被试何时在听,何时在说,并且能够预测所听或所说的具体内容是什么。通过解码问题,他们能够利用所得信息提高被解码答案的准确性(部分答案只适用于特定问题)。而且,对于生成语音和感知语音的解码,其准确性分别提高到61%和76%。
现阶段还需要开展进一步工作来解码想象的语音回答,这样在实际应用中,才能让因为损伤或神经退行性疾病而无法说话的患者顺利使用这项技术。
今年4月,该研究团队首次报告研发出一种能将脑活动转化为语音的解码器,当时科学界评价其为“一项非常有力的概念验证”,但“该系统距离真正成为一种临床可行的设备,尚面临许多挑战”。
来源:生物谷