2019-05-15 05:31:01
研究团队介绍了可穿戴音频数据集

感谢伊利诺伊大学厄巴纳 - 香槟分校的研究生Ryan Corey和他的团队,研究可穿戴式听力技术的研究人员现在可以使用新的数据集。

在本周举行的国际会议上的声学,语音和信号处理(ICASSP)首次亮相,第一的,其独一无二的可穿戴式麦克风的脉冲响应数据集是非常宝贵的音频研究的原因有两个:首先,数据包括高达80麦克风而不是通常的两个显示在身体的不同部位听到的声音,其次,数据可以在开放访问许可下免费获得。

“我们相信助听器,智能耳机和所有听力设备如果有很多麦克风就能更好地工作,但大多数产品只有两个,”科瑞说。 “除此之外没有数据。即使是更多的工作也不包括开放访问数据集。”

该数据集包括在身体上80个不同位置测量的超过8,000个声脉冲响应。 80个麦克风在五种不同的帽子/耳机样式和六种不同类型的服装上进行了测试。录音中的声音来自24个不同的方向,以模拟嘈杂的人群。

该团队,包括科里的顾问,协调科学实验室(CSL)的Andrew Singer教授和前本科学生Naoki Tsuda,花了数周时间在人体模型上放置了80个麦克风,Corey自己也在CSL增强听力实验室。然后,他们记录了声脉冲响应,以研究身体的声学效果,以及衣服是否在麦克风吸收噪音方面有所不同。收集的数据由团队在本周ICASSP上发表的论文中使用,但他们希望数据更进一步。

“当我们试图使用未开放的数据集时,我们感到很沮丧,”科里说。 “可穿戴阵列很重要,更多人应该对它进行研究。将这些数据放在那里会使这样做更方便。”

未来的研究人员可以使用这些数据来模拟身体不同部位具有不同数量麦克风的可穿戴麦克风阵列。许多人已经戴着带有麦克风的多个设备,这些数据可以帮助利用这一点。工程师可以使用它来设计新产品并研究不同应用的性能折衷。数据的一些潜在应用包括增强现实,语音识别和声学事件检测等。如果没有CSL团队创建的数据集,每个研究人员都必须构建自己的原型并对其进行测试,这既耗时又昂贵。

演讲将于5月14日星期二在英国布莱顿举行。歌手,福克斯家庭电气和计算机工程教授,科里希望该演讲将提高对数据集的认识,鼓励其他人使用它,并让他们有机会接收反馈。

“这是有史以来最受欢迎的音频信号处理会议,所以我将能够将这些数据集介绍给许多可能利用它,建立在它上面并为我们提供反馈以便将来改进的研究人员。”科里说。

该数据集可在伊利诺伊大学图书馆伊利诺伊州数据库档案的知识共享署名许可下获得。 Corey还在实验室博客上撰写了关于数据集的文章。

猜您喜欢的其它内容