PDH学生开发能够实时翻译语言的耳机

听文章

华盛顿大学的研究人员发布了一款原型耳机系统，它可以通过实时翻译多种语言和说话者来改变全球交流。

该系统被称为空间语音翻译，它使用商用组件来捕捉和翻译周围的对话。

该设备可以在嘈杂的环境中检测并隔离几个声音，同时翻译每个说话者的语言，并在几秒钟内将结果传回给听者。

该样机由该大学的移动智能实验室开发，将索尼SH-100XM4降噪耳机与Sonic Presence SP15C双耳麦克风结合在一起，后者以模仿人类听觉的方式录制音频。

打破语言障碍：实时多语种翻译耳机

华盛顿大学的研究人员已经开发出一种原型耳机，能够实时翻译多种语言的多人说话。利用空间音频和人工智能，这些耳机…pic.twitter.com/RSnZLreBn0
——查比♨️（@kimmonismus） 2025年5月19日

这些麦克风将音频馈送到连接的移动设备，在那里神经网络模型处理和翻译输入。翻译后的对话随后通过同样的耳机传送给用户，只是有一点延迟。

测试表明，用户更喜欢3-4秒的延迟，以尽量减少错误，尽管系统可以在1-2秒内做出反应。

“我们的算法有点像雷达，”首席研究员、保罗·g·艾伦计算机科学与工程学院的博士生陈拓超说。

他补充说：“它们可以360度扫描环境，不断识别是一个说话者还是几个说话者，并实时适应。”

该系统目前支持西班牙语、法语和德语，但该团队希望将其功能扩展到大约100种语言。它还可以随着用户转头或在空间中移动而动态调整，保持对个人对话的关注。

高级研究员希亚姆·戈拉科塔表示，翻译工具是“打破文化间语言障碍”的更广泛努力的一部分。该团队还将驱动设备的软件开源，以鼓励进一步的创新。

虽然仍处于原型阶段，但该技术代表了实时多语言通信的重要一步。如果得到充分开发，该系统将在旅游、外交和国际商务中得到广泛应用。

在华盛顿大学的官方网站上可以看到这款耳机的演示视频，该技术的所有相关细节也可以在一个单独的网页上找到。

听文章