热搜词: Xiaomi latest smartp

PDH学生开发能够实时翻译语言的耳机

听文章

华盛顿大学的研究人员发布了一款原型耳机系统,它可以通过实时翻译多种语言和说话者来改变全球交流。

该系统被称为空间语音翻译,它使用商用组件来捕捉和翻译周围的对话。

该设备可以在嘈杂的环境中检测并隔离几个声音,同时翻译每个说话者的语言,并在几秒钟内将结果传回给听者。

该样机由该大学的移动智能实验室开发,将索尼SH-100XM4降噪耳机与Sonic Presence SP15C双耳麦克风结合在一起,后者以模仿人类听觉的方式录制音频。

这些麦克风将音频馈送到连接的移动设备,在那里神经网络模型处理和翻译输入。翻译后的对话随后通过同样的耳机传送给用户,只是有一点延迟。

测试表明,用户更喜欢3-4秒的延迟,以尽量减少错误,尽管系统可以在1-2秒内做出反应。

“我们的算法有点像雷达,”首席研究员、保罗·g·艾伦计算机科学与工程学院的博士生陈拓超说。

他补充说:“它们可以360度扫描环境,不断识别是一个说话者还是几个说话者,并实时适应。”

该系统目前支持西班牙语、法语和德语,但该团队希望将其功能扩展到大约100种语言。它还可以随着用户转头或在空间中移动而动态调整,保持对个人对话的关注。

高级研究员希亚姆·戈拉科塔表示,翻译工具是“打破文化间语言障碍”的更广泛努力的一部分。该团队还将驱动设备的软件开源,以鼓励进一步的创新。

虽然仍处于原型阶段,但该技术代表了实时多语言通信的重要一步。如果得到充分开发,该系统将在旅游、外交和国际商务中得到广泛应用。

在华盛顿大学的官方网站上可以看到这款耳机的演示视频,该技术的所有相关细节也可以在一个单独的网页上找到。

听文章

华盛顿大学的研究人员发布了一款原型耳机系统,它可以通过实时翻译多种语言和说话者来改变全球交流。

该系统被称为空间语音翻译,它使用商用组件来捕捉和翻译周围的对话。

该设备可以在嘈杂的环境中检测并隔离几个声音,同时翻译每个说话者的语言,并在几秒钟内将结果传回给听者。

该样机由该大学的移动智能实验室开发,将索尼SH-100XM4降噪耳机与Sonic Presence SP15C双耳麦克风结合在一起,后者以模仿人类听觉的方式录制音频。

打破语言障碍:实时多语种翻译耳机

华盛顿大学的研究人员已经开发出一种原型耳机,能够实时翻译多种语言的多人说话。利用空间音频和人工智能,这些耳机

——查比♨️(@kimmonismus) 2025年5月19日

这些麦克风将音频馈送到连接的移动设备,在那里神经网络模型处理和翻译输入。翻译后的对话随后通过同样的耳机传送给用户,只是有一点延迟。

测试表明,用户更喜欢3-4秒的延迟,以尽量减少错误,尽管系统可以在1-2秒内做出反应。

“我们的算法有点像雷达,”首席研究员、保罗·g·艾伦计算机科学与工程学院的博士生陈拓超说。

他补充说:“它们可以360度扫描环境,不断识别是一个说话者还是几个说话者,并实时适应。”

该系统目前支持西班牙语、法语和德语,但该团队希望将其功能扩展到大约100种语言。它还可以随着用户转头或在空间中移动而动态调整,保持对个人对话的关注。

高级研究员希亚姆·戈拉科塔表示,翻译工具是“打破文化间语言障碍”的更广泛努力的一部分。该团队还将驱动设备的软件开源,以鼓励进一步的创新。

虽然仍处于原型阶段,但该技术代表了实时多语言通信的重要一步。如果得到充分开发,该系统将在旅游、外交和国际商务中得到广泛应用。

在华盛顿大学的官方网站上可以看到这款耳机的演示视频,该技术的所有相关细节也可以在一个单独的网页上找到。