加载中…
  • 双域名启用:电影声音
  • 加入VIP会员,看更多内容vip
  • Pro Tools国际认证课
  • S短片节-声音人的节日
  • 购物车
  • 我的帐户

{{userData.name}}

个人中心
后台
{{item.count}}
{{textHint.loading}}
  • {{data.name}}({{data.count}}){{data.name}}
投稿
  • 资讯
    • 限免/优惠
    • 奖项
    • 行业
    • 电影声音研学中心
    • 软件新闻
    • 硬件新闻
  • 学知
    • 中国声音
    • 声音人
    • 声音制造
    • 声音设计
    • 声景与实地录音
    • 声音艺术
    • 游戏声音
    • 影视音乐
  • 技术
    • 来团
    • #AI音频技术频道#
      • 音干分离
    • 麦克风频道
      • 同期麦克风
      • 无线麦克风
      • 后期麦克风
      • 麦克风知识
      • 麦克风综合讯息
    • 前期/同期硬件
      • 录音机
    • 后期技术
      • 后期硬件
        • 音频接口
        • 监听耳机/音箱
        • 调音Mixer / 控台 Control
      • 后期软件
        • 音频插件 Plug-in
          • 免费 限时 Free
          • EQ 均衡类
          • Dynamics 动态类
          • Reverb/Delay混响及延迟
          • DeNoise 音频修复类
          • Effect 效果类
          • Meter 计量 显示 测量类
          • SoundField 声场 空间类
          • Instrument 乐器类
          • modulate Harmonic pitch 调制 谐波 移调类
          • others 其它类
        • DAW
          • ProTools
        • Krotos声音设计
      • 音效
      • 空间音频/沉浸声/全景声
      • VR/AR/XR声音
    • 周边配件
    • 综合
  • 专题
    • 24-25颁奖季
    • 纪录片声音制作
    • 短片声音制作
    • 23-24颁奖季
    • NAB2024
当前位置:首页-#AI音频技术频道#,监听耳机/音箱-正文

源自复旦大学的开源、支持人工智能的耳机

#AI音频技术频道#, 监听耳机/音箱6个月前001.33K0
密歇根大学和复旦大学的合作团队正在众筹一款新的可穿戴人工智能音频界面,以实现全天候情境感知、提升隐私保护,并让AI应用开发者能够尝试新想法。

一张特写照片展示了桌上的两副黑色耳机和一个黑色充电盒,旁边是笔记本电脑的键盘。文字叠加显示:“Buddie,隐秘的AI耳机助手。”

源自复旦大学的开源、支持人工智能的耳机 - 第1张
这是通过Kickstarter活动推出的Buddie。图片由Robert Dick提供

你有多少次忘记了别人刚告诉你的名字或事实,或者在会议中漏记了重要笔记?想象一下,当你大声问“我新认识的朋友叫什么名字?”或“这个项目的行动项是什么?”时,能立即得到虚拟助手的准确回答。

为了让虚拟助手能够立即对你这样的问题给出准确回答,它需要了解问题背后的情境。情境感知要求虚拟助手在你提问或请求帮助之前就已经在监听对话。

这就是Buddie的前提。Buddie由耳机和智能手机应用组成,为人工智能(AI)代理提供了一个情境感知的语音界面。它由电气与计算机工程教授Robert Dick以及包括中国上海复旦大学的李尚和杨帆在内的国际合作者团队共同开发。这些研究人员于12月23日发起了Kickstarter活动,旨在让日常用户试用这项技术,并让软件开发人员能够进行实验。

源自复旦大学的开源、支持人工智能的耳机 - 第2张

史蒂夫·乔布斯曾通过定义触摸屏作为手机的主要界面,彻底改变了手机行业。Dick、李尚和杨帆认为,在AI时代,情境感知语音将是下一个变革性的界面,而耳机则是实现无需动手、随时随地轻松访问AI服务的理想形式。

为了实现这一愿景,Buddie耳机始终在“监听”,以收集用户对话和交互的情境。Buddie的设计让用户能够控制其私人数据的发送位置,从而保护隐私。耳机录制对话,使用节能方法将信息传输到用户的智能手机,将口语转化为书面文字,并立即删除音频记录。转录文字保存在用户的手机上,用户可以查看文件、删除文件,并基于记录的情境向第三方大型语言模型(LLM)(如ChatGPT)提问以获得回答。LLM的任何回答都会通过语音读回。

“口语是人类对话中的主要交流界面,”Dick解释说,“情境感知使口头交流更加高效和准确。想象一下,你走进一个房间,其他人正在谈话中。除非你让他们停下来并重新陈述情境,否则你不会知道他们在说什么。这是AI助手经常遇到的情况。如果它们有情境感知,它们就能更有帮助,并减少你重复解释的负担。没有情境感知,你只能向AI助手询问百科全书式的问题。有了情境感知,你可以询问它关于你生活的问题。”

尽管情境感知对AI应用很有用,但持续监听给研究人员带来了技术挑战。它会因功耗增加而迅速耗尽耳机和智能手机的电池。Buddie采用了精心设计的、节能的、基于压缩的方法来解决持续通信的挑战。

Buddie项目的开源性质受到了Arduino的启发,Arduino是一个成功的开源电子平台,允许任何技能水平的用户创建和分享自己的互动项目。Dick希望购买Kickstarter上Buddie设备的用户和研究人员能够创造并分享他们自己的用途、软件修改和改进想法。为此,Buddie将以成本价40美元提供。该团队最终希望能有数百万人使用它并分享他们的体验。

源自复旦大学的开源、支持人工智能的耳机 - 第3张

“Buddie背后的想法部分受到了Vannevar Bush 1945年在《大西洋月刊》上发表的文章《如我们所想》的启发,该文章描述了一个基本上能够实现无限记忆个人经历和文档的生命日志系统,”Dick说。

与“生命日志”和情境感知AI相关的未来工作包括开发MemX:注意力感知智能眼镜,其命名源自Vannevar想象中的“Memex”(记忆扩展器)系统。Dick和他的合作者还设想,智能眼镜能够通过追踪学生的注意力对象,将其与他们所看内容的含义相关联,并通过面部表情推断情绪状态(例如,困惑、沮丧、专注),从而提供一对一教育的一些优势。

目前,研究团队选择通过Buddie专注于音频,因为它有潜力实现广泛可用的、与AI助手的情境感知口头交流。他们还在研究进一步增强隐私保护的方法。未来版本将让用户能够轻松选择隐私政策最严格的AI助手,提供让用户通过板载智能控制数据的方法,以及使用在机器学习和推理过程中保护用户隐私的方法。

人工智能(16)开源(2)耳机(11)

相关文章

  • 人工智能音频accentize发布DialogueEnhance 2.0

    人工智能音频accentize发布DialogueEnhance 2.0

    [qq-video id="sj…
    denglu denglu 02.91K00
  • 更强的AI作曲Stable Audio 2.0,支持上传样本创作

    更强的AI作曲Stable Audio 2.0,支持上传样本创作

      刚刚发布的Stable A…
    locationsound locationsound 05.27K00
  • OSMIX 推出AI人工智能音频混音平台

    OSMIX 推出AI人工智能音频混音平台

    OSMIX推出了智能音频混音平台…
    lsadmin lsadmin 02.09K00
  • 音频驱动的机器人:AI人工智能开发的新领域

    音频驱动的机器人:AI人工智能开发的新领域

    音频集成在机器人技术中的应用标志…
    locationsound locationsound 02.39K00
  • HEDD Audio 推出 HEDDphone TWO GT耳机

    HEDD Audio 推出 HEDDphone TWO GT耳机

    HEDDphone Two GT…
    locationsound locationsound 01.62K00
  • THX Spacial Audio 空间声及平台初探

    THX Spacial Audio 空间声及平台初探

    THX于今年上半年宣布与高通公司…
    locationsound locationsound 03.70K00

最新文章

  • 录好动物音效录音,来看这篇文章
    录好动物音效录音,来看这篇文章
    声景与实地录音, 声音制造, 声音艺术, 声音设计
  • Malcolm Toft 发布 Ultima 控台
    Malcolm Toft 发布 Ultima 控台
    硬件新闻, 资讯
  • 音频协作平台SyncDNA SONIC 发布
    音频协作平台SyncDNA SONIC 发布
    资讯, 音频插件 Plug-in
  • 免费的高品质的瞬态塑造器 Wavesfactory Flash
    免费的高品质的瞬态塑造器 Wavesfactory Flash
    资讯
  • 索尼即将推出ECM-778紧凑型Hi-Res高解析专业麦克风
    索尼即将推出ECM-778紧凑型Hi-Res高解析专业麦克风
    资讯
  • AI 初创公司将音频曲目几分钟内转录为乐谱
    AI 初创公司将音频曲目几分钟内转录为乐谱
    资讯
  • Tracktion发布Waveform 13.5
    Tracktion发布Waveform 13.5
    音频插件 Plug-in
  • Lunacy Audio发布Chorus/phase 效果与灵活滤波器免费插件
    Lunacy Audio发布Chorus/phase 效果与灵活滤波器免费插件
    资讯
  • 戛纳电影节《风之子:帕拉》的沉浸与声音
    戛纳电影节《风之子:帕拉》的沉浸与声音
    声音人, 声音制造, 声音艺术, 声音设计, 行业, 资讯
  • Reason 13.3 发布
    Reason 13.3 发布
    资讯

没有相关内容

更多文章

  • 周周乐儿 第叁期 汉斯季默出镜 Locatiosound.cn
    周周乐儿 第叁期 汉斯季默出镜 Locatiosound.cn
    周周乐儿2.66K
  • 英国空间音频节
    英国空间音频节
    空间音频/沉浸声/全景声, 行业2.19K
  • Pro Tools 安装与支持演示课程——总结
    Pro Tools 安装与支持演示课程——总结
    ProTools3.16K
  • 声音人不得不关注 AI人工智能语音技术
    声音人不得不关注 AI人工智能语音技术
    #AI音频技术频道#, 声音人, 综合5.78K
  • 纪录片《越南战争》声音团队如何制作出情感丰富的沉浸体验
    纪录片《越南战争》声音团队如何制作出情感丰富的沉浸体验
    VIP, 视频2.58K
  • 声音痴迷者-英国影视学院声音专业负责人谈影视录音(下)
    声音痴迷者-英国影视学院声音专业负责人谈影视录音(下)
    声音人2.85K

没有相关内容

热门文章(一年内)

  • SSG Audio 推出母带处理 AI 插件
    SSG Audio 推出母带处理 AI 插件
    2.45W
  • 常见Pro Tools 错误代码含义及修复(1)
    常见Pro Tools 错误代码含义及修复(1)
    1.05W
  • 姗姗来迟,Pro Tools 2024.10发布
    姗姗来迟,Pro Tools 2024.10发布
    8.60K
  • Kiive Audio 推出重新设计的 NFuse 总线处理器插件
    Kiive Audio 推出重新设计的 NFuse 总线处理器插件
    8.54K
  • 常见Pro Tools 错误代码含义及修复(2)
    常见Pro Tools 错误代码含义及修复(2)
    8.16K
  • 索尼推出全新MDR-M1封闭式监听专业耳机
    索尼推出全新MDR-M1封闭式监听专业耳机
    7.49K
  • 预测Apple 2025 年 Mac 电脑发布计划
    预测Apple 2025 年 Mac 电脑发布计划
    7.25K
  • Sonible prime:vocal – 新的AI人声增强工具
    Sonible prime:vocal – 新的AI人声增强工具
    6.56K

没有相关内容

蛇年大吉!

分类推荐

没有相关分类

标签精选

  • Pro Tools
  • AI
  • 奥斯卡
  • Zoom
  • 杜比全景声
  • 声音设计
  • iZotope
  • 声音制作
  • 拟音
  • Avid

没有相关分类

最新视频

  • 就这么屌,与ChatGTP-4o对话就完成角色配音
    就这么屌,与ChatGTP-4o对话就完成角色配音
    1年前
  • 第96届奥斯卡获奖公布 Ludwig Göransson 颁奖视频
    第96届奥斯卡获奖公布 Ludwig Göransson 颁奖视频
    1年前

没有相关内容

联系我们

请加微信个人号:locationsound

关于

  • 联系
  • 关于我们
  • 支持我们
  • 加入我们

扫一扫关注公众号

扫一扫
"Copyright © 2015-至今 同期录音网 ICP备2021023776-2
136 次查询在 1.769 秒, 使用 55.29MB 内存