未来智能胡郁出席达沃斯科学峰会:下一代人机交互方式是什么?
7月11日-12日,聚集了世界学术顶尖学者、科学精英、创新者和企业家的iCANX Davos Summit 达沃斯科学峰会在瑞士达沃斯圆满举办。同期,由iCANX Association主办、未来智能协办的“人工智能+:探索发展前沿与引领趋势,培育新质生产力论坛”,也邀请了全球范围内的人工智能交叉学科领域的科学家齐聚一堂,共同探讨人工智能的前沿和趋势。
未来智能董事长胡郁在论坛上发表了主题演讲,分享了他对AIoT时代人机交互方式的理解与展望——“经历了图形交互界面、触摸交互界面,下一个革命性的人机交互方式会是什么? ”
在漫长的人机交互历程中,人与实物如何产生自然、舒适的交互,一直是科学家和工程师们研究的重点,而近年来随着人工智能和物联网的兴起、深度学习和大数据技术的发展,人机交互也逐步从图形、触摸到语音不断进阶,到如今,人类自然便捷的沟通方式——语音,早已成为人机交互的主流趋势。
在胡郁看来,“语音之所以厉害,是因为机器有显示屏,可以把文字、图片、音频和视频直接播放给人看。而人并没有显示屏,要将大脑里的想法告诉机器,除了跳舞、画画、写字、打手势,还有一个直接的办法就是讲话,而这就需要机器刚好听得懂我们讲话。”
但事实上,要让机器听清、听懂人类语言并不是一件容易的事,在噪声干扰、多人语音混叠的情况下如何精准识别?在多语种情境下如何准确翻译?都是语音交互发展的关键瓶颈。
未来智能作为一家AI硬件公司,核心团队成员在AI语音领域已经深耕超10年,从智能语音助手到AI会议办公,讯飞会议耳机不仅可以在多人语音混叠的会议场景中智能识别出不同人物的声纹特性,实现说话人角色区分;还支持32种语言同传翻译,在多种语境下也可以实现面对面实时翻译以及同传听译。5月刚发布的讯飞会议耳机Pro 2全新升级“红点闪录”,无需连接App即可一键开启,为用户带来更便捷的录音使用体验。
更重要的是,讯飞会议耳机搭载的viaim AI,可一键生成摘要总结和待办事项,内置的“万姆”助理有问必答,通过对话形式了解用户需求,为其提供或有目的重点、或全面普适的方法与建议。
在本次达沃斯科学峰会上,胡郁就带领专家学者们一同体验了未来智能会议耳机的同传翻译功能,相关学者们也“现学现用”,迅速将耳机的“同传听译”和“摘要总结提取”功能用在了论坛的交流现场。
近年来,“大模型+语音”的发展模式,正在为智能语音技术和产业带来新一轮的革命性突破,在胡郁看来,对于人机交互场景而言,这还只是一个开始——“随着人工智能和机器人核心技术的发展,我们可以看到,以语音语言交互为主,以感知运动交互为辅的下一代人机交互系统的发展已经迫在眉睫。”胡郁说。
推荐阅读
快讯 更多
- 11-21 10:28 | 儒竞科技使用部分超募资金和自有资金投资建设泰国新项目 第一期计划总投资金额2.26亿
- 11-21 10:06 | 供销大集拟以现金15.11亿元收购北京新合作商业发展有限公司51%股权
- 11-21 10:03 | 永利股份拟在泰国投资设立全资子公司 计划投资金额不超过5000万泰铢
- 11-21 09:55 | 杭州高新发生生产安全责任事故 公司及董事长胡宝泉被处罚
- 11-21 09:48 | 天赐材料拟用不超1.6亿回购股份 用于实施股权激励计划或员工持股计划
- 11-21 09:42 | 恒辉安防拟用不超6000万回购公司股份 用于员工持股计划或者股权激励
- 11-15 16:49 | 《中关村企业年度发展报告(2024)》发布:中关村新三板企业平均研发强度为4.88%
- 11-14 20:28 | 传奇生物公布2024年第三季度业绩:加速布局产能与研发,巩固全球细胞治疗市场地位
- 11-14 15:43 | 朗威股份拟以自有资金不超过 1亿元投资设立全资子公司
- 11-14 15:39 | 吉林敖东拟用不超6亿回购公司股份 维护公司价值及股东权益