导航
关闭

商讯

当前位置: > 资讯 - 正文

讯飞星火X1.5超拟人交互开启人机共融新时代

时间:2025-12-15 来源:互联网

11月6日,第八届世界声博会暨2025科大讯飞全球1024开发者节在合肥举行。科大讯飞发布深度推理大模型讯飞星火X1.5,重磅推出超拟人多模态交互技术及系列应用,以人工智能国家队的创新实力,让AI真正走进人类的情感世界。

定义多模态交互八项能力,让AI能听会说、能看会认

什么样的AI才能真正融入人类生活?科大讯飞给出了答案:超拟人多模态交互。

发布会上,科大讯飞系统定义了多模态交互的八项核心能力:麦克风远场识别、3D视觉感知、多人主动交互、类人举止反馈、视听觉融合理解、超拟人数字人、个性化记忆、情感语义。科大讯飞董事长刘庆峰表示:“有了这些技术的综合联动,我们的AI就不再是一个简单的APP软件,而是可以走入到更有情感、更有深度应用的各个空间中。”

作为依托认知智能全国重点实验室的人工智能国家队核心成员,科大讯飞在全国产算力平台上实现了超拟人技术的重大突破。搭载多模态交互能力的数字人导览“小飞”亮相现场,能够实现多人自然对话、多语言即时交流,还能记住来访嘉宾的历史信息,贴心提醒健康状况,更可秒变“虚拟林黛玉”等不同形象为用户服务。

首发个性化记忆能力,AI真正懂你所想

真正懂你的AI,需要记住你、理解你。讯飞星火X1.5首发个性化记忆能力,构建起完整的用户记忆库,涵盖长期画像、近期反馈、短期对话和个人资料四大维度,实现多源记忆信息的检索、应用与动态更新。

这意味着,AI不再是“每次对话都从零开始”的陌生人,而是能够记住用户偏好、理解用户习惯的贴心伙伴。无论是工作场景中的个性化协助,还是生活场景中的智能陪伴,AI都能基于历史记忆提供更精准、更贴合的服务。

百变声音复刻,一句话创造任意音色

声音是情感传递的重要载体。发布会上,科大讯飞首发百变声音复刻技术,基于星火语音大模型底座,一条指令即可创造任意风格,一句录音即可复刻任意音色,二者可自由解耦组合。

现场演示环节令人惊叹:科大讯飞研究院院长刘聪用公开采访素材复刻他人音色,并让其演绎“霸气将军”“神奇法师”等截然不同的角色,更流利说出阿拉伯语、英语等多语种内容,3分钟演示赢得全场3次掌声。

作为国家新一代人工智能开放创新平台承建单位,科大讯飞还全球首发非自回归语音大模型架构,推理成本下降520%,效果提升16%,为超拟人语音交互提供强大技术底座。

AI星朋友发布,科幻电影照进现实

发布会最后,科大讯飞带来温暖“彩蛋”——正式发布AI陪伴产品“星朋友”。它不是冰冷的工具,而是拥有高保真声音、160余种人设模型的“成长伙伴”,通过自学习情感模型记忆用户偏好。

“星朋友”会在用户需要时主动来电,失眠时温柔陪伴,低落时加油打气,面试前提醒辅导。数据显示,用户周均使用9.8次,正向情绪反馈率达82%。科幻电影《Her》中的场景正在成为现实。

刘庆峰强调:“超拟人多模态交互,将是未来AI进入每个家庭的标配。”

从全国产算力底座到百分百全国产化硬件,从个性化记忆到百变声音复刻,科大讯飞正以大模型国家队的使命担当,让“更懂你的AI”成就更好的你,开启人机共融的温暖新时代。

 

标签: