当前位置: 首页 > 实时讯息 >

成本最高降90%!百度发布端到端语音语言大模型

0次浏览     发布时间:2025-04-01 11:36:00    

3月31日,在百度AI DAY上,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,能实现超低时延与低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约50%到90%。当日,百度旗下AI助手文小言宣布率先接入该模型,并带来多模型融合调度、图片问答等功能升级。

接入全新的端到端语音语言大模型后,文小言不仅能支持更拟真的语聊效果,而且支持重庆、广西、河南、广东、山东等特色方言。据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的3到5秒降低至1秒左右。

更新后的文小言还支持“多模型融合调度”,通过整合自研的文心X1、文心4.5等顶尖模型,并接入DeepSeek-R1等第三方优质模型,实现了多模型间的智能协同。用户可以选择“自动模式”,一键调用最优的模型组合,也可以根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。

同时,文小言还加强了图片问答功能,人们拍摄或上传图片,以文字或语音提问就能直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI可自动解析风格并生成同款手机壳、支架等周边产品等。

来源:北京日报客户端

记者:孙奇茹

相关文章:

西部乘势而上 | 这就是西部速度04-25

AI硬件行业地震!涂鸦AI Token免费,开发者有福了?04-24

用人工智能解锁高质量发展密码(走进民营企业看创新③)04-24

华为车BU正式发布乾崑ADS 4高速L3商用解决方案04-22

大尺度色情语聊、撮合卖淫嫖娼!交友软件暗藏“桃色陷阱”04-20

上海这台人形机器人完成半马:无故障、无摔倒,冲过终点不忘挥手致意04-19

三峡集团申请电力架空线路故障识别专利,能够在实际应用中快速准确地识别电力架空线路的故障04-17

深睿医疗 CMEF2025多模态大模型开启智慧医疗新纪元04-14