会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 阿里云百炼上线音视频实时互动功能 人人都能创建专属多模态应用!

阿里云百炼上线音视频实时互动功能 人人都能创建专属多模态应用

时间:2024-12-28 01:53:04 来源:山肤水豢网 作者:休闲 阅读:408次

近日,阿里阿里云百炼上线了全新音视频实时互动功能,云百用用户可在百炼上自由选择文本、炼上语音和视觉理解等200多款模型,线音无需代码,视频实数分钟即可搭建一个能听、互动能看、人人会说的都能多模专属AI助手。阿里云百炼还支持以sdk的创建形式集成到Web、ioS和安卓应用,专属可应用于AI虚拟助手、阿里虚拟陪伴和AI老师等场景。云百用

阿里云百炼上线音视频实时互动功能 人人都能创建专属多模态应用

用户在百炼上几分钟即可搭建一个能听、炼上能看、线音会说的视频实专属AI助手

过去一年,大模型正在从纯文本模态向语音和视觉等多模态演进,极大地拓宽了大模型应用的想象空间。然而现有单一模型仍旧无法处理复杂的任务,为了进一步加速单一大模型构建成像人一样自然交互的复杂AI应用,阿里云百炼提供了200多款语言模型Qwen、视觉语言模型Qwen2-VL、语音合成模型CosyVoice等全模态全尺寸大模型,同时联合阿里云AI实时互动方案,在国内率先为用户提供了便捷的工作流应用和智能体编排应用,例如支持构建RAG知识库、Prompt调优、sdk集成等。

据介绍,在视觉理解模型方面,阿里云Qwen2-VL具备强大的视觉智能体能力,例如采用多模态旋转位置嵌入(M-ROPE)方法,能够同时捕捉和整合一维文本序列、二维视觉图像以及三维视频的位置信息,模型具备更好地理解和建模复杂的多模态数据,该模型一经推出就成为开源社区最受欢迎的多模态大模型;在音频方面,阿里云语音合成模型CosyVoice,通过对生成语音的情感、韵律进行细粒度的控制,情感表现力上得到明显提升,阿里云AI实时互动方案还可提供化智能降噪、智能打断、智能断句等超拟人对话能力。

以搭建一个视觉能力的AI应用为例,用户进入百炼应用控制台后,仅需上传图片知识库、编写提示词、设置音频、调优这四步,数分钟内就能创建一个能完成专属视频交互的AI应用,基于Qwen-VL强大的视觉推理能力,它不仅能识别物体的种类,还能准确描述物体的风格、特点、位置以及物体上的文字等关键信息。此外搭建好的应用还支持以音视频sdk集成到用户的Web、ioS或者安卓应用中,帮助企业快速实现业务创新。

据介绍,阿里云百炼上的通义API每百万tokens价格已降至0.3元,一汽、金山、哈啰集团、国家天文台等超30万企业和机构在使用阿里云百炼。

(责任编辑:知识)

相关内容
  • 米兰双雄截然不同!马洛塔阐述国米精神内核,冬窗0引援十分合理
  • 官宣在即!什琴斯尼现身诺坎普,现场观战对阵年轻人的欧冠
  • 德转历史最高身价榜:梅西内马尔曾1.8亿欧19年斯特林1.6亿
  • 亚冠积分榜:海港、申花均惨败分别滑落至第9、第6,泰山第4
  • [流言板]伤病远离!托平突破脚下打滑受伤非常痛苦,被搀扶回更衣室
  • 埃里克森:没从俱乐部听到续约的消息,现在我只专注于足球
  • 啄木鸟官方旗舰店大促:纯色圆领毛衣49.9元 高领/半高领款59.9元
  • 在一个处处悬崖断壁连公路都没有世界,突然出现一个棱角分明的现代化摩托,这还是原神吗?本地化一点不做了对吗
推荐内容
  • 还没到底啊!?曼城近期英超1胜2平6负,欧冠1平2负,联赛杯出局
  • 第一届全国青少年三大球运动会在湖南长沙开幕
  • 普利西奇:在切尔西赢欧冠仍感觉超现实 希望我能激励美国孩子们
  • Major这个对阵为什么这么分?
  • LPL职业教学:GALA教你金克丝对线技巧和团战思路
  • 说到做到!伊万屡次说国足目标小组前四、对印尼&巴林才是关键