迈向AGI关键一步，云知声推出山海多模态大模型

今年5月中旬，OpenAI推出GPT-4o，凭借突破性的智能交互能力，颠覆了我们对人机交互的认知，掀起多模态大模型的新浪潮。

3个月后的今天，云知声推出山海多模态大模型，迎来属于我们的“Her时代”。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出，带来实时多模态拟人交互体验，开启AGI新范式。

能听会说，更“声”动的语音交互

实时秒回，自由插话

山海语音交互与现实对话中人类的响应时间相似，用户几乎感知不到延迟，为用户提供了几乎无感知的流畅体验。此外，山海支持对话随时打断，用户可在对话中灵活插话，无需等待，交互过程自然不受阻碍。

感知情绪，表达情绪

在智能语音技术的加持下，山海不仅能通过语音文本判断用户情绪，更能细致捕捉用户语音的语气、节奏和音调等微妙变化，从而更准确地感知对方情绪状态，并像人类一样予以适当的情感反馈。无论是安慰、鼓励还是幽默，山海都能与用户形成情感共鸣，提供贴心的情感支持。

音色自由切换，打造专属声音

对话过程中，山海不仅可以模仿人类的自然语言特征，包括停顿、呼吸甚至笑声等副语言元素，提升对话交互的真实感和沉浸感，还能够根据用户的个性化需求，自由切换音色，增强对话的生动性和趣味性。

基于云知声声音克隆技术，山海能够全面学习用户的音色、风格，一句话复刻用户声音，音色高保真还原，语气、语调、情感也堪比真人，轻松打造用户专属声音。

看得见读得懂，更直觉的视觉交互

视觉场景理解，“看见”人类世界

通过摄像头，山海能够“看见”周围环境，实现所见即所得的精准识别——从场景理解分析到物体信息描述，山海都能精准“拿捏”。

对于目标物体上的文字，山海不仅限于基础的OCR文字识别，更能够结合图像和文字，提供易于理解的总结，表现出更接近人类的认知能力。例如，当演示者用手机对准一台投影仪时，山海可以准确描述出物体，并识别、总结出投影仪包装盒上的文字信息，提供全面而深入的分析。

图像创意生成，构筑个性艺术

在图像生成技术的加持下，山海能够根据用户指令快速创建视觉内容，并深入理解用户对背景的日常化要求，通过图像编辑和优化技术，提供符合个性化需求的定制画面，确保满足用户的创意和展示需求。

基于出色的多模态交互能力，山海多模态大模型能够根据不同的场景和需求，模拟出各种人物性格和对话风格。无论是温柔的助手、风趣的朋友，还是专业的顾问，山海都能游刃有余地切换身份，提供个性化且富有情感的交互体验。

此次推出多模态大模型，标志着山海正朝着更深层次的自然语言理解和多模态交互不断发展，也预示着云知声"Her时代"的到来。

2023年5月，云知声发布山海大模型，交出其在AGI领域的第一张答卷。自发布以来，山海大模型始终保持高速迭代，其在SuperCLUE中文大模型基准测评、MedBench中文医疗大模型评测、CCKS 2023医疗大模型评测等权威赛事上屡获佳绩，展现出全面的通用能力和卓越的专业能力，稳居全球大模型第一梯队。

云知声深知，山海的语言理解、知识储备和逻辑推理能力至关重要，但推动其迈进AGI的关键，在于其多模态交互能力的发展——这将让山海不仅局限于单向的信息处理，而是真正成为一个能够深入理解世界、与人类进行自然而富有洞察力的交流的智能伙伴。

正是基于这样的愿景，云知声在不断提升山海大模型自然语言处理能力的同时，也在积极发展多模态能力。在CVPR 2024开放环境情感行为分析竞赛中，云知声一举夺得了人脸情绪识别（Expression Recognition）、复合情绪识别（Compound Expression Recognition）、情绪模仿强度估计（Emotional Mimicry Intensity Estimation）三个赛道的季军，展现出卓越的情感分析能力。

未来，随着多模态的深入发展，山海不仅能说能听会看，还将拓展实时语言翻译、面部情绪分析等更深入的多模态能力，全方位满足人们工作、社交、娱乐等多样化需求，成为生活中不可或缺的一部分。关于山海更高更广的未来，我们一起屏息期待。

标签：

猜你喜欢

2024跨国公司绿色产业发展与合作论坛在海南博鳌举行

重塑硬折扣零售：奥特乐品牌与供应链同步升级

蛇口文体公园开园在即，奥运冠军助力掀起全民健身新风尚

方程豹汽车1周年行摄大赛正式启动

TCL中环发布半年度报告，报告期内营业收入162.13亿元，硅片综合市占率行业第一

打开京东搜“游戏机” 轻松入手流畅运行《黑神话：悟空》游戏机装备

升级装备畅玩《黑神话：悟空》来京东搜索“游戏本”享保姆级推荐

打开京东搜“游戏台式机”升级装备极致配置畅玩《黑神话：悟空》

重磅推出“合作共建”，阳光充电站加速全国业务布局！

玩《黑神话：悟空》设备卡顿京东教你怎么选装备流程简单服务贴心换新首选

倒计时3天数博会华为擎云开放技术能力

“NBA关怀行动 · 女生主场” 青少年女子篮球公益计划：为乡村女生创造篮球梦

Cleer特别赞助8月25日郎朗签售会！买Cleer耳机，享大师面签专属礼遇！

燕羽山下长城情民俗文化大集绽放延庆魅力

传递爱心能量，东鹏饮料支持韩红爱心·百人援吉义诊公益行动

第二届MARCHING健康科普创作者大会圆满收官

走心新品，闪耀微博｜2024微博针不戳品牌V力峰会

横琴大动作——亲子旅游圣地横琴梧桐树主题乐园盛大试营业

“2024怀柔长城马拉松暨第58届公园半程马拉松北京公开赛”新闻发布会召开

“大美宜宾和美五粮”2024年度五粮液杯摄影大赛优秀作品展播

世界因你变得更美好-第17期科威纳环境创新国际峰会

看好舍得酒业中长期成长性，多家机构给予买入或增持评级

再掀粉色风潮，星巴克引爆草莓音乐节

2024太湖购物节家装家电焕新季盛大开启百万家装消费券免费发放助力焕新

新华三谌平：以AI技术持续深化数字化变革

微博超级红人节：聚力热点营销、发力产品创新，打造高价值商业阵地

肌活，油皮护肤3.0时代的全链路解法

Cleer ARC 3惊艳亮相2024深圳购物季直播间，两大AI耳机新品即将震撼登场！

热点图片

要闻

“一泵能洗8件”，“越稠越好”的刻板印象终于被这未来洗衣科技打破
多少人这个夏天被洗衣服折磨疯了？如何处理被浓汗浸湿的速干衣是个难题，不强力洗怕难
“NBA关怀行动 · 女生主场” 青少年女子篮球公益计划：为乡村女生创造篮球梦
8月23日,在科尔沁右翼中旗美丽的朝胡尔图湖畔,一场别开生面的公益活动启动仪式宣告NBA
酒圈新地标崛起：中粮名庄荟工体直营店引领即时零售新风尚
近年来，随着即时零售的兴起，北京的酒类零售市场也迎来了新的变革。在这一变革中，中
2024微博超级红人节：加强顶部影响力博主建设，形成“大V营销”更明确认知
8月23日，2024年微博超级红人节在山东烟台开幕，在8月24日举行的V影响力峰会论坛上，
真实品牌战略斩获两项2024ADMEN国际大奖
2024年8月23日，2024ADMEN盛典&中国当代杰出广告人评选在北京圆满举办。ADMEN 国际大
爱奇艺《四方馆》8月23日上线，古装群像欢乐来袭
8月23日，由爱奇艺奇佳工作室打造的《四方馆》上线爱奇艺全网独播，接力《唐朝诡事录
"植"此青绿共筑绿林第二十七届富士胶片沙漠绿化行动再启程
近日，富士胶片第二十七届沙漠绿化行动再度启程，由富士胶片（中国）投资有限公司（以
英伦爱喏电解制水机：响应国家政策，助力健康生活
在国家大力倡导健康中国战略，推动大健康产业发展的背景下，英伦爱喏电解制水机应运而
翰宇药业2024上半年国际业务营收增涨236.35%
2024年8月23日晚间，深圳翰宇药业股份有限公司(股票代码：300199 SZ，下称翰宇药业或
高寒生态家族上新！完达山乳业黄金奶源助推产品提质升级
当乳制品市场持续扩容，面对庞大的市场需求和激烈的行业竞争，提升核心竞争力、实现高

迈向AGI关键一步，云知声推出山海多模态大模型

相关阅读

猜你喜欢

热点图片

要闻