公司新闻

-新闻中心-公司新闻->

乐鱼官网-百度升级高说服力数字人 实现四大突破
发布日期:2025-07-13 13:18:54

科技日报记者 都芃

6月17日,于baiduAI Day开放日上,baidu官宣发布业界首个超等头部主播罗永浩数字人,并发布了高说服力数字人于体验、内容、视觉、效果的四年夜冲破。

baidu副总裁、电商总司理平晓黎暗示,本年4月baidu发布的高说服力数字人让数字人进入3.0时代。新一代高说服力数字人已经成为像真人同样,形神音容高度协调、会思索决议计划、能协作完成特定使命的超等智能体。baidu这次发布的罗永浩数字人已经到达媲美超等头部主播的体感效果。此前,罗永浩数字人直播首秀创下超1300万人次不雅看、GMV(商品生意业务总额)冲破5500万元的行业新纪录,部门焦点品类带货量反超真人直播。

baidu集团副总裁吴甜体系性地先容了多模协同数字人技能。该技能基在文心年夜模子4.5 Turbo实现了交融多模计划与深度思索的脚本天生,由脚本驱动数字人多模协同,实现动态决议计划的及时交互,使数字人的“神、形、音、容、话”到达高度同一。终极出现出一个具有高体现力、内容吸惹人、人-物-场可自由交互的超拟真数字人。

脚本天生技能包罗台词天生、多模驱动及动态交互三部门。以罗永浩数字人脚本为例,基在文心年夜模子4.5 Turbo天生的脚本,充实揭示了主播的小我私家特点,具有典型的“罗氏诙谐”气势派头,并可以或许实现双人主播的内容协同,实现富厚的动态及时互动。经由过程文本自控的语音合成年夜模子,数字人可以实现高回复复兴的语音合成能力,再联合直播台词和发音特性,合成气势派头得当、天然流利的声音。

为解决罗永浩数字人直播双人声音共同难点,baidu采用对于话上下文编码器,将对于话汗青及当前对于话举行语音合成的同一推理计较,终极实现流利天然的双人对于话效果。于数字人形象天生以和驱动方面,经由过程联合多模态视频理解、跨模态旌旗灯号天生、视频天生等技能,数字人降服了高可控交互,高精度、永劫间一致性连结等难点,实现了高一致性超拟真长视频天生。

吴甜暗示,baidu于本年4月发布了最新的年夜模子文心4.5 Turbo及文心X1 Turbo,罗永浩数字人是基在文心年夜模子的最好实践。baidu于年夜模子技能的连续摸索及立异,将为用户带来更优质的体验、为行业带来更具立异力的营业模式。

此外,baidu电商还有推出两年夜规划。梦蝶规划将经由过程流量搀扶,超头主播数字人打造、预算搀扶,实现baidu优选超头主播的数目倍增;繁星规划则将再次追加10万个慧播星数字人,投入1亿元数字人消费补助、万万级另外运营搀扶,帮忙更多的平凡人、中小企业开启数字人直播。

(baidu供图)

-乐鱼官网