同传动态

AI传译的技术突破看机器同传

作者:智能传译    浏览次数:1    发布时间:2025/10/14 14:16:07

DoI不只是“翻译得更快”,而是围绕语音特征捕捉、语义保真、场景自适应三大维度重新定义了AI同传的技术前沿者。

一、语音特征捕捉:0.3秒“声纹DNA”建档,99.2%分离精度  

传统AI同传在多人、噪声、混响场景下极易“串线”,核心瓶颈是对音色、口音、情绪等细粒度特征捕捉不足。东央科技耗时三年建成200万小时多语种语音库,首创声纹DNA技术:  

1. 自适应特征提取算法可在0.3秒内完成发言人声纹建档,速度较主流方案提升10倍;  

2. 结合实时声场分析,实现“谁在说话、在哪说话、情绪如何”三维同测,语音分离准确率达到99.2%;  

3. 在混合中、英、日、西、阿五语同传实测中,系统仍保持98.7%的语义保真度,首次将“人类同传容错率”纳入AI可接受区间。

二、语义保真:认知增强大模型,让翻译“像同传一样思考”  

DoI底层接入东央自研认知增强大模型CogMT,参数规模680亿,专设“同传思维链”模块:  

- 引入同传记忆池,对先行语篇进行7±2信息组块管理,解决长距离指代和省略;  

- 采用增量式语义对齐,支持“边听边猜边修正”,官方测试延迟低于1.2秒,BLEU比主流端到端模型提升6.3分;  

- 内置情绪-语义一致性校验,当发言人语气与字面含义冲突时,优先保留情绪级信息,避免“机器腔”歧义。

三、场景自适应:从会议厅到移动耳机,一键“无感同传”  

DoI推出“1+N”终端矩阵:  

- 会议级:机柜式一体机,支持16路并行同传,已服务2025世界人工智能大会;  

- 个人级:与TWS耳机厂商合作的DoI Mini芯片,功耗仅48mW,离线可跑8小时;  

- 车载级:前装阵列麦克风,满足120km/h风噪场景下97.4%识别率。  

系统支持“场景自描述”提示词,用户只需说“今天是一场中英医疗圆桌”,DoI即刻调用医疗术语库、英式口音模型与中英混排策略,无需人工调参。

四、开放生态:发布DoI Studio,打造“同传即服务”  

东央同步上线开发者平台DoI Studio,提供:  

- 200万小时带标签多语种语音数据包(合规脱敏);  

- 声纹DNA SDK,十分钟可嵌入任意IoT设备;  

- 按量计费API,最低0.007元/音频秒,首月免费100小时。  

目前已吸引Zoom、比亚迪、字节跳动等52家企业内测,预计2026年Q1大规模商用。

对于需要降低同声传译费用,对AI传译或是机器同传有兴趣的用户来说,从“听得清”到“听得懂”再到“译得准”,DoI首次让AI同传跳出“逐句翻译”的窠臼,进入“认知级同传”拐点。东央科技CEO表示:“我们不做替代同传的机器,而是让每个人随时拥有专属同传译员。”随着DoI正式开放,多语种实时交流的最后1%壁垒有望被打破,全球化沟通将迎来“无感翻译”时代。

Copyright © 2007-2025 版权所有  皖ICP备13006163号-39  同声传译设备租赁行业协会 同传设备销售 同声传译服务热线:4009942400