东央云系统核心技术说明会
作者: 浏览次数:1 发布时间:2025/3/27 17:05:071. 视频会议直播技术
(1)分布式网络架构与全球节点部署
东央云采用网络同传分布式接入方案,通过全球30+节点部署(含亚马逊AWS、阿里云等)实现就近接入,结合5G网络优化传输路径,将视频流延迟控制在500ms以内。东央云架构支持多终端多系统(Windows、Android、鸿蒙、iOS)无缝接入,并兼容视频会议平板显示屏、VR设备、无人机等特殊场景的实时视频回传。
(2)自适应弱网传输算法
当线上与会者在极端网络环境(如高铁、隧道)下,DoiYun系统通过AI驱动的动态码率调节技术与抗丢包补偿算法,可在丢包率达到30%时仍保持画面流畅性。核心技术包括:
SCC内容编码技术:针对文档共享场景优化文字清晰度,带宽占用降低40%;
窄带高清技术:通过深度学习压缩冗余像素,实现低带宽下的1080P高清画质;
(3)智能场景化服务 东央云支持自定义布局编辑器,用户可根据会议类型(如培训、发布会)灵活配置界面元素;同时提供AI美颜降噪、发言人自动跟踪等功能,适配医疗会诊、跨国路演等专业场景。
2. AI传译技术
(1)多语种混合识别与高精度互译
2025年3月正式发布的DoiYun 3.0版本,搭载的AI传译引擎支持中、英、日、韩等12种语言实时互译,中英互译准确率达98.1%(BLEU值≥0.43),并具备以下技术突破:
混合语种识别:可自动识别同一句话中的中英文混杂内容(如技术术语);
声纹角色分离:区分不同发言者并标记翻译文本,提升会议记录可读性。
(2)远程同传与低延迟优化 通过端到端语音处理链(采集→降噪→转写→翻译→合成),系统将同传延迟压缩至3-4秒,支持译员远程接入“虚拟同传间”。核心技术包括:
回声消除算法:基于数万小时会议数据训练的深度学习模型,兼容不同设备麦克风特性;
禁忌词智能屏蔽:自动过滤敏感内容,满足金融、政务等合规需求
(3)语义分析与会议辅助 系统可生成智能会议摘要,自动提取决议事项与待办任务;同时支持音字对照回听、关键词标记等功能,方便会后复盘。