音视频算法引擎

我们提供先进的AI语音识别引擎,支持实时语音转写和关键词设置,无需依赖云端支持。我们的SDK易于集成,使语音处理变得简单。


音视频算法SDK

我们的算法SDK包括啸叫抑制、回音消除、音频降噪、音量增益等多种音频算法模块,以及各类音视频编解码算法。这些模块可帮助您轻松优化音视频处理流程,提升产品质量。

回声消除算法

●8K、16K、32K、48K采样率

● 10ms~500ms回声延迟范围

● DTD双端同讲检测,快速收敛

音频降噪算法

● 支持8K、16K、32K、48K采样率

● 基于谱减法对噪声估计

● 支持瞬时噪声降噪

音频自动增益

● 支持8K、16K、32K、48K采样率

● 支持指定放大倍数、或缩减倍数

● 采用渐变平滑算法、自适应变化



啸叫抑制算法

● 采用事前预防、事后消除相结合算法

● 实时检测及时调整,避免啸叫发生

● 采用限波法等技术清除掉啸叫频点

智能混音算法

● 支持不同采样率同时进行混音

● 实时进行VAD、降噪处理

● 智能混音、去除叠加背景噪声

智能语音识别

● 支持8K、16K、32K、48K采样率

● 支持语音文件转写、AI声纹检测

● 支持实时语音识别,关键字设置

技术优势

20年以上音视频技术沉淀,行业经验丰富,对音视频算法处理有很深的理解和研究,擅长音视频通话系统、视频会议系统、AI音频算法分析等软件产品的研发和优化。专注于为用户提供简单高效的通信产品和模块化基础算法引擎,快速搭建符合行业用户需求的整体解决方案,让用户享受到简洁化、便捷化和高开放性、强兼容性的高科技服务。

语音识别、音转文准确率 100%
降噪、啸叫抑制、增益处理 99.8%
多路合成混音 99.5%

产 品 介 绍

基于核心音视频技术,封装便捷API通信接口,提供一系列通讯和媒体处理服务平台。包括:语音识别系统、MCU服务、SIP服务、GB28181网关、电台对讲网关和音视频录播网关。这些服务提供了各种功能和特点,如语音识别、多路混音、视频混屏、SIP协议支持、百万级并发处理能力、摄像头管理、无线对讲、音视频录制和文件转码等。每个服务都支持软件化部署和简单的API接口,适用于不同的通讯和媒体处理需求。

about img

语音识别系统

我们提供一体化语音识别系统,支持中英文识别,提供简单API接口,无需云端支持,支持SDK集成。系统支持关键字和违禁词检测,并可私有化部署。

● 支持中英文识别

● 提供简单API接口

● 无需云端支持,sdk集成

● 支持关键字、违禁词

● 私有化部署

about img

MCU服务

我们提供先进的MCU服务,支持软件化独立部署和简单API接口。系统可支持高达512路混音和16路1080p视频混屏,同时支持级联扩容。

● 支持软件化独立部署

● 提供简单API接口

● 支持512路混音

● 16路1080p视频混屏

● 支持级联扩容

about img

SIP服务

我们提供高效的SIP服务,支持标准SIP协议和百万级并发处理能力。系统支持软件化独立部署,并提供基础云通讯服务。与主流交换平台完美兼容,确保无缝集成和稳定运行。

● 支持标准SIP协议

● 百万级并发处理

● 支持软件化独立部署

● 支持基础云通讯服务

● 与主流交换平台完美兼容

about img

GB28181网关

我们提供支持GB28181和SIP协议转换的服务,实现摄像头号码化和统一管理,支持摄像头视频调阅和双向语音功能。系统具备强大的接入能力,兼容多品牌设备,确保高效稳定的运行

● 支持GB28181和SIP协议转换

● 摄像头号码化,统一管理

● 支持摄像头视频调阅

● 支持双向语音功能

● 强大的接入能力,兼容多品牌

about img

电台对讲网关

我们提供功能强大的电台对讲网关服务,支持标准SIP协议和集群无线对讲功能。系统能够进行语音编码转码,支持软件部署,并可根据需求进行私有协议定制,满足多样化的通讯需求。

● 支持标准SIP协议

● 集群无线对讲

● 语音编码转码

● 支持软件部署

● 私有协议定制

about img

音视频录播网关

我们提供专业的音视频录播网关服务,通过简单的API接口实现通话RTP媒体流的实时录制,并生成多种文件格式如wav、MP4。支持标准播放器进行回放,同时能够进行录制文件的语音转写,帮助用户高效管理和利用音视频资源。

● 提供简单API接口

● 通话RTP媒体流实时录制

● 生成wav、MP4等文件格式

● 支持标准播放器回放

● 录制文件语音转写