
AI 음성인식 (STT)
소리를 데이터로 바꾸는 가장 정확한 기술
솔루션 소개
플러스랩스의 STT(Speech-to-Text) 엔진은 한국어의 특성과 회의 환경의 특수성을 깊이 이해하고 있습니다. 사투리와 전문 용어는 물론, 회의장의 소음 환경에서도 발언자의 목소리를 정확하게 분리하여 텍스트로 변환합니다. 온프레미스(On-premise) 구축을 통해 내부 데이터를 외부 노출 없이 안전하게 처리할 수 있습니다.
주요 기능
- 국내 최고 수준의 한국어 인식률 (98% 이상)
- 전문 도메인(법률, 의회, 의료 등) 특화 언어 모델 적용
- 다화자 분리(Diarization) 및 잡음 제거(Noise Reduction)
- 실시간 스트리밍 인식 및 배치(Batch) 파일 처리 지원
핵심 기술 스택
Language Model
Domain-specific Ko-BERT, ELECTRA
STT Engine
Wav2Vec 2.0, Whisper (Fine-tuned)
Deployment
On-Premise, Private Cloud (VPC)