Кыргызский стартап представил AI-модель синтеза речи на выставке CES 2026

Виктор Сизов Экономика
VK X OK WhatsApp Telegram


На выставке NineNineSix продемонстрировал модель синтеза речи под названием KaniTTS. Разработчики утверждают, что их технология позволяет генерировать речь в реальном времени с производительностью в три раза выше и стоимостью до десяти раз ниже, чем у аналогичных решений от таких мировых гигантов, как ElevenLabs, OpenAI и Google. Модель доступна по лицензии Apache 2.0, что делает её бесплатной для использования.

KaniTTS обладает впечатляющими техническими характеристиками: она может создать 15 секунд речи всего за одну секунду на стандартной видеокарте NVIDIA RTX 5080, что упрощает внедрение технологии без необходимости использования дорогих облачных решений. На платформе Hugging Face модель была загружена более 15 тысяч раз, и на данный момент она поддерживает восемь языков, включая кыргызский, английский, немецкий и китайский.

Кроме того, стартап представил модель автоматического распознавания речи Kyrgyz Whisper, которая была дообучена на основе данных от OpenAI. Использование 2 тысяч часов записей кыргызской речи позволило существенно снизить уровень ошибки распознавания с почти 100% до 0.2%, что решает проблему недостаточной поддержки редких языков на мировом рынке.

Участие в CES было организовано Парком высоких технологий КР. По информации ПВТ, IT-сектор Кыргызстана демонстрирует стабильный рост: за последние пять лет объем экспорта услуг увеличился в 45 раз. В 2024 году специалисты из Кыргызстана заработали на международных рынках $130 миллионов, из которых 40% (более $50 миллионов) пришлись на США.
VK X OK WhatsApp Telegram

Читайте также:

Написать номментарий: