Кыргызстандык сүйлөө синтезинин Kani TTS 2 модели Hugging Face платформасында жогорку орунда болду

Евгения Комарова Жергиликтүү жаңылыктар / Өзгөчө
VK X OK WhatsApp Telegram

Кыргызстандык NineNineSix стартап командасы эл аралык технологиялык аренада өз жетишкендиктерин кайрадан көрсөттү, бул тууралуу Кыргызстандын Жогорку технологиялар паркы (ЖТП) маалымдады.

Жакында стартап өзүнүн сүйлөм синтездөө моделинин жаңыртылган версиясы — Kani TTS 2 ни сунуштады, ал Hugging Face платформасында TTS моделдеринин арасында биринчи орундардын бирин ээлеп үлгүрдү, бул дүйнөдөгү эң ири жасалма интеллект платформасы.

Kani TTS 2 мурдагы версиясына салыштырмалуу олуттуу кадам болуп саналат, ал бир өтүүдө 40 секундго чейин сүйлөм өндүрүүгө мүмкүнчүлүк берет, бул биринчи моделдин мүмкүнчүлүктөрүн эки эсе ашат.

ЖТПнын өкүлдөрүнүн айтымында, Кыргызстандагы ачык модель үчүн Hugging Face платформасында TTS рейтингинде мындай жетишкендик сейрек жана маанилүү окуя.

NineNineSix командасы жөнүндө

NineNineSix — бул жасалма интеллект жана тил чечимдери боюнча технологияларга адистешкен кыргызстандык иштеп чыгуучулар тобу.

Мурда команда Kani TTS моделинин биринчи версиясын иштеп чыккан, ошондой эле кыргыз тилинде сүйлөгөн биринчи жасалма интеллект болгон AI-ассистент AkylAi жана үн колонкасын түзгөн.

Аз камсыз болгон тилдер үчүн үндөр

Жасалма интеллект тармагындагы ири компаниялардын көпчүлүгү англис жана башка кеңири колдонулган тилдерге багытталган, аз камсыз болгон тилдерди көңүлдөн четтетип жатат. Бирок NineNineSix башка жолду тандады.

Kani TTS 2 кыргыз, англис жана испан тилдерин колдойт, ал эми моделдин архитектурасы башка тилдер, акценттер жана диалекттер үчүн аны үйрөтүүгө мүмкүндүк берет.

Проекттин негизги өзгөчөлүктөрүнүн бири — команда алдын ала үйрөтүү үчүн толук код менен бөлүштү, бул башка өлкөлөргө же изилдөө топторуна Kani TTS 2 негизинде өз үн моделдерин түзүүгө мүмкүнчүлүк берет.

nineninesix.aiнын тең негиздөөчүсү Нурсултан Бакашов: «Kani TTS 2 — бул биздин биринчи версиябыздан кийинки этап: биз сүйлөм өндүрүүнү туруктуу кылдык жана моделди узун фрагменттерди иштетүүгө үйрөттүк. Биздин максат — ар кандай тилдерге жана акценттерге, анын ичинде аз камсыз болгон тилдерге ылайыкташтырылган компакттуу жана ачык моделдерди түзүү. Биз дүйнөлүк деңгээлдеги технологиялар Кыргызстанда өнүгө аларын көрсөтүүнү каалайбыз, ошондуктан моделдин салмактарын жана алдын ала үйрөтүү үчүн бардык кодду ачык кылдык, ар бир команда өз тили үчүн TTS моделин нөлдөн үйрөтө алсын деп.»

Kani TTS 2 төмөнкү жакшыртууларды камтыйт:

* Бир өтүүдө 40 секундга чейин сүйлөм өндүрүү;

* Кыска аудиофрагменттин негизинде үн клонирлөөгө мүмкүнчүлүк берген нөлдөн клонирлөө колдоосу;

* Толук ачык архитектура жана үйрөтүү коду;

* Hugging Face платформасында TTS моделдеринин үчтүгүнө кирүү.

ЖТПда Kani TTS 2 моделинин болжол менен 400 миллион параметри бар экендигин, ал 10 000 сааттан ашык сүйлөм маалыматтары боюнча алдын ала үйрөтүлгөндүгүн жана 3 ГБ видео эс тутуму бар GPUда иштей ала тургандыгын белгилешти, бул аны локалдык жана сервердик колдонуу үчүн жеткиликтүү кылат.

ЖТПда Kani TTS 2 — бул дагы бир AI модели эмес экендигин баса белгилешти. Бул кыргызстандык адистердин дүйнөлүк деңгээлдеги технологияларды иштеп чыгууга жана жасалма интеллект глобалдык рыногунда атаандашууга жөндөмдүү экендигинин далили. NineNineSix Кыргызстанда гана эмес, ошондой эле алдыңкы AI чечимдерин түзө алаарын көрсөтүүдө.
VK X OK WhatsApp Telegram

Дагы окуңуз: