Проекты ИИ с акцентом на казахский язык представили в Астане
Переводчик и альтернатива ChatGPT.
На выставке стартапов, прошедшей в рамках международного форума Digital Bridge 2025 в Астане, были показаны десятки проектов с использованием технологий искусственного интеллекта. Компании, исследовательские центры и молодые команды представили свои решения в самых разных сферах - от образования и медицины до кибербезопасности и робототехники.
Среди множества стендов особое внимание журналиста BAQ.KZ привлекла платформа, разработанная Институтом умных систем и искусственного интеллекта (ISSAI) при Назарбаев Университете. Проект выделялся тем, что в отличие от многих других решений, ориентированных в первую очередь на универсальные задачи, он сосредоточен на казахском языке и культурном контексте.
Разработчики ISSAI представили модель Oylan, которая распознаёт изображения и описывает их в привычных для казахстанцев терминах.
"Если загрузить картинку с людьми на лошадях, ChatGPT или другая зарубежная система скажет, что это просто группа всадников. Наша же модель определяет, что перед ней - кокпар, национальная игра у казахов", — объяснил исполнительный директор института Ербол Абсалямов.
Помимо этого, посетителям выставки показали переводчик Mangisoz. Он поддерживает казахский, русский, английский и китайский языки и отличается тем, что активно вовлекает пользователей в процесс улучшения модели.
"Если предложенный перевод не понравился, можно загрузить свой вариант. После проверки мы включаем его в базу и перетренировываем модель. Таким образом качество перевода постепенно растёт", — отметил Абсалямов.
По его словам, главная трудность разработки подобных решений связана не с самим процессом обучения модели, а со сбором и обработкой данных.
"На казахском языке в интернете контента гораздо меньше, чем на русском или английском. Поэтому приходится искать доступные материалы, переводить качественные тексты с других языков и создавать так называемые синтетические данные. В случае Mangisoz почти полтора года ушло на подготовку корпуса текстов, и только потом мы смогли запустить обучение, которое заняло 3–4 месяца", — рассказал он.
Сегодня все модели ISSAI доступны на сайте Назарбаев Университета, где каждый желащий может протестировать представленные инструменты и оценить их работу. По словам Ербола Абсалямова, такие проекты станут важным вкладом в цифровое развитие страны, поскольку помогают не только внедрять искусственный интеллект, но и формировать полноценную языковую среду для казахского языка в новых технологиях.