Как искусственный интеллект помогает развиваться тюркским языкам

15 ноября 2024 11:20

Автор фото: Фарит Муратов

В Казани состоялась ХII Международная конференция по компьютерной обработке тюркских языков TurkLang 2024.

Она была приурочена к Году научно-технологического развития в Татарстане. Главные организаторы - Институт прикладной семиотики Академии наук РТ, которому, кстати, в этом году исполняется 15 лет, и Российская ассоциация искусственного интеллекта. Среди участников были представители Стамбульского технического университета.

Целью мероприятия, проходившего 7 - 9 ноября, стало создание пространства компьютерных лингвистических исследований для тюркских языков. Проще говоря, собравшиеся обсуждали, как ИТ-разработчики могут помочь тому или иному языку либо развиваться, либо сохраниться. К примеру, современные цифровые переводчики имеют в своей основе искусственный интеллект. С другой стороны, тот же ИИ нуждается в постоянном пополнении «скармливаемого» ему контента, чтобы успешно развиваться. То есть две стороны - айтишники и лингвисты - могут помочь друг другу.

В работе конференции в Казани приняли участие более 150 ведущих ученых и разработчиков из регионов России, стран ближнего и дальнего зарубежья. В рамках конференции кроме пленарного заседания прошли различные секционные заседания, круглые столы. Также в холле была организована выставка программных разработок в рассматриваемой области.

На конференции были представлены результаты исследований по 16 тюркским языкам, заслушаны 82 доклада.

Состоялся круглый стол на тему «Искусственный интеллект: состояние и перспективы» с участием президента РАИИ Вадима Борисова и ведущих ученых в этой области. Одной из важных тем, вызвавших большой интерес на круглом столе, стал вопрос про создание объяснительного ИИ, а также исследование потенциала татарского языка для развития ИИ и создания интеллектуальных систем нового поколения.

Директор по GR (проще - директор по взаимодействию с органами государственной власти) компании «Яндекс» Александр Болховитянов рассказал корреспонденту «КВ», как может пригодиться современный ИТ-продукт, скажем, пожилому человеку, живущему в сельской местности. По словам эксперта, в глубинке часто живут бабушки, дедушки, которые общаются только на своем родном языке. Когда к ним приезжают внуки или дети, не вполне владеющие этим языком, новые технологии позволяют им полноценно общаться. Кстати, татарский язык сейчас полностью доступен в мобильном переводчике, а также для него уже разработаны технологии синтеза и распознавания речи.

«У нас есть список из порядка 20+ языков, для которых нам Федеральное агентство по делам национальностей помогает через регионы собирать языковые корпуса. Они в свою очередь ложатся в основу технологии распознавания языка. Наша задача - сделать их более живыми и доступными через добавление в контент ИИ памятников национальной литературы», - пояснил Болховитянов.

Научный сотрудник Института прикладной семиотики АН РТ Николай Прокопьев сообщил, что в данный момент находится в разработке лингвистический граф TurkLand, созданный на основе открытой для использования программы Google Bert. Благодаря использованию графового метода различные модули ИИ не просто механически усваивают новую информацию, но и становятся способными как бы «понимать» смысл прочитанного, различают какие-то культурологические нюансы. Это значительно улучшает возможности и адекватность перевода.

Президент Российской ассоциации искусственного интеллекта Вадим Борисов специально для «КВ» попытался пояснить, как технологии ИИ могут повлиять на нашу жизнь.

«Благодаря тому, что сейчас созданы так называемые инструментальные среды, можно в достаточной степени понять, пойдет конкретная научная идея или нет. Раньше это все творилось в головах ученых, то есть необходимо было быть почти энциклопедистом, и на это требовались годы. Современный ИИ построил некий аналог Вавилонской башни, где все причастные к миру науки могут говорить на одном понятном всем языке. Возросли возможности тиражирования научных исследований как в научную, так и в бытовую среду. Я не говорю, хорошо это или плохо, потому что в какой-то мере это отрицательно влияет на самого человека», - отметил спикер.

«Что касается бытового применения, то конгломерат информационных, цифровых и интеллектуальных технологий, конечно, рано или поздно приведет к качественно другому уровню решения всех повседневных задач. Произойдет некий качественный скачок. К примеру, современные цифровые помощники человека станут обладать такими функциями, которые сегодня и представить трудно. И тогда рутинные задачи мы можем оставить машинному обучению, моделям искусственного интеллекта. А за собой оставить только творчество. Мы становимся интегрированы в некое поле, о котором еще академик Вернадский говорил как о ноосфере. А сейчас это происходит с так называемой информационной или даже информационно-телекоммуникационной системой», - добавил Борисов.