Смотрите в будущее

Источник: Секретарское дело

Светлана Соколова, генеральный директор компании PROMT

Материал подготовила Анастасия Гуцалова

овые технологии постоянно включаются в жизнь российского бизнеса. Они могут выражаться во всяких разновидностях, это могут быть информационные технологии, банковские технологии, технологии связи, какие­то частные примеры патентных изобретений и так далее. Сегодня же мы будем вести речь несколько об иной области бизнеса. О технологиях машинного перевода с иностранных языков. С одной стороны, может показаться, что ничего нового здесь вроде бы и нет. Да, действительно, программы по переводу существуют уже достаточно давно. Но могут ли они сейчас помочь нам обеспечить стопроцентный уровень понимания иностранного текста и речи? Что, по сути дела, изменилось за годы развития технологий перевода?

Дело­то все в том, что в случае, если какая­либо компания – разработчик этих технологий вдруг изобретет какой­либо инновационный алгоритм, позволяющий достичь полного уровня взаимопонимания между носителями разных языков, что произойдет? Правильно, произойдет революционный скачок вперед в межнациональном общении! Языковые границы попросту сотрутся. Мир станет мегаглобальным. Поэтому где же, если не в области бизнеса, связанного с развитием технологий перевода, ждать появления инноваций?

Для того чтобы изучить инновационные перспективы развития технологий перевода, мы обратились за помощью к эксперту в области данного вида бизнеса, генеральному директору компании PROMT Светлане Соколовой.

 Светлана, в чем состоят специфические особенности технологии автоматического перевода текста ПО компании PROMT, за счет чего достигается высокий уровень качества машинного перевода?

— Системы PROMT относятся к типу переводчиков, основанных на правилах. Это значит, что они анализируют структуру и лексический состав исходного предложения, а затем воссоздают их на языке перевода. Благодаря этому, в отличие от систем других типов, весь текст обязательно будет переведен. Выбрать правильные варианты, например, для многозначных слов помогают настройки: фиксация тематики переводимого текста или расстановка приоритетов с помощью словарей.

Не считая восточнославянских языков, между какими языками и почему достигается наиболее высокий уровень качества автоматического перевода? Чем это может быть обусловлено?

— Действительно, уровень перевода, как правило, будет более высоким при переводе с одного родственного языка на другой. И это относится не только к славянским, но и, например, к романским языкам, скажем, к переводам между испанским и итальянским. Главным образом это объясняется сходством структуры этих языков.

Но имеет значение не только формальная принадлежность к одной языковой группе. Например, достаточно хорошо реализуются переводы с английского на французский и наоборот, несмотря на то что это языки разных групп. Дело в том, что у этих языков сходные правила построения предложений.

В чем заключаются основные сложности, с которыми сталкиваются специалисты компании PROMT в процессе разработки и совершенствования ПО, какие задачи стоят перед компанией в ближайшем будущем?

— Язык – огромный, сложный, постоянно изменяющийся живой организм, и составлять его формальное описание можно бесконечно. В то же время у разных языков не совпадают ни лексическая, ни синтаксическая структура. Все возможные связи, возникающие в живой речи, запрограммировать невозможно. Поэтому, после первых крупных мазков в создании системы перевода, основанной на правилах, процесс развития начинает замедляться – требуется анализ все большего объема материала для формулировки все более тонких и частных алгоритмов.

Наши пользователи ждут от нас постоянного повышения качества перевода, но для этого нам приходится прикладывать все большие усилия. Тем не менее такая работа ведется непрерывно. Одно из ее направлений – выявление новых слов и значений, которые появляются в языке.

Мы стремимся к тому, чтобы эта информация как можно скорее попадала к пользователям, поэтому в новой линейке PROMT появились онлайн­обновления словарей. Теперь все новые слова и выражения, зафиксированные нашими лингвистами, оперативно загружаются на компьютеры пользователей.

Другое важное направление работы – создание системы перевода, которая будет использовать сильные стороны двух основных методов перевода: основанного на правилах и статистического. С помощью правил программа анализирует структуру исходного текста и создает ее аналог на языке перевода, а затем на основе статистических данных из нескольких вариантов перевода выбирается наиболее подходящий для конкретного контекста.

Полный текст читайте в печатной версии журнала Секретарское дело