Системы машинного перевода

Машинный перевод  связан с исследованиями и разработками программного обеспечения, предназначенного для перевода текста или речи с одного естественного языка на другой. На элементарном уровне машинный перевод просто выполняет замену слов одного естественного языка на другой. В предоставленной работе рассматриваются методы машинного перевода: на основе словаря, на основе примеров, статистический машинный перевод, машинный перевод на основе промежуточного языка. Также приведены примеры известных р...
Раздел Физкультура
Класс -
Тип Другие методич. материалы
Автор
Дата
Формат docx
Изображения Нет
For-Teacher.ru - все для учителя
Поделитесь с коллегами:

СИСТЕМЫ МАШИННОГО ПЕРЕВОДА

Машинный перевод (МП) является разделом компьютерной лингвистики, который связан с исследованиями и разработками программного обеспечения, предназначенного для перевода текста или речи с одного естественного языка на другой. На элементарном уровне МП просто выполняет замену слов одного естественного языка на другой.

Современное программное обеспечение МП часто учитывает специфику требований заказчика, определяемых отраслью или профессией (например, сообщение о погоде), при этом повышается качество выводимого результата, поскольку ограничиваются контексты допустимых замен.

Эта методика особенно эффективна в областях, где используются формальный или шаблонный язык. Поэтому машинный перевод правительственных и юридических документов производит более готовый для использования выходной текст, чем это бывает в случае разговорной речи или менее стандартизированного текста.

Улучшение качества перевода может также быть достигнуто человеческим вмешательством - некоторые системы в состоянии осуществлять довольно точный перевод, например, если пользователь однозначно идентифицировал, какие слова в тексте являются именами собственными. С помощью этих методик МП оказывается полезным как вспомогательный инструмент для людей-переводчиков, а в некоторых случаях может даже выдать перевод, который может использовать без редактирования. Однако в целом современные системы все же не способны осуществлять вывод того же самого качества как человек-переводчик, особенно если переводимый текст относится к нестандартным языковым доменам.

Машинный перевод на основе словаря. Машинный перевод может использовать метод, основанный на словарных статьях - текст будет переведен «слово за словом», обычно без учета и воспроизведения коррекций их значений.

Статистический машинный перевод. Статистический метод состоит в использовании двуязычных текстовых массивов. Там, где такие массивы доступны, могут быть получены превосходные результаты при переводе сходных текстов, но это достаточно редкие случаи.

Машинный перевод на основе примеров. Этот подход характеризуется использованием во время выполнения двуязычных массивов текстов как основной базы знаний. Это перевод по аналогии, который может рассматриваться как разновидность выполнения логических выводов на основе анализа ситуаций.

Машинный перевод на основе промежуточного языка. В этом подходе текст на исходном языке преобразуется в межъязычное представление, на основе которого после этого создается выходной текст.

Действующие системы машинного перевода ориентированы на конкретные пары языков (например, французский и русский или японский и английский) и используют, как правило, переводные соответствия либо на поверхностном уровне, либо на некотором промежуточном уровне между входным и выходным языком. Качество машинного перевода зависит от объема словаря, объема информации, приписываемой лексическим единицам, от тщательности составления и проверки работы алгоритмов анализа и синтеза, от эффективности программного обеспечения. Информация может быть представлена как в декларативной описательной), так и в процедурной (учитывающей потребности алгоритма) форме.

Скорость перевода страницы текста у разных систем составляет от 0,5 до 2 сек. в автоматическом режиме. Полученный в результате текст в большинстве случаев понятен сразу. Поэтому, потратив какие-то минуты на осознание информации, пользователь может сразу сохранить документ для более тщательного изучения.

Одним из известных систем является переводчик «Сократ». Данная система поставляется в комплекте с общелексическим, коммерческим и компьютерными словарями. Данная база составляет 95% требуемого словарного запаса для текстов, которые существуют в электронном виде. Отдельно существует расширяемое множество дополнительных подключаемых к системе «Сократ» словарей специализированного назначения. Среди которых словари по медицине, машиностроению, юриспруденции и др. Перевод является двусторонним, т.е. можно переводить как с иностранного языка на русский, так и наоборот.

Системы перевода PROMT известны пользователям Windows. PROMT также комплектуется общелексическим и компьютерным словарями. Однако основной особенностью данной программы является наличие гораздо большего количества подключаемых словарей. Их число составляет на данный момент несколько десятков. Существуют ряд коллекций или подборок словарей, в том числе - наука, коммерция, техника и промышленность. Каждая из коллекций содержит от 5 до 10 словарей определенной направленности.

Среди систем электронного перевода программы-переводчика PROMT получили наибольшее распространение. Они предоставляют широкие возможности по настройке на перевод текстов, подключению специализированных словарей, созданию пользовательских словарей. Текст для перевода может вводиться не только с клавиатуры, но и со сканера, а также возможен перевод текстов непосредственно в текстовых редакторах.

При работе со сканером и наличии установленной на компьютере какой-либо системы оптического распознавания текстов (FineReader, Cunieform или AutoR) можно запустить OCR-программу непосредственно из системы PROMT. Система OCR прочтет напечатанные на бумаге текст при помощи сканера и передаст его в систему PROMT для перевода и редактирования.

В программе предусмотрены словари нескольких типов. Генеральные словари содержат свыше 150 000 общеупотребляемых слов и выражений и закрыты для пользователя. Специализированные словари предназначены для перевода текста по определенной тематике, а пользовательские словари создаются самими пользователями исходя из их опыта перевода. Возможно открытие сразу нескольких словарей.

© 2010-2022