Машинный перевод

все началось с письма Уоррена Уивера, директора отделения естественных наук

Рокфеллеровского фонда, к Норберту Винеру в марте того же года, в котором

задача перевода сравнивалась с задачей дешифровки текстов. Последняя в то

время уже стала выполняться на электромеханических устройствах. За этим

письмом последовало множество дискуссий, появился меморандум о целях, и

наконец, были выделены средства на исследования. И в 1952 г. состоялась

первая конференция, организованная знаменитым математиком Бар-Хиллелем, на

которой исследователи обменялись мыслями относительно организации множества

синтаксических правил языка, способов описания семантики, морфологических

структур, структуры словарей для систем перевода. Достижения в

академических исследованиях стимулировали коммерческий интерес к проблеме

МП, и фирма IBM совместно с Джорджтаунским университетом в США в 1954 г.

сумела показать первую систему, базирующуюся на словаре из 250 слов и 6

синтаксических правил и обеспечивающую перевод 49 заранее отобранных

предложений. Этот эксперимент положил начало исследовательскому буму: в

следующие 10 лет правительство и военные ведомства США затратили на

исследования в области МП около 40 млн. долларов.

От эйфории, связанной с первыми результатами, до практически полного

отрицания осуществимости МП прошло всего восемь лет. К подобному выводу

пришли на основании обзора, выполненного специальным комитетом по

прикладной лингвистике (ALPAC) Национальной Академии наук США. В нем

констатировалось, что системы автоматического перевода не смогут обеспечить

приемлемое качество в обозримом будущем. Этот отчет драматически повлиял на

развитие МП, так как были практически прекращены какие бы то ни было

исследования из-за отсутствия финансирования, по крайней мере, в США и

Европе. И лишь в конце 70-х годов занятия МП возобновились вместе с

возрастанием интереса со стороны проектировщиков и исследователей к

лингвистическим проблемам искусственного интеллекта и компьютерного поиска

информации.

И только с начала 80-х годов, когда ПК уверенно и мощно начали

завоевывать мир, время их работы, естественно, подешевело и доступ к ним

можно было получить в любую минуту. А значит, МП наконец-то стал

экономически выгодным. К тому же в эти и последующие годы совершенствование

программ позволило достаточно точно переводить многие виды текстов, однако

некоторые проблемы МП остались нерешенными и по сей день.

90-е годы можно считать подлинной эпохой возрождения в развитии МП, что

связано не только с высоким уровнем возможностей персональных компьютеров,

появлением сканеров[4] и программ OCR[5], но и с распространением

Интернет/интранет (Internet/intranet), обусловивших реальный спрос на МП.

Он вновь стал привлекательной областью вложения капиталов как для частных

инвесторов, так и для государственных структур.

И хотя технологии МП по-прежнему страдают множеством недостатков, многие

организации вновь стали серьезно относиться к обещанию Бэббиджа. “Машинный

перевод все еще далек от совершенства, но любой желающий с его помощью

сможет, по крайней мере, понять основной смысл документа”, — считает Луи

Монье, технологический директор Alta Vista, крупного поискового Web-узла,

который начал эксперимент с МП в онлайновом режиме[6].

Страны Европейского Союза потратили за последние 15 лет более 70 млн.

долл. на исследования по этой проблеме, а японские государственные

организации — более 200 млн. долл. По словам T.Р.Педтке (представителя

правительства США), сделавшего очень интересный доклад на MT SUMMIT VI о

стратегической важности МП для его страны, одну из главных ролей в развитии

этого направления продолжает играть правительство. Проблема МП

рассматривается как ключевая в вопросах продвижении высоких технологий и

обеспечении конкурентоспособности США в глобальном информационном

пространстве.

2. ЭЛЕКТРОННЫЕ СЛОВАРИ

Электронные словари (ЭС) начали разрабатываться значительно раньше, чем

альтернативные им системы МП, поэтому в настоящее время на рынке

программного обеспечения имеется черезвычайно широкий выбор словарей — от

самых простейших (например, DIC) до мощных систем, объединяющих в одной

программной оболочке несколько лексических баз данных — специализированных

тематических словарей, последовательность подключения которых определяется

пользователем (LINGVO). Выбор того или иного программного продукта зависит

исключительно oт аппаратных возможностей компьютера, которым располагает

пользователь, финансовых соображений и конкретных условий, в которых

работает переводчик.

Потенциальную аудиторию этих программ можно определить совершенно точно –

это учащиеся и студенты, использующие словарь как одно из пособий при

изучении иностранного языка, а также домашние и бизнес-пользователи,

которым нужен универсальный и простой в применении словарь-справочник для

эпизодического перевода деловых бумаг и корреспонденции.

Ниже представлена классификация электронных словарей по их основным

техническим и эксплуатационным характеристикам. Всю совокупность ЭС можно

подразделить по следующим критериям.

1. По используемой операционной системе. Наиболее простые электронные

словари (DIC) работают под управлением ОС MS-DOS, начиная с версий 2.21 и

3.30, что позволяет их использовать практически на любых IBM-совместимых

персональных компьютерах, включая XT, АТ-286. Наиболее сложные многооконные

и многофункциональные ЭС, позволяющие в одной оболочке подключать различные

тематические базы данных, работают под управлением ОС WINDOWS 3.11, WINDOWS

NT, WINDOWS 95 и т.д. Естественно, что для их успешного функционирования

необходим более мощный компьтер (типа AT-486DX) с оперативной памятью не

менее 8 МБ.

2. По способу загрузки. Можно подразделить на нерезидентные и

резидентные. К первым относятся простейшие программы (например,

подстрочечный словарь DIC), которые работают только в собственной среде и

не вызываются из других оболочек, например из текстовых редакторов. В

большинстве случаев они функционируют в режиме автоматического

("пакетного") перевода. Вторые загружают свое ядро в оперативную память

компьютера (например, "LINGVO for DOS") и могут вызываться в любой момент

работы компьютера, например из любого текстового редактора, при помощи

нажатия комбинации "горячих клавиш" — клавиш оперативного вызова. Эти

словари обеспечивают работу переводчика в интерактивном режиме.

3. По количеству подключаемых словарных баз (словарей). Ранние версии ЭС

позволяли подключать только один словарь. Современные программы, например

"Система электронных словарей LINGVO", независимо от того в какой ОС они

работают, позволяют подключать до нескольких десятков словарных баз и

устанавливать приоритет последних.

4. По возможностям расширения словарной базы. Устаревшие ЭС не имели

возможности расширения словарных баз пользователем, современные версии,

например LINGVO 4.6 и выше, имеют специальные утилиты для создания пользова

телем собственных и расширения существующих словарей.

5. По режиму перевода. Можно выделить два основных режима перевода:

автоматический пакетный (подстрочечный) и интерактивный (режим "запрос —

ответ").

В первом случае программа вызывается с указанием имени текстового файла,

который необходимо перевести, или маски для целой группы текстовых файлов,

предназначенных для перевода. Далее автоматически, без участия переводчика,

производится прямой перевод каждого отдельного слова с выводом на экран

монитора или на печатающее устройство только переведенных слов или

исходного текста, под каждым переведенным словом которого будет стоять его

значение на русском языке, под теми словами, которых не оказалось в ЭС

обычно ставится знак "?". Такой режим называется подстрочечным. Словарные

базы подобных ЭС весьма ограниченны, качество перевода оставляет желать

лучшего. Подобные про граммные продукты вряд ли смогут оказать помощь

професси ональному переводчику.

Во втором случае программа работает следующим образом. После загрузки

резидентной части программы в оперативную память компьютера, пользователь,

работая, например, в текстовом редакторе либо непосредственно в оболочке

словаря, вводит с клавиатуры неизвестное слово на языке оригинала, а затем,

выделив его, чаще при помощи "мыши", нажатием комбинации "горячих клавиш"

активизирует ЭС, который заменяет текст оригинала на русскоязычный перевод.

Время доступа к переводу составляет примерно 0,2 секунды, что значительно

ускоряет работу переводчика. Именно такие электронные словари, с учетом

возможности расширения и одновременного подключения нескольких словарных

баз, могут значительно облегчить и ускорить работу переводчика любого

уровня профессионализма.

В любом случае, бум, связанный с появлением простейших электронных

словарей, позволяющих относительно быстро произвести поиск того или иного

слова, уже в прошлом. С развитием технологии систем OCR, о которых я уже

упоминала, стали разрабатываться автоматизированные системы машинного

перевода. О них-то и пойдет речь.

3. КОМПЬЮТЕР НА МЕСТЕ ПЕРЕВОДЧИКА.

Вычислительная техника, как известно, хорошее подспорье человеку в

рутинной работе. Относится ли к таким занятиям перевод текстов? И да, и

нет. С одной стороны, труд переводчика во многом формален, а с другой –

перевод не может быть выполнен чисто формально. Есть, например, технический

перевод, где важно знать принятые за рубежом стандарты обозначений тех или

Страницы: 1, 2, 3, 4, 5, 6, 7, 8



Реклама
В соцсетях
рефераты скачать рефераты скачать рефераты скачать рефераты скачать рефераты скачать рефераты скачать рефераты скачать