Что я понял, переведя китайский словарь с английского.

Что я понял, переведя китайский словарь с английского.

Пять лет назад я обнаружил острую нехватку бесплатных онлайн словарей с китайского языка на венгерский. Вскоре я решил, что моя задача – исправить эту ситуацию. Передо мной стояла лишь одна небольшая проблема, которую мне надо было решить: китайский язык я знал плохо.

Вот то, что я узнал об индустрии переводов, когда создал китайско-венгерский словарь и корпус – общедоступный онлайн словарь под названием китайско-венгерский словарь, в который любой может вносить правки.

Что такое китайско-венгерский словарь и корпус?

Это все нижеперечисленное:

  • Доступный для скачивания текстовый файл с общественной лицензией, где каждому слову на китайском дан эквивалент на венгерском.
  • Сайт, где вы можете найти значение слов на китайском или венгерском языках или распознать нарисованные от руки китайские иероглифы.
  • Перевод на венгерский язык английских выражений из электронного китайско-английского словаря, который и вдохновил меня на создание собственного проекта.
  • Интернет-пространство для совместной работы, где люди могут добавлять свои статьи, улучшать или исправлять уже существующие.

Основная часть работы по словарю была сделана в период с февраля 2015 по май 2017 года. За это время я перевел около 11 тысяч статей из китайско-английского словаря и китайско-немецкого, который также является онлайн-словарем, в который каждый может вносить правки. Моя главная цель на начальном этапе заключалась в том, чтобы перевести английские слова китайско-английского словаря, сосредотачивая внимание на наиболее часто используемых китайских словах, а также на тех не менее важных терминах, которые включены в "Ханьюй Шуйпин Каоши", официальный тест на знание китайского языка в КНР.

Затем я использовал технологию машинного обучения, чтобы извлечь двуязычные соответствия из трех миллионов субтитров к китайско-венгерским фильмам. Это позволило мне просмотреть вручную и добавить еще четыре тысячи статей в китайско-венгерский словарь всего за несколько месяцев. Одновременно с этим люди начали интересоваться моим словарем: они самостоятельно добавляли или исправляли сотни статей.

Я хочу использовать эту возможность, чтобы поделиться тем, что я узнал о профессиональном переводе благодаря разработке словаря редких языковых пар.

Ваш перевод – это помощь другим переводчикам

Словарь, как правило, считается тем, чем переводчик пользуется, но никак не тем, что переводчик создает. Перевод словаря переворачивает ваше сознание с ног на голову. Чем больше я думал об этом, тем лучше понимал, что большая часть нашей работы в качестве переводчика это прямой вклад в работу других переводчиков. Это как раз тот самый случай, когда вы создаете общий глоссарий. Но даже когда вы просто фиксируете сегменты в памяти перевода, вы тем самым увеличиваете базу, которой, вероятно, в последствии воспользуется другой переводчик. С этой точки зрения перевод словаря не кажется каким-то особым видом деятельности.

Дело в том, что каждый перевод, хранящийся в цифровом формате, в конечном итоге окажется в памяти машинного перевода. И это касается любой информации, попавшей в Интернет. Однако, вы можете быть уверены, что даже очень конфиденциальные тексты, предназначенные только для внутреннего пользования, все равно окажутся в памяти машинного перевода.

Важность ясности относительно интеллектуальной собственности и авторских прав

Я бы не смог создать китайско-венгерский словарь, или он был бы совсем другим, если бы китайско-английский словарь не был в общем доступе. Однако, такое право существовала не всегда. У первой версии китайско-английского словаря не было никакой лицензии до 2007 года, до тех пор пока человек, управлявший проектом, просто не исчез. Люди, которые хотели продолжить это дело, оказались действительно в трудном положении. Тем не менее, в конечном итоге ситуация разрешилась, и новые владельцы словаря добавили в название две буквы "си" (англ. CC-Creative Commons), чтобы подчеркнуть, что компания теперь работает на условиях свободной лицензии.

Но каким видом интеллектуальной собственности является словарь? Язык – это общественное благо; ни один человек не может считаться владельцем слов своего лексикона. Посмотрим на это с другой стороны: у гравитации нет владельца, но физик, который напишет книгу о гравитации, будет владеть интеллектуальной собственностью.

В то время как в Великобритании и США современные издательства, выпускающие словари, являются коммерческими предприятиями, в других странах это, как правило, часть академической деятельности. В обоих случаях ясно, что словарь – это продукт, интеллектуальная собственность которого бдительно оберегается владельцами лицензий.

Что такое интеллектуальная собственность в контексте перевода, будь то перевод словаря или любой другой работы? Тот факт, что эффективного решения этого вопроса никогда не было, представляет собой серьезный недостаток для переводческой отрасли. Лет 10-15 назад этот вопрос активно обсуждался, однако сейчас разговоры утихли. И теперь, когда стало ясно, что каждый новый перевод – это вклад кого-то другого, мы находимся в ситуации, когда программы машинного перевода могут отвечать на миллионы запросов в день и не платить ни копейки создателям сегментов, которыми пополняется память переводов.

Выгодно и удобно

Рассчитаем стоимость проекта за 5 минут

Рисунок 1.

Общественная лицензия – лучшая гарантия сохранения работы в век цифровых технологий

До цифровой революции все знания, накопленные человечеством, хранились в библиотечных книгах. Сегодня же все знания человечества хранятся в Интернете в цифровом формате.

Модели выживаемости у цифровой информации и печатных книг очень разные. Если вы перестанете обслуживать свой сервер, контент исчезнет (ссылка вымрет). С другой стороны, копии всегда живут дольше оригиналов ("Гугл" помнит все). То есть, лучший способ продлить жизнь любой цифровой информации – это общественная лицензия.

Если меня собьет автобус, то копии китайско-венгерского словаря будут по-прежнему храниться в Интернете, и кто-то да оживит мой проект и повторно опубликует словарь.

Сравните это с огромным числом книг, которые уже вышли из печати, и ведь издатель не собирается их переиздавать. Или с закрытой цифровой информацией, правообладателя которой сбил автобус.

Работая над китайско-венгерским словарем, я стал свидетелем создания нового проекта: официального тайваньского общедоступного онлайн китайского словаря. Это произошло в результате студенческого движения "Подсолнухи" в Тайване в 2014 году, в ходе которого протестующая молодежь изменила политическую ситуацию на острове, временно захватив здание парламента. Согласно требованиям студентов, захвативших здание парламента, правительство создало цифровое министерство, назначило в качестве его руководителя хакера-анархиста и стало регулярно проводить "марафоны программистов". В рамках одного из таких марафонов объектом исследования стал тайваньский китайский словарь. Результаты этого исследования убедили чиновников в том, что информация, содержащаяся в онлайн-словаре попадает под понятие общественное благо (то есть сайт находится в открытом доступе), и что его можно публиковать в рамках открытой лицензии. Только попробуйте мне теперь сказать, что словари это скучно!

Лингвисты станут мастерами обработки родного языка

Хорошо, я, очевидно, чудик, одержимый средствами автоматизированного перевода. Я написал свою собственную программу для того, чтобы перевести статьи своего китайско-венгерского словаря быстрым и эффективным способом. Чтобы понять, как это все выглядит, посмотрите на рисунок 1. Функционал немного отличается от обычных средства автоматизированного перевода, но, да, цель состоит в том, чтобы все окна, изображенные на рисунке 1 слева, стали зеленого цвета. И да, сочетание клавиш для подтверждения ввода – Ctrl+Enter.

Нет, я не утверждаю, что все лингвисты в будущем будут создавать свои средства автоматизированного перевода. Но самым сложным моментом в создании китайско-венгерского словаря, особенно на втором этапе его разработки, было структурирование методов обработки исходного языка для поиска лексических единиц в двуязычных или моноязычных источниках. Не считаю нужным расписывать здесь все утомительные подробности, но если вы действительно "в теме", то у меня есть статья и об этом.

Моей проблемой было то, что я владею китайским языком очень поверхностно, поэтому мне пришлось потратить много времени, чтобы понять, что означают слова на языке оригинала, то есть на китайском. Такое врядли встретишь в повседневной переводческой практике. В конце концов, мы не можем знать все обо всем, поэтому мы много читаем о том, что нам предстоит перевести, чтобы убедиться, что мы правильно поняли исходный текст. Затем мы воспроизводим текст и передаем главную мысль автора на другом языке (и мы, между прочим, очень хорошо владеем языком, на который переводим). Другими словами, перевод – это исследование + владение языком, на который осуществляется перевод.

Работа с родным языком дает вам суперспособности для исследовательской части. Ваш мозг сможет запоминать тонну информации. Задача человека здесь заключается в понимании исходного текста и в искусной передаче его на другой язык.

Средства автоматизированного перевода кодируют динамику общественных отношений

Наверняка под пользователями словаря вы понимаете тех людей, которые ищут слова в нем. Однако, поскольку китайско-венгерский словарь – это общедоступная площадка для совместной работы, то люди, редактирующие словарные статьи и добавляющие новые, одинаково важны, хоть их и не так много.

То, как происходят эти процессы, напрямую зависит от самого веб-сайта. Раздел Википедии на английском языке, например, доступен всем пользователям: любой человек может внести правку в статью одним щелчком мыши, и изменение будет внесено незамедлительно. (Очевидно, что эта функция доступна большому количеству пользователей). Китайско-английский словарь же устроен иначе: добавлять статьи и вносить правки могут только зарегистрированные пользователи.

Правки и новые словарные статьи рассматриваются поочередно и вносятся в словарь только в том случае, если кто-то из небольшого числа редакторов обработает запросы. Кажется, что такой принцип внесения правок и добавления статей пригодился бы и китайско-английскому словарю, хотя в последние годы словарем пользуется не так много людей.

Я знал, что моим китайско-венгерским словарем будет пользоваться еще меньшее количество людей. Я решил не усложнять процесс внесения правок или добавления новых статей, однако кое-какой механизм все-таки имеется: два человека проверяют качество поправок.

Суть заключается в том, что формы вовлечения, власти, распределения полномочий и общей социальной динамики закодированы в средствах автоматизированного перевода, которые мы используем для взаимодействия. Поскольку теперь перевод – это совместный онлайн-процесс, то у таких проектов как китайско-венгерский словарь есть огромные возможности для придания этой отрасли динамики развития. Таким образом, было бы неплохо, если бы разработчики с умом использовали свои полномочия.

Бизнес-модель есть далеко не у всех успешных проектов

Китайско-венгерский словарь работает уже два года, и я хорошо осведомлен о статистике использования. Ежемесячно им пользуется 100 человек, каждое посещение которых в среднем составляет 20 минут. Примерно две тысячи запросов выполняется еженедельно. Эта статистика соответствует моим первоначальным ожиданиям, которые были основаны на пользовательской статистике китайско-немецкого словаря и на приблизительной оценке количества венгерцев, которые работают с китайским языком.

Любой желающий может абсолютно бесплатно воспользоваться китайско-венгерским словарем, так что этот словарь не приносит денег, но меня все устраивает. Большинство лучших вещей в жизни имеют нежизнеспособную бизнес-модель. Я бы только хотел, чтобы мы, как общество, нашли способ получше расплатиться, в частности, с замечательными переводчиками, которые перевели поистине трудные произведения. Я имею в виду не только таких известных переводчиков художественной литературы, как Эмили Уилсон и Кен Лю, но и сотни других высококвалифицированных переводчиков, в чьем переводе книги не становятся бестселлерами.

#памятьпереводов #переводчик #словарь #b2bperevod