Пять лет назад я обнаружил острую нехватку бесплатных онлайн словарей с китайского языка на венгерский. Вскоре я решил, что моя задача – исправить эту ситуацию. Передо мной стояла лишь одна небольшая проблема, которую мне надо было решить: китайский язык я знал плохо.
Вот то, что я узнал об индустрии переводов, когда создал китайско-венгерский словарь и корпус – общедоступный онлайн словарь под названием китайско-венгерский словарь, в который любой может вносить правки.
Что такое китайско-венгерский словарь и корпус?
Это все нижеперечисленное:
- Доступный для скачивания текстовый файл с общественной лицензией, где каждому слову на китайском дан эквивалент на венгерском.
- Сайт, где вы можете найти значение слов на китайском или венгерском языках или распознать нарисованные от руки китайские иероглифы.
- Перевод на венгерский язык английских выражений из электронного китайско-английского словаря, который и вдохновил меня на создание собственного проекта.
- Интернет-пространство для совместной работы, где люди могут добавлять свои статьи, улучшать или исправлять уже существующие.
Основная часть работы по словарю была сделана в период с февраля 2015 по май 2017 года. За это время я перевел около 11 тысяч статей из китайско-английского словаря и китайско-немецкого, который также является онлайн-словарем, в который каждый может вносить правки. Моя главная цель на начальном этапе заключалась в том, чтобы перевести английские слова китайско-английского словаря, сосредотачивая внимание на наиболее часто используемых китайских словах, а также на тех не менее важных терминах, которые включены в "Ханьюй Шуйпин Каоши", официальный тест на знание китайского языка в КНР.
Затем я использовал технологию машинного обучения, чтобы извлечь двуязычные соответствия из трех миллионов субтитров к китайско-венгерским фильмам. Это позволило мне просмотреть вручную и добавить еще четыре тысячи статей в китайско-венгерский словарь всего за несколько месяцев. Одновременно с этим люди начали интересоваться моим словарем: они самостоятельно добавляли или исправляли сотни статей.
Я хочу использовать эту возможность, чтобы поделиться тем, что я узнал о профессиональном переводе благодаря разработке словаря редких языковых пар.
Ваш перевод – это помощь другим переводчикам
Словарь, как правило, считается тем, чем переводчик пользуется, но никак не тем, что переводчик создает. Перевод словаря переворачивает ваше сознание с ног на голову. Чем больше я думал об этом, тем лучше понимал, что большая часть нашей работы в качестве переводчика это прямой вклад в работу других переводчиков. Это как раз тот самый случай, когда вы создаете общий глоссарий. Но даже когда вы просто фиксируете сегменты в памяти перевода, вы тем самым увеличиваете базу, которой, вероятно, в последствии воспользуется другой переводчик. С этой точки зрения перевод словаря не кажется каким-то особым видом деятельности.
Дело в том, что каждый перевод, хранящийся в цифровом формате, в конечном итоге окажется в памяти машинного перевода. И это касается любой информации, попавшей в Интернет. Однако, вы можете быть уверены, что даже очень конфиденциальные тексты, предназначенные только для внутреннего пользования, все равно окажутся в памяти машинного перевода.
Важность ясности относительно интеллектуальной собственности и авторских прав
Я бы не смог создать китайско-венгерский словарь, или он был бы совсем другим, если бы китайско-английский словарь не был в общем доступе. Однако, такое право существовала не всегда. У первой версии китайско-английского словаря не было никакой лицензии до 2007 года, до тех пор пока человек, управлявший проектом, просто не исчез. Люди, которые хотели продолжить это дело, оказались действительно в трудном положении. Тем не менее, в конечном итоге ситуация разрешилась, и новые владельцы словаря добавили в название две буквы "си" (англ. CC-Creative Commons), чтобы подчеркнуть, что компания теперь работает на условиях свободной лицензии.
Но каким видом интеллектуальной собственности является словарь? Язык – это общественное благо; ни один человек не может считаться владельцем слов своего лексикона. Посмотрим на это с другой стороны: у гравитации нет владельца, но физик, который напишет книгу о гравитации, будет владеть интеллектуальной собственностью.
В то время как в Великобритании и США современные издательства, выпускающие словари, являются коммерческими предприятиями, в других странах это, как правило, часть академической деятельности. В обоих случаях ясно, что словарь – это продукт, интеллектуальная собственность которого бдительно оберегается владельцами лицензий.
Что такое интеллектуальная собственность в контексте перевода, будь то перевод словаря или любой другой работы? Тот факт, что эффективного решения этого вопроса никогда не было, представляет собой серьезный недостаток для переводческой отрасли. Лет 10-15 назад этот вопрос активно обсуждался, однако сейчас разговоры утихли. И теперь, когда стало ясно, что каждый новый перевод – это вклад кого-то другого, мы находимся в ситуации, когда программы машинного перевода могут отвечать на миллионы запросов в день и не платить ни копейки создателям сегментов, которыми пополняется память переводов.