Искусственный интеллект и технологии перевода.

Искусственный интеллект и технологии перевода.

Недавно я задал всем поставщикам на рынке технологий перевода, которые пришли на ум, следующий вопрос:

Где, по вашему мнению, искусственный интеллект займёт свою нишу: в ваших технологиях и/или технологиях, связанных с переводческой деятельностью у других поставщиков?

Зачем это спрашивать? Просто сейчас вообще много разговоров об искусственном интеллекте (ИИ) в технологиях в целом. В мире переводов мы затрагивали эту тему, в частности, в связи с машинным переводом (МП), хотя, конечно, тема ИИ в переводческой деятельности, не заканчивается на связи ИИ с машинным переводом. Мне было интересно узнать, что находится в центре внимания у разработчиков технологий, которыми все мы пользуемся.

Кроме того – и это становится очевидно из некоторых полученных мной ответов – ИИ, на который мы полагаемся в нашей повседневной жизни – не тот же ИИ, который был источником вдохновения (или ночных кошмаров) для авторов научной фантастики. Как мы знаем, искусственный интеллект не может иметь стандартного приложения, в котором он мог бы принимать "решения" по вопросам из разных областей. Эта технология используется для ускорения принятия решения в очень узкоспециализированных областях знаний (таким образом, это "узкоспециализированный ИИ"), и она преуспевает в этом всё лучше и лучше. Точнее, лучше сказать, что это разработчики и пользователи всё больше преуспевают в пользовании подобной технологией.

Мне ответило большинство компаний, занимающихся технологиями перевода (больше ответов выложено онлайн). Вы увидите, что ответы, изложенные ниже (поставщики расположены в алфавитном порядке), можно увидеть везде, но, думаю, что вы многому научитесь в процессе (как это сделал я), включая тому, что ИИ является чем-то большим, чем "просто" нейронный машинный перевод. Прошу заметить, что изложенные ответы – это слова самих поставщиков.

ATRIL

Применение метода глубокого обучения переводу, проводимого в форме нейронного машинного перевода (НМП), несомненно, будет являться основной ролью, которую будет играть искусственный интеллект в области перевода в ближайшем будущем. Наличие доступных проектов нейронного машинного перевода с открытым исходным кодом привело к тому, что всё больше поставщиков языковых услуг начали добавлять НМП в свой лист услуг, возможно, таким образом показывая своё техническое совершенство. Всё, конечно, так, но учитывая огромный объём информации, необходимой для обучения высококачественных систем НМП, всё равно для НМП понадобится больше времени, чтобы оказать настоящее влияние на данную отрасль.

В ближайшем будущем мы ожидаем, что НМП будет внедрен во многие конкурентоспособные инструменты автоматизированного перевода (CAT-системы), а рабочая рутина переводчиков сменится на постредактирование. Также мы ожидаем что другое применение ИИ будет в двух следующих областях: 1) в сборе и очистке данных для обучения НМП; и 2) в более сложных инструментах контроля качества.

ILANGL

Мы считаем, что искусственный интеллект в переводческой сфере может использоваться в следующих областях:

Оценка качества локализации.

Помощь в быстром подборе лучших лингвистов для конкретной работы.

Анализ ресурса рабочей нагрузки и помощь менеджеру проекта управлять и оптимизировать кадровый резерв лингвистов.

Частичное или полное замещение менеджера по проектам при сложной работе по локализации.

KANTANMT

Существует множество областей, в которых ИИ и машинное обучение будут использоваться для улучшения процесса локализации. Что более важно, ИИ и машинное обучение будут использовать для повышения эффективности предпринимательской деятельности. Всё это приведёт к более быстрому и продуманному выполнению процесса локализации, при котором использование ресурсов и затрат уменьшится, а доходы вырастут. Вот несколько областей:

Прогнозирование спроса.

Прогнозирование планов рабочего процесса.

Механизмы рекомендаций для выбора оптимального рабочего процесса.

Оповещения и диагностика системы контроля за управлением проектов, работающая в реальном времени.

Превентивное здоровое управление рабочего процесса.

Анализ результативности проекта.

Динамическое ценообразование (основанное на факторах проекта).

Схема нагрузки рабочего процесса и управление перегрузкой.

Анализ рисков и регулирование.

Анализ использования ресурсов.

Хотя многие люди думают, что искусственный интеллект и машинное обучение будут ограничены в технологических инновациях, мы твёрдо верим, что мы на пороге революции ИИ, и это коренным образом изменит нашу отрасль и заставит нас переосмыслить многие из наших подходов к управлению бизнесом за последние три десятилетия. Технологии идут вперёд.

LILT

Мы думаем о роле ИИ в технологии Lilt с точки зрения дополненного интеллекта. Идея, что ИИ каким-то образом способен полностью автоматизировать перевод только лишь с помощью машинного перевода, неверна. Особенно если речь идёт о материале, который требует высокого качества. Нельзя "решить" проблему машинного перевода, пока не будет решена проблема ИИ, а это будет ещё не скоро. Нужно задуматься, как мы может использовать искусственный интеллект для повышения качества и скорости перевода человеком. Перевод – это искусство, и Lilt сосредоточен на том, как можно продолжить развивать технологию, которая использует ИИ, чтобы дать возможность переводчикам как никогда лучше выполнять свою работу. Если коротко: машины должны работать с людьми-переводчиками и обучаться у них.

MATECAT

Искусственный интеллект удивляет и пугает. Человеческий язык и перевод в частности являются, возможно, самой трудной задачей, с которой сталкиваются машины. Естественный язык – это очень сжатый канал информации с плотной обёрткой из смысла. Он требует контекстуальной информации, которая стоит выше слов, которые надо понять.

Язык является самой сложной проблемой, с которой сталкиваются машины, потому что это самая человеческая вещь, которая только есть. По этой причине автоматизированный перевод прогрессирует медленно, но, несомненно, прогрессирует.

MEMOQ

В инструментах переводческой среды ИИ в своей форме машинного перевода останется здесь навсегда, но с очевидным изменением на что он будет направлен. Мы увидим, как технологии перейдут от постредактирования, где человеческое редактирование отстаёт по скорости, к дополненному переводу, где ИИ будет для того, чтобы расширить возможности лингвистов. Это очередная захватывающая вещь, которая произойдёт во взаимодействии человека и машины, а не в моделях машинного перевода как такового.

Помимо строгого языкового процесса, машинный перевод начнёт появляться в управлении проектами, управлении поставщиками и технологии локализации. Весь этот успешный набор инструментов профессионалов, работающих с языками включит в себя растущее число упрощенных инструментов для машинного обучения и анализа данных. Слабость ИИ есть в одном месте – гарантия качества. Если бы инструмент был "достаточно умным" для оценки качества, то он был бы достаточно умным, чтобы самостоятельно улучшать качество работы. Таким образом, мы бы пользовались инструментом для этих целей, а не для гарантии качества.

Выгодно и удобно

Рассчитаем стоимость проекта за 5 минут

MEMSOURCE

В Memsource ИИ нашёл себе применение в нашем управлении переводом и в компонентах переводческого инструмента. Обычно, мы ищем задачи, которые повторяются, нуждаются в должном выполнении и окупают затраты на них. Эти задачи, как правило, лучшие кандидаты для искусственного интеллекта. Например, наша технология Оценки Качества Машинного Перевода (ОКМП) определяет высококачественный машинный перевод, который не нуждается в постредактировании. Другая технология может определять непереводимый материал. Очень многообещающей областью является сквозная автоматизация процесса локализации от определения верных настроек проекта до выбора подходящего лингвиста для этой работы. С другой стороны, ИИ будет трудно справиться с такими задачами, как всеобъемлющий анализ переведённого контента до его отправки очень требовательному заказчику. Например, ИИ не определит проблемы, которые редки и уникальны, или проблемы, которые не входят в данные, по которым он учился. В любом случае сейчас отличное время, и технологии с установленным ИИ позволят нам сконцентрироваться на креативных задачах, что не может не радовать.

PLUNET

Так как система управления бизнесом управляет вашим рабочим процессом, Plunet мог бы видеть искусственный интеллект в распределении поставщиков, пытаясь выбрать лучший возможный вариант, а затем мог бы выйти на более широкую аудиторию потенциальных поставщиков. ИИ можно было бы также использовать для прогноза крайних сроков или даже рабочих процессов. Помимо этого, мы бы могли подумать о прогнозировании того, что пользователь хочет дальше делать и предоставить ему эти варианты (например, дизайн взаимодействия с пользователем).

В идеальном мире, имея достаточно метаданных и традиционной информации, проекты могли бы быть полностью автоматизированными: цитирование, настройка проектов, выбор нужных CAT-инструментов, назначение поставщиков, и даже обработка каких-то исключительных случаев.

SDL

Мы видим искусственный интеллект везде, где речь идёт об увеличении продуктивности и автоматизации. Вот несколько примеров:

Нейронный машинный перевод (усилитель продуктивности), совмещённый с памятью перевода (ПП), терминологией и сопоставлением фрагментов всегда будет обеспечивать лучшее совпадение, с которого можно будет начать.

Распознавание голоса. (Видя улучшающее качество технологий, основанных на ИИ, таких как "Гугл", становится всё привлекательнее для интеграции с CAT средой).

Автоматизация проекта. Например, автоматизация монотонной работы через анализ изначального контента и нахождение максимально подходящих ресурсов (например, памятей перевода, терминологической базы, систем машинного перевода) и переводчиков/редакторов со способностями соотносить нужные фрагменты.

Имея под рукой этот набор "умных" инструментов, есть определённая вероятность, что переводчики будут тратить больше времени на контроль и управление процессом перевода, чем начав переводить с нуля (например, смена перевода "с нуля" на редактирование"). Кроме того, мы избегаем термина "постредактирование", когда речь идёт о нейронном машинном переводе. Мы предпочитаем термин "доработка", так как это ближе сходится с видом работы, при анализе результата после хорошо обученного машинного перевода.

После всего вышеперечисленного, язык есть язык, что всегда значит "неожиданные сложности", которые делают его ключом для разработки любой части технологии таким образом, что переводчики отвечают за контроль ресурсов, с которыми они работают, вместо того, чтобы запрягать пользователей на какую-то работу. Гибкость станет решением. В нашей фокус-группе пользователи продолжают утверждать, что это важнейший аспект.

SMARTCAT

Мы используем искусственный интеллект, чтобы процесс перевода и управление переводом проходили спокойно и эффективно. Для лингвистов это значит предложение работ, подходящих их компетенции; адаптация предложений для перевода под их стиль и голос; помощь с проблематичными вещами, такими как теги, форматы чисел и непереводимый материал; и также помощь со счетами, выплатами и всем, что связано с управлением их собственного счёта. Эти задачи, обычно, занимают до 30% времени переводчиков, а они могли бы использовать его на перевод, таким образом зарабатывая больше и делая себя счастливее.

Для менеджеров проектов это значит подбор переводчиков, которые лучше всего подходят для определённого проекта, автоматически устанавливая крайние сроки, выбирая наиболее подходящие движки машинного перевода, отслеживая прогресс и оповещая менеджера проекта, если что-то идёт не так.

В ближайшем будущем ИИ станет мозгом многих личных помощников для менеджеров проектов и переводчиков в Smartcat, помогая им работать эффективнее и креативнее, забирая у них повторяющиеся задачи, тормозящие продуктивность.

STAR

Две технологии ИИ – управление семантической информацией и машинное обучение – играют важнейшую роль в технологиях STAR и будут оказывать большое влияние на эволюцию этих технологий.

Семантическая информация, представленная в графах знаний и онтологиях, является решением к открытию "чёрного ящика контекста" в техническом аспекте, делая материал переводимым. Это помогает интеллектуальным услугам и процессам технических компаний в цифровом формате. Семантическая информация – это основа для интеллектуальных помощников, ботов в чатах, голосовых помощников и в работе интеллектуальной дополненной реальности и виртуальной реальности.

Машинное обучение – это основа для машинного перевода и сущности решения этого перевода в STAR, которая поддерживает переводчиков, предлагая варианты машинного перевода. Нейронный сети, основанные на машинном обучении, также будут помогать в следующем:

Интеллектуальное (прогнозируемое) завершение текстов в авторской памяти.

Более высокая автоматизация для гарантии качества, распознавании ошибок и исправлении в переводах.

Основанное на ИИ постредактирование машинного перевода.

Оптимизированное распознавание терминов и проверка в языках, богатых своей морфологией.

Более высокая автоматизация проверка выравнивания.

Заключительные мысли.

Лично для меня было очень поучительно услышать, что скажут поставщики технологий. Заметьте, что лишь одна компания ставит под сомнение долгожительство мира переводов в том виде, в котором мы видим его. Другие видят, что искусственный интеллект не только не забирает нашу работу, но и является дополнением к этой работе профессиональных переводчиков, редакторов или проектных менеджеров, и часто, очень креативным образом. И, как я уже множество раз говорил в этой статье, это, скорее, зависит от нас, станем ли мы креативными в общении с поставщиками технологий, чьи задачи бессмысленны и монотонны и, вероятно, должны выполняться машинами, а какие лучше оставить нам.

#искустсвенныйинтеллект #машинныйперевод #перевод #b2bperevod