Память переводов
Па́мять перево́дов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует сегменту или «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если единица перевода исходного текста в точности совпадает с единицей перевода, хранящейся в базе (точное соответствие, англ. exact match), она может быть автоматически подставлена в перевод. Новый сегмент может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такой сегмент может быть также подставлен в перевод, но переводчик будет должен внести необходимые изменения.
Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.
В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который может генерироваться практически всеми системами ПП. Благодаря этому сделанные переводы можно использовать в разных приложениях, то есть переводчик работающий с OmegaT может использовать ПП, созданную в ТРАДОСе и наоборот.
Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.
Популярные программные системы ПП
В соответствии с недавними обзорами использования систем ПП к наиболее популярным системам относятся:[1], [2]
- ABBYY Aligner
- Deja Vu
- OmegaT (бесплатная система, распространяемая по лицензии GNU GPL)
- SDLX [3]
- Trados (наиболее популярная программа, долгое время бывшая стандартом ПП)
- Star Transit
- Wordfast (реализована как набор макросов для MS Word, новая версия 2009 года является отдельным приложением)
В английской википедии есть список, сравнивающий возможности различных систем.
Стандарты и форматы памяти переводов[4]
- TMX (Translation Memory Exchange Format — Обмен памятью переводов) формат. Этот стандарт обеспечивает взаимный обмен между разными поставщиками памяти переводов. TMX является общепринятым форматом в среде переводчиков и лучше всего подходит для импорта и экспорта памяти переводов. Последняя версия этого формата — 1.4b позволяет восстанавливать исходные документы и их перевод из файла TMX.
- TBX (Termbase Exchange format — Обмен терминлогическими базами). Это принятый LISA (Ассоциации индустрии локализации) формат сейчас пересматривается и переиздается согласно ISO 30042. Этот стандарт позволяет проводить обмен терминологией, в том числе детальной лексической информацией. Основная база TBX определяется стандартами: ISO 12620, ISO 12200 и ISO 16642. ISO 12620 обеспечивает реестр четко определенных «категорий данных» со стандартизованными именами, которые функционируют как типы элементов данных или предопределенные значения. ISO 12200 (известен также как MARTIF) предоставляет основу для каркасной структуры TBX. ISO 16642 (известен также как Terminological Markup Framework — Структура терминологической разметки) включает структурную метамодель для терминологических языков разметки (Terminology Markup Languages) в целом.
- SRX создан для улучшения формата TMX и большей эффективности обмена памятью переводов между программами. Возможность указывать правила сегментации, которые использовались в предыдущем переводе, повышает эффективность отождествления сегментов в текущем тексте с содержимым ПП.
- GMX GILT означает Globalization, Internationalization, Localization, and Translation (Глобализация, интернационализация, локализация, перевод). Стандарт GILT Metrics состоит из трех частей: GMX-V для показателей объема, GMX-C для показателей сложности, GMX-Q для показателей качества. Предложенный стандарт GILT Metrics направлен на квантификацию объема работ и требований качества при реализации задач GILT.
- OLIF — открытый стандарт, совместимый с XML, который используется для обмена терминологическими и лексическими данными. Хотя изначально он применялся в качестве способа обмена лексическими данными между частными лексиконами машинного перевода, постепенно этот формат превратился в более общий стандарт терминологического обмена.
- XLIFF (XML Localisation Interchange File Format — XML формат для взаимного обмена при локализации), создан как единый формат файлов для взаимного обмена, который распознается всеми провайдерами локализации. XLIFF — это наилучший в современной индустрии переводов способ обмена информацией в формате XML.
- TransWS (Translation Web Services — Веб сервисы для перевода), определяет требуемые вызовы для использования веб-сервисов при отправлении и получении файлов и сообщений, имеющих отношение к проектам локализации. Задумывался как развернутая система автоматизации процесса локализации с использованием сервисов Интернета.
- xml:tm, этот подход к памяти переводов основан на концепции текстовой памяти, которая позволяет совмещать авторскую память и память переводов. Формат xml:tm был передан Lisa OSCAR компанией XML-INTL.
- ↑ См. стр. 26 в Imperial College London Translation Memories Survey 2006 (PDF)
- ↑ ITI Translation Memory Survey, 2007
- ↑ В результате приобретения в июне 2005 года компании Trados британской компанией SDL International в 2006 появился единый продукт TRADOS SDLX 2006
- ↑ Стандарты LISA
См. также
Ссылки
ca:Memòria de traducció de:Übersetzungsspeicher en:Translation memory eo:Tradukmemoro es:Memoria de traducción fi:Käännösmuisti fr:Mémoire de traduction hi:अनुवाद स्मृति hu:Fordítómemória it:Memoria di traduzione ja:翻訳メモリ lt:Vertimo atmintis nl:Vertaalgeheugen pl:Pamięć tłumaczeniowa ro:Memorie de traducere sr:Преводилачка меморија sv:Översättningsminne th:หน่วยความจำการแปล uk:Пам'ять перекладів zh:翻譯記憶
Если вам нравится SbUP.com Сайт, вы можете поддержать его - BTC: bc1qppjcl3c2cyjazy6lepmrv3fh6ke9mxs7zpfky0 , TRC20 и ещё....