lost in (tech)writing
257 subscribers
51 photos
3 videos
19 links
Короткие и не очень заметки о техписательстве, переводе и всём, что касается языков и текстов
Download Telegram
Рубрика #анонсы: 15 июня Smartcat проводит онлайн-конференцию LocTalk. В этом году она посвящена отношениям локализации и инструментов ИИ.

Что из докладов мне показалось интересным:

⁃ The AI Gold Rush in Localization, Stefan Huyghe
⁃ Trends in Post-Editing and LQA with the rise of Gen AI, Zachary Haitkin
⁃ Localization in Enterprises: Expanding the Sphere of Influence, Wada'a Fahel
⁃ Thinking Human: The Universal Language of Brand Building, Doug Zarkin

У меня нет каких-то особых ожиданий — кажется, что всё это может быть попыткой присоединиться к волне AI-хайпа. Даже в название первого доклада эта самая «золотая лихорадка» просочилась. Но я буду весьма рада, если после конфы у меня получится поменять своё мнение)

Регистрация бесплатная. Конференция проходит на английском, время выступлений указано по Тихоокеанскому летнему времени (UTC-7).
🔥4
lost in (tech)writing pinned «Привет всем! Канал у меня совсем свеженький, поэтому начать будет логично с чего-то вроде знакомства) Меня зовут Мария, и скорее всего (по состоянию на 6 июня 2023) вы читаете это после того, как посмотрели трансляцию/запись Techdoc Meetup #1. Я работаю…»
Почему мне нравится DeepL: часть 1

В приветственном посте я уже писала, что с большой долей вероятности вы читаете меня после митапа Techdoc Meetup #1. Но даже если и нет — это уже не так важно, я просто использую его упоминание как подводку к сегодняшнему тексту))

На митапе мне задали вопрос про то, какой движок машинного перевода кажется мне наиболее классным — и я ответила, что это DeepL. Сегодня хочу рассказать в двух словах, почему это так. И подвесить небольшую интригу — насчёт того, почему на самом деле я вас немного обманула. Но про это уже в следующей части: как это со мной бывает, я хотела написать пару слов и в итоге получила простынь, которую распилю на несколько постов.

Итак. Если ваша профессиональная деятельность не связана с переводом, велик шанс, что вы не слышали про DeepL и при словах «машинный перевод» скорее вспомните Google Translate. Или странные кринжовые переводы названий товаров с AliExpress — «телефон псу под хвост два ядра», «брильянты пять за доллар гордость предков», «костяшки чехол без коробку» и вот это вот всё.

DeepL же — инструмент, который справляется с задачами перевода гораздо лучше. Его главные достоинства:

⁃ Даёт редактировать перевод. Можно нажать на любое слово в готовом переводе — и выбрать альтернативный вариант.
⁃ Показывает что-то вроде словарной статьи для каждого слова перевода. Очень полезно, если нужно уточнить нюансы употребления.
⁃ Чаще выбирает варианты, близкие к речи носителей языка.

Всё это входит в бесплатную версию. В платной есть ещё некоторые фишечки — DeepL Pro умеет переводить целые файлы и хранить ваш личный глоссарий. Но Pro я не пользовалась, поэтому все дифирамбы пою в основном бесплатной версии.

Последний пункт моего списка, про близкие к естественной речи варианты, на мой взгляд — самое главное. DeepL очень хорошо подбирает формулировки: даже если в тексте есть неточности, в целом он как правило звучит более human-like.

А вот о том, почему он так хорошо с этим справляется — уже в следующей серии. Stay tuned!
9
Несу вам пятничные #lostinмемы — короткий выпуск)
Хороших выходных 💙
7🔥1
Почему мне нравится DeepL: часть 2

В прошлый раз я писала про то, что главное достоинство DeepL — его формулировки, близкие к натуральной речи.

Покажу на примере: возьмём знаменитую фразу «съешь ещё этих мягких французских булок, да выпей чаю» и прогоним её через DeepL и Google Translate (дальше для краткости я буду фамильярно называть его GT).

Версия DeepL: «Eat some more of those soft French rolls and have some tea»
Версия GT: «Eat even these soft French buns, and drink tea»

И тот, и другой в принципе выдают более-менее понятный и приличный текст. Но вот только DeepL вызывает лёгкое ощущение зловещей долины:

⁃ Откуда эта шайтан-машина знает, что «французские булки» в английском — это именно French rolls, хотя просто «булка» — именно bun, как ничтоже сумняшеся предлагает GT?
⁃ Как она понимает, что «ещё» — это some more, а не even, ведь речь про булки, а even приобретает значение «ещё» только перед прилагательными и наречиями в сравнительной форме, никак не перед существительными?
⁃ Почему она переводит «выпей чаю» не прямолинейным drink tea, а пугающе человечно звучащим have some tea?

Это точно движок машинного перевода, а не три переводчика в плаще, которых заставляют переводить на скорость?

И да, и нет. Секрет тут в том, что GT создавался как SMT (statistical machine translation)-движок. То есть, первоначально он работал по статистическому методу, и только 5 лет назад переехал на нейронку. А DeepL с самого начала создавался как нейросеть.

В следующей серии обязательно расскажу, почему эти два инструмента выдают такое разное качество, если по факту сейчас оба используют нейросети. Спойлер: дело во многом в материале и методах обучения.
👍11
This media is not supported in your browser
VIEW IN TELEGRAM
6
Круглая циферь на канале! Спасибо вам, коты 🖤
Шлю вам открыточку от mushroomova и светлый (не очень) лик автора.

Надеюсь, получится сегодня отметить последним постом про DeepL и лингвомемами, но это не точно, потому что на дворе пятница и вечером автора ждёт электричка в лес.
11
внеочередные #lostinмемы
прекрасное из юиксового
😁2
Forwarded from Адовый UX
Кажется, это целый жанр
😁7🤣2🔥1
Финалочка про DeepL снова немного откладывается, потому что на этой неделе админ в командировке
29 и 30 июня иду на Saint TeamLead Conf в Питере преисполняться и набираться премудростей.
На всякий случай не буду ничего обещать, чтобы снова обещание не нарушить — но возможно тут появятся репортажные кружочки.

Из любопытного: на конфе будет доклад, близкий к теме техписательства. Называется “Люди текста” в IТ-команде: бриллианты в короне или заноза в заднице?. К названию у меня есть вопросы, но похоже на старый-добрый кликбейт — заинтересовать названием же получилось. По описанию мне кажется, что это будет рассказ о техписах на аудиторию разработчиков, и мне очень интересно послушать. Интересно же посмотреть на привычное другими глазами и узнать, что о нас думают уважаемые коллеги из смежных отраслей.
🔥4❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
В рубрике #lostinмемы сегодня не совсем лингвомем, зато актуалочка.

«Техпис и правки», короткая трагедия в одном акте без антракта. Смотрите со звуком, но звук nsfw.
😁9🤣2