Рубрика #анонсы: 15 июня Smartcat проводит онлайн-конференцию LocTalk. В этом году она посвящена отношениям локализации и инструментов ИИ.
Что из докладов мне показалось интересным:
⁃ The AI Gold Rush in Localization, Stefan Huyghe
⁃ Trends in Post-Editing and LQA with the rise of Gen AI, Zachary Haitkin
⁃ Localization in Enterprises: Expanding the Sphere of Influence, Wada'a Fahel
⁃ Thinking Human: The Universal Language of Brand Building, Doug Zarkin
У меня нет каких-то особых ожиданий — кажется, что всё это может быть попыткой присоединиться к волне AI-хайпа. Даже в название первого доклада эта самая «золотая лихорадка» просочилась. Но я буду весьма рада, если после конфы у меня получится поменять своё мнение)
Регистрация бесплатная. Конференция проходит на английском, время выступлений указано по Тихоокеанскому летнему времени (UTC-7).
Что из докладов мне показалось интересным:
⁃ The AI Gold Rush in Localization, Stefan Huyghe
⁃ Trends in Post-Editing and LQA with the rise of Gen AI, Zachary Haitkin
⁃ Localization in Enterprises: Expanding the Sphere of Influence, Wada'a Fahel
⁃ Thinking Human: The Universal Language of Brand Building, Doug Zarkin
У меня нет каких-то особых ожиданий — кажется, что всё это может быть попыткой присоединиться к волне AI-хайпа. Даже в название первого доклада эта самая «золотая лихорадка» просочилась. Но я буду весьма рада, если после конфы у меня получится поменять своё мнение)
Регистрация бесплатная. Конференция проходит на английском, время выступлений указано по Тихоокеанскому летнему времени (UTC-7).
Smartcat
LocTalk23 Conference
Get ready for LocTalk23, the highly-celebrated virtual event for localization and globalization teams
🔥4
lost in (tech)writing pinned «Привет всем! Канал у меня совсем свеженький, поэтому начать будет логично с чего-то вроде знакомства) Меня зовут Мария, и скорее всего (по состоянию на 6 июня 2023) вы читаете это после того, как посмотрели трансляцию/запись Techdoc Meetup #1. Я работаю…»
Почему мне нравится DeepL: часть 1
В приветственном посте я уже писала, что с большой долей вероятности вы читаете меня после митапа Techdoc Meetup #1. Но даже если и нет — это уже не так важно, я просто использую его упоминание как подводку к сегодняшнему тексту))
На митапе мне задали вопрос про то, какой движок машинного перевода кажется мне наиболее классным — и я ответила, что это DeepL. Сегодня хочу рассказать в двух словах, почему это так. И подвесить небольшую интригу — насчёт того, почему на самом деле я вас немного обманула. Но про это уже в следующей части: как это со мной бывает, я хотела написать пару слов и в итоге получила простынь, которую распилю на несколько постов.
Итак. Если ваша профессиональная деятельность не связана с переводом, велик шанс, что вы не слышали про DeepL и при словах «машинный перевод» скорее вспомните Google Translate. Или странные кринжовые переводы названий товаров с AliExpress — «телефон псу под хвост два ядра», «брильянты пять за доллар гордость предков», «костяшки чехол без коробку» и вот это вот всё.
DeepL же — инструмент, который справляется с задачами перевода гораздо лучше. Его главные достоинства:
⁃ Даёт редактировать перевод. Можно нажать на любое слово в готовом переводе — и выбрать альтернативный вариант.
⁃ Показывает что-то вроде словарной статьи для каждого слова перевода. Очень полезно, если нужно уточнить нюансы употребления.
⁃ Чаще выбирает варианты, близкие к речи носителей языка.
Всё это входит в бесплатную версию. В платной есть ещё некоторые фишечки — DeepL Pro умеет переводить целые файлы и хранить ваш личный глоссарий. Но Pro я не пользовалась, поэтому все дифирамбы пою в основном бесплатной версии.
Последний пункт моего списка, про близкие к естественной речи варианты, на мой взгляд — самое главное. DeepL очень хорошо подбирает формулировки: даже если в тексте есть неточности, в целом он как правило звучит более human-like.
А вот о том, почему он так хорошо с этим справляется — уже в следующей серии. Stay tuned!
В приветственном посте я уже писала, что с большой долей вероятности вы читаете меня после митапа Techdoc Meetup #1. Но даже если и нет — это уже не так важно, я просто использую его упоминание как подводку к сегодняшнему тексту))
На митапе мне задали вопрос про то, какой движок машинного перевода кажется мне наиболее классным — и я ответила, что это DeepL. Сегодня хочу рассказать в двух словах, почему это так. И подвесить небольшую интригу — насчёт того, почему на самом деле я вас немного обманула. Но про это уже в следующей части: как это со мной бывает, я хотела написать пару слов и в итоге получила простынь, которую распилю на несколько постов.
Итак. Если ваша профессиональная деятельность не связана с переводом, велик шанс, что вы не слышали про DeepL и при словах «машинный перевод» скорее вспомните Google Translate. Или странные кринжовые переводы названий товаров с AliExpress — «телефон псу под хвост два ядра», «брильянты пять за доллар гордость предков», «костяшки чехол без коробку» и вот это вот всё.
DeepL же — инструмент, который справляется с задачами перевода гораздо лучше. Его главные достоинства:
⁃ Даёт редактировать перевод. Можно нажать на любое слово в готовом переводе — и выбрать альтернативный вариант.
⁃ Показывает что-то вроде словарной статьи для каждого слова перевода. Очень полезно, если нужно уточнить нюансы употребления.
⁃ Чаще выбирает варианты, близкие к речи носителей языка.
Всё это входит в бесплатную версию. В платной есть ещё некоторые фишечки — DeepL Pro умеет переводить целые файлы и хранить ваш личный глоссарий. Но Pro я не пользовалась, поэтому все дифирамбы пою в основном бесплатной версии.
Последний пункт моего списка, про близкие к естественной речи варианты, на мой взгляд — самое главное. DeepL очень хорошо подбирает формулировки: даже если в тексте есть неточности, в целом он как правило звучит более human-like.
А вот о том, почему он так хорошо с этим справляется — уже в следующей серии. Stay tuned!
❤9
Несу вам пятничные #lostinмемы — короткий выпуск)
Хороших выходных 💙
Хороших выходных 💙
❤7🔥1
Почему мне нравится DeepL: часть 2
В прошлый раз я писала про то, что главное достоинство DeepL — его формулировки, близкие к натуральной речи.
Покажу на примере: возьмём знаменитую фразу «съешь ещё этих мягких французских булок, да выпей чаю» и прогоним её через DeepL и Google Translate (дальше для краткости я буду фамильярно называть его GT).
Версия DeepL: «Eat some more of those soft French rolls and have some tea»
Версия GT: «Eat even these soft French buns, and drink tea»
И тот, и другой в принципе выдают более-менее понятный и приличный текст. Но вот только DeepL вызывает лёгкое ощущение зловещей долины:
⁃ Откуда эта шайтан-машина знает, что «французские булки» в английском — это именно French rolls, хотя просто «булка» — именно bun, как ничтоже сумняшеся предлагает GT?
⁃ Как она понимает, что «ещё» — это some more, а не even, ведь речь про булки, а even приобретает значение «ещё» только перед прилагательными и наречиями в сравнительной форме, никак не перед существительными?
⁃ Почему она переводит «выпей чаю» не прямолинейным drink tea, а пугающе человечно звучащим have some tea?
Это точно движок машинного перевода, а не три переводчика в плаще, которых заставляют переводить на скорость?
И да, и нет. Секрет тут в том, что GT создавался как SMT (statistical machine translation)-движок. То есть, первоначально он работал по статистическому методу, и только 5 лет назад переехал на нейронку. А DeepL с самого начала создавался как нейросеть.
В следующей серии обязательно расскажу, почему эти два инструмента выдают такое разное качество, если по факту сейчас оба используют нейросети. Спойлер: дело во многом в материале и методах обучения.
В прошлый раз я писала про то, что главное достоинство DeepL — его формулировки, близкие к натуральной речи.
Покажу на примере: возьмём знаменитую фразу «съешь ещё этих мягких французских булок, да выпей чаю» и прогоним её через DeepL и Google Translate (дальше для краткости я буду фамильярно называть его GT).
Версия DeepL: «Eat some more of those soft French rolls and have some tea»
Версия GT: «Eat even these soft French buns, and drink tea»
И тот, и другой в принципе выдают более-менее понятный и приличный текст. Но вот только DeepL вызывает лёгкое ощущение зловещей долины:
⁃ Откуда эта шайтан-машина знает, что «французские булки» в английском — это именно French rolls, хотя просто «булка» — именно bun, как ничтоже сумняшеся предлагает GT?
⁃ Как она понимает, что «ещё» — это some more, а не even, ведь речь про булки, а even приобретает значение «ещё» только перед прилагательными и наречиями в сравнительной форме, никак не перед существительными?
⁃ Почему она переводит «выпей чаю» не прямолинейным drink tea, а пугающе человечно звучащим have some tea?
Это точно движок машинного перевода, а не три переводчика в плаще, которых заставляют переводить на скорость?
И да, и нет. Секрет тут в том, что GT создавался как SMT (statistical machine translation)-движок. То есть, первоначально он работал по статистическому методу, и только 5 лет назад переехал на нейронку. А DeepL с самого начала создавался как нейросеть.
В следующей серии обязательно расскажу, почему эти два инструмента выдают такое разное качество, если по факту сейчас оба используют нейросети. Спойлер: дело во многом в материале и методах обучения.
👍11
Финалочка про DeepL снова немного откладывается, потому что на этой неделе админ в командировке ✨
29 и 30 июня иду на Saint TeamLead Conf в Питере преисполняться и набираться премудростей.
На всякий случай не буду ничего обещать, чтобы снова обещание не нарушить — но возможно тут появятся репортажные кружочки.
Из любопытного: на конфе будет доклад, близкий к теме техписательства. Называется “Люди текста” в IТ-команде: бриллианты в короне или заноза в заднице?. К названию у меня есть вопросы, но похоже на старый-добрый кликбейт — заинтересовать названием же получилось. По описанию мне кажется, что это будет рассказ о техписах на аудиторию разработчиков, и мне очень интересно послушать. Интересно же посмотреть на привычное другими глазами и узнать, что о нас думают уважаемые коллеги из смежных отраслей.
29 и 30 июня иду на Saint TeamLead Conf в Питере преисполняться и набираться премудростей.
На всякий случай не буду ничего обещать, чтобы снова обещание не нарушить — но возможно тут появятся репортажные кружочки.
Из любопытного: на конфе будет доклад, близкий к теме техписательства. Называется “Люди текста” в IТ-команде: бриллианты в короне или заноза в заднице?. К названию у меня есть вопросы, но похоже на старый-добрый кликбейт — заинтересовать названием же получилось. По описанию мне кажется, что это будет рассказ о техписах на аудиторию разработчиков, и мне очень интересно послушать. Интересно же посмотреть на привычное другими глазами и узнать, что о нас думают уважаемые коллеги из смежных отраслей.
teamleadconf.ru
Единственная профессиональная конференция только для тимлидов 2023
Конференция для тех, кто хочет перейти на новый для себя уровень управления небольшими командами.
🔥4❤🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
В рубрике #lostinмемы сегодня не совсем лингвомем, зато актуалочка.
«Техпис и правки», короткая трагедия в одном акте без антракта. Смотрите со звуком, но звук nsfw.
«Техпис и правки», короткая трагедия в одном акте без антракта. Смотрите со звуком, но звук nsfw.
😁9🤣2