Кинотранс
507 subscribers
139 photos
2 videos
2 files
116 links
Алина, аудиовизуальный переводчик и редактор, полиглот, преподаватель. Рабочие языки — EN, IT, FR, ES, TR.

Вещаю о тонкостях локализации кино, закадре, субтитрах и нейросетях в сфере перевода. И о собаконьке.

Задать вопрос можно в личку канала.
Download Telegram
Пост для менеджеров: ищете специалист для работы с аудиовизуальным контентом?

В комментариях под этим постом переводчики, редакторы, тифлокомментаторы, субтитровщики и прочие повелители слов в аудиовизуальной сфере оставят свои контакты.🤩

Чтобы менеджерам было проще искать, а вам, коллеги, — презентовать себя, давайте оформим комментарии по единому шаблону:

🤩Как к вам обращаться:
🤩Контакты для связи:
🤩Рабочие языки:
🤩На какие языки можете переводить:
🤩Какие виды работ осуществляете:
🤩Какие тематики предпочитаете и умеете делать хорошо (совет: укажите узкие области, в которых вы сильны, типа медицины, военного дела, комедий, маркетинга и т.п.):


⚠️ Коллеги, оставление комментария не гарантирует трудоустройства! Но на моём канале есть представители студий и компаний по локализации контента, поэтому ваши контакты могут увидеть нужные люди. Поэтому призываю не флудить в этой ветке, чтобы контакты не терялись в куче комментариев.

⚠️ Менеджеры, размещение комментария не означает, что переводчик проверенный, и не является моей личной рекомендацией специалиста. Пожалуйста, проводите отбор кандидатов в соответствии с правилам вашей компании.
Please open Telegram to view this post
VIEW IN TELEGRAM
17🔥7👍1
Как запретить ИИ учиться на ваших данных (и ничего не запоминать про любовные отношения Сяолиней с Алпарсланами).

С выходом новенькой модели GPT-5.4 я полезла в статьи и нашла напоминание о настройке, которую ни разу не упоминала здесь. Сейчас упомяну, гатовсь!

Основная проблема использования ИИ при работе с конфиденциальными данными — это то, что модель на них учится и передаёт данные на серверы владельца. У американцев, например, есть истерический фикс на Китае, поэтому в статьях о DeepSeek они всегда триста раз напоминают, что коварная нейронка хранит свои данные на серверах китайцев. И злые китайские дети, закончив клепать кроссовки "Абибос" в тёмных китайских подвалах, бегут барыжить этими вашими данными, очевидно же. 😈

Сразу оговоримся: есть настолько чувствительные виды информации, что их попросту нельзя скармливать ИИ. От передачи данных мы никуда не денемся, этого можно избежать только если развернуть модель на своём же сервере и учить её разумному, доброму и вечному. Либо воспользоваться платными advanced-настройками для компаний — такая услуга у ряда моделей тоже существует. Вот вам прошлогодняя сводная табличка по опциям работы с конфиденциальными данными (там как раз в последней строке говорится, что самый безопасный способ — это работать без ансамбля, сам, бл*).

Но у нас с вами в работе не гостайны всё-таки. Для наших нужд есть настройки попроще. 😉

В ChatGPT можно:

🤩выключить функцию Model improvement — тогда ваши чаты не будут использоваться для обучения модели. При необходимости машинка будет опираться на то, что вы ей сами в чатах сказали.

🤩включить функцию Temporary chat — тогда нейронка не будет использовать данные для обучения и не станет опираться на уже известные ей данные из других ваших чатов.

В DeepSeek тоже не без того:

🤩выключив функцию Improve the model for everyone, вы запретите машине учиться на ваших данных.

Функции временного чата у китайцев нет, по умолчанию все ваши чаты сохраняются в истории. Можно их удалять по желанию. Но при беседах с самой нейросетью выяснилось, что она не опирается на ранее введённые данные. То есть если я просила вспомнить что-то из предыдущих чатов, она либо прямо писала, что не может, либо глючила, называя меня Сергеем.

Кроме того, есть совсем уж топорный метод:

🤩обезличить данные — убрать все имена, названия и специфические артефакты, которые выдают произведение. Долго, муторно, но если надо собрать документ на 70 страниц в ровную таблицу, то мне проще автозаменой пройтись, чем таблицу руками делать.

Конечно, есть специальные архитектурные решения для анонимизации данных. Но это уже какие-то высшие порядки. Не для сериалов, вышедших пять лет назад.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍157😁2
Причина задержки проекта — психанула

Тут как раз на прошлой неделе коллеги обсуждали, почему переводчики задерживают проекты. Так вот у меня в субботу практически случился нервный срыв при переводе, и я его задержала до следующего дня. И как только меня угораздило-то... Но таких мощных "Да твою же ж мать!!!" и желания швырнуть ноутбук из окна у меня очень давно не было. В чём же заключались секреты моего провала?

💀 Фильм на военную тематику — освобождение советской республики от нацистской оккупации. Взят по принципу "О, дают!". И совершенно зря.

🥺 Мораль: всегда, всегда брать только те тематики, которые тебе близки, в которых ты разбираешься, с которыми тебе не скучно работать.

💀 Из спикеров — юноша с патриотическим голосом, который говорил на адекватной скорости, но почему-то постоянно повторялся. Вдохновлённый темой дедушка, который жутко шепелявил, чем несколько затруднял вычленение кучи важных данных из своей речи. И гнууусаавая девааачка со странным говаааарком, которой зачем-то доверили читать отрывки из дневников и мемуаров. Она во второй части фильма ещё и тараторить начала, как умалишённая.

💀 Тыщи. Нет, мильёны! Всевозможных локаций, имён, реалий. Безумные для субтитров "2983427-ая армия 189237276 -го Энного полка" или "командующий генерал такой-то армии такого-то и такого-то полка Отто Карл Ганс Франкенштейн Генрих фон Пфайфер Убер дер Шлюнген Румпельштицхен!". Абсолютно все названия пришлось перепроверять — даже созданный автоматически глоссарий под проект меня не спас, и там появлялись несуществующие реки, сёла, города и люди.

Возник вопрос, насколько эффективна автоматическая работа с глоссарием в таких случаях. Ведь я специально его составляла с функцией Deep Thinking.

💀 Никто ни на минуту не затыкается. Всё настолько плохо, что я неоднократно думала: "Господи, да когда ж оно кончится-то". А ТК при этом менялся на 10 секунд, а не на 10 минут.

💀 В конце я уже прекрасно понимала, что я вот тут в лепёшку расшибаюсь, а смотреть это вообще никто и никогда не будет. Только в России и нескольких бывших союзных республиках сохраняется пиетет в отношении Второй мировой. Я перевожу это всё на английский — ну кто в здравом уме будет смотреть такое с субтитрами? Историкам проще пойти в архивы. И я в жизни не встречала иностранцев, которые бы поминутно и досконально разбирали бы каждое сражение Второй мировой на территории СССР. То есть понимаете, да? Я работаю и осознаю, что это всё впустую.

В итоге сдавать проект я шла вот так:
Please open Telegram to view this post
VIEW IN TELEGRAM
😭276😢5🤯1
Любителям триллеров посвящается

Я тут в последние две недели прочитала два очень крутых триллера и несу вам названия. Любители жанра точно заценят!

1️⃣Алекс Михаэлидес, "Безмолвный пациент"

Начало классическое — гроб, гроб, кладбище! Есть подозреваемая, которая вдруг замолкает, и её упекают в психушку, потому что ну а чего она такая вся загадочная. Точно, значит, убила! Такое развитие событий мы уже видели не раз — например, в первом сезоне сериала Sinner. И ровно точно так же в книге находится добрый дяденька (в нашем случае психиатр), который вызывается разговорить молчаливую подозреваемую и выяснить, что же там на самом деле произошло. Вроде бы всё стандартно, но в какой-то момент случается ВОТ ЭТО ПОВОРОТ (тм), и ты до конца книги обтекаешь, удерживая отпавшую челюсть.

2️⃣Лэй Ми, "Профайлер"

Ну мёд, ну медятина! Главный герой — студент, который изучает криминологию и профайлинг. Тоже вроде бы всё стандартно — юный гений, переживший личную драму, нелюдимый, но умный до чёртиков. Сначала нам скармливают пару историй для затравочки, а потом дают основной пласт событий, и вот там, конечно, всё как мы любим. В отзывах не врали: описания убийств тошнотворнейшие, потому что маньяк иначе работать и не может. Главному герою приходится искать этого маньяка, опираясь на свои пока ещё скромные знания профайлинга. Учитывая, что автор книги и сам преподаёт криминальную психологию, все описания как найденных тел, так и логических умозаключений героя выглядят пугающе достоверно. В конце, правда, немного скомкан сюжет на мой вкус, но книга всё равно оставляет тебя с чувством "Едриииить твою мать, вот это псих".

Личный камушек в огород переводчика — перепутанные судмедэксперты, патологоанатомы и криминалисты. Причём где-то они правильно названы, а где-то нет. Но в целом перевод хороший, я не особо спотыкалась о китайские реалии. Если переводчик решал сохранить ту или иную реалию, то были полезные сноски, которые не мешали восприятию на слух.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1153
Сегодня произошло эпохальное событие!

Полтора года спустя, после многочасовой борьбы и поиска людей, я наконец-то получила свой испанский диплом, который, как можно видеть по дате, мне полагалось получить ещё в прошлом году. А если совсем уж по-честному, то в 2023 году. Когда я универ закончила. 😒

Несколько фактов об этом уникальном пути, который наконец-то завершился:

➡️ Я училась на программе, посвящённой исключительно аудиовизуальному переводу.

➡️ Это программа самого университета — не магистратура в нашем понимании, а курс, за который я получаю кредиты и теоретически могу потом куда-то их приписать. Но мне это было не нужно.

➡️ Обучение на испанском. В октябре было начало семестра, в феврале я начала учить испанский. Буэнас, так сказать, диас. Но лекции я спокойно понимала.

➡️ Русского там нет. Я выбрала перевод с итальянского на английский. Некоторые мои лекции были на итальянском, а задания я все делала на английском. Проверял их вроде как носитель.

➡️ Было очень интересно помочить ножки в европейском АВП. У них совершенно другие взгляды и стандарты вообще на всё.

➡️ Подход к субтитрам странный: гайдлайнами Нефткликса они пренебрегают. Для SDH была очень весёлая работа с раскрашиванием субтитров — у меня потом долго рябило в глазах.

➡️ Отдельно убил дубляж, в котором есть куда больше специальных меток, чем у нас. То есть соотношение "перевод — пометы" там чуть ли не 40 на 60.

➡️ Очень крутой курс по тифло, прям конфеточка! Не знаю, что там сейчас, потому что преподавательница ушла из вуза. Но это очень крутая итальянка, которая давала интересные примеры.

➡️ Мне очень понравилось, что давали посмотреть разное ПО. Некоторые программы были очень удобны в использовании. А некоторые — платные, и универ давал к ним доступ.

➡️ За практику мне засчитали работу с одним из моих клиентов (я запрашивала соответствующие документы). В результате мне нужно было только написать диплом. Я сначала было взялась за итальянские диалектизмы, а потом махнула рукой и взялась за проектный менеджмент.

➡️ Поскольку учиться я начала в 2021 году, закончить полагалось в 2022. Но начались всем известные события, и я поняла, что мне с этого курса уже никак не выйти на зарубежных заказчиков (хотя вуз такую опцию предлагает). Мотивация упала, я надолго бросила занятия. Но потом решила вернуться, оплатила дополнительное время и выпустилась летом 2023 года. Правда, из-за прокрастинации и "да зачем мне это" диплом я в итоге писала в последний день. 🫢

➡️ Потому что почему? Потому что мне, в отличие от других ребят, уже много лет, во-первых. Во-вторых, на момент учёбы уже было 10+ лет опыта в АВП. И в-третьих, в проектном менеджменте я тоже плотно работала. Так что я нашла гору источников и реально за один день написала вполне себе хорошую работу, взяв за основу рабочий проект. Оценили моё словотворчество высоко. Но правила к оформлению были строгие, ни одной лишней запятой и неуказанного источника.

➡️ А, да. Я училась с кучей студентиков и была в итальянской группе с одними итальянцами. Все очень удивились, когда преподавательница тифло на одной из лекций сказала: "Ну, мы тут с вами все из Италии, да?". А я сообщила, что нет. 🥲 Впрочем, итальянский на тот момент у меня был крепкий С1, я вообще не чувствовала никакого дискомфорта в учёбе.

Короче, слава богу, что я всё! Но вот эта "донья" в испанских документах меня уже второй раз поражает в самую печень.

Дипломы они выдают гигантские — формата А3, отчего были опасения, что в сносном виде он до меня не доедет. На второй фотке приложила вам список дисциплин на обратной стороне. :)
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1🔥39👏1163
Я что-то немножко шокировалась.

Не то чтобы я сообщу что-то сверхъестественное, я это подозревала, но до конкретных цифр не доходила ни разу. И с математикой у меня из рук вон плохо. Но всё же.

Есть скрипт кина. Надо его перевести и сделать субтитры. А дальше следственный эксперимент...

💭 Если заказывать перевод стандартному подрядчику, который считает стоимость по словам, то ценник перевалит за 120к. Без укладки. Просто перевести.

🎞 Если заказывать перевод с укладкой у АВП-компании, то стоимость будет едва ли 40к.

Да, конечно, можно возразить, что в кино могут молчать по две минуты, и что вообще-то в АВП мы не текст переводим, поэтому считать слова — это совершенно глупо. Но я вот случайно посчитала по просьбе коллеги. И убедилась, что в АВП ты делаешь куда большую работу за куда меньшие деньги: объёма переводишь на 120к, отсматриваешь "пустые" минуты и кладёшь это всё по стандартам.


🔤 За всю карьеру мне только одна компания доплачивала за плотность речи. То есть теоретически субтитры могут стоить дороже, если заказчик решит, что плотность речи высокая, и докинет рублей 10-20 за минуту. Однако до 120к это всё ещё не дойдёт.
Please open Telegram to view this post
VIEW IN TELEGRAM
😢32😱118💯5
У кого пятница, а у кого час занудства! 🤓

Пост будет особенно полезен студентам.

В соцсетях широко разлетелся пост учёного Пола Спикера, который показал нейронке свою работу, написанную в 1981 году, и нейронка определила её как сгенерированную на 77%. Выше — скриншот из соцсетей Пола.

Как видите, он объясняет такой результат тем, что машина сравнивала конкретную работу с другими работами, написанными позже.

А я тут как раз на досуге почитываю исследование, посвящённое оценке инструментов-детекторов, которые выносят вердикт касательно того, сгенерирован текст машиной или же написан человеком.

Кратенько: все эти инструменты, даже платные, абсолютно бесполезны. Все! В большинстве своём они выдают false-positive- и false-negative-результаты, а малейшая обфускация (лёгкая редактура или перифраз) напрочь сбивает их с толку. И как грустно, что в университетах антиплагиат считают эффективной мерой...

Чуточек деталей:

💬 Если человек переводит текст на английский, то правильность перевода достигает 96%. А если иностранный текст перевести на английский машинкой, то показатель accuracy падает до 78%. Потому что машинка оставляет следы работы ИИ, даже если изначальный текст полностью написан человеком.

❇️Мораль: если вам в работе нужно использовать перевод чьих-то слов, переводите их сами, а не машиной. Антиплагиат расценит это как текст, написанный человеком.

🤯 Простая замена текста на синонимы всё ещё вводит 50% инструментов для оценки текста в заблуждение. И если человек видит, что предложения синтаксически одинаковые, то машина — не видит и считает это двумя разными предложениями.

❇️Мораль: машина даёт вам черновик. Сделайте предложения длиннее и синтаксически разнообразнее, замените слова на синонимы — и вот уже антиплагиат считает, что вы гениальный автор. Я не призываю делать так в серьёзных работах. Это плохо и противоречит здравому смыслу. 🙌 Но я знаю, как страдают студенты от перегруза, например, рефератами по физкультуре (sic!), учась при этом на факультете, никак с физкультурой не связанном.

🗽 Удивительное дело, но функция Humanizer (то есть "очеловечивание" текста) работает. Опытному редактору такой текст будет казаться шизофазией, зато детекторам будет норм — показатель accuracy падает до 26%. Это означает, что машинка считает текст написанным человеком.

В общем, антиплагиат — шляпа и чушь петровна. Свои работы нужно писать самостоятельно, потому что в этом их ценность. А бумажки, которые нужны упрямому преподу для галочки, и которые он даже не откроет, можно составить так, что ни один антиплагиат не подкопается.
Please open Telegram to view this post
VIEW IN TELEGRAM
17🤔1
Итоги недели такие, что будь у меня ещё и в АВП-проект, я бы, наверное, не спала вообще.

Фильм — уложила. Встречу по поводу дальнейших шагов провела. Теперь ждём редактуру от студии на согласование, пишемся, и потом я ещё буду увлекательно класть к этому всему субтитры, потому что коллеги хотят заявлять этот фильм на фестивали. Всё думаю, можно ли попросить в титрах указать нас с носителем, или это сочтут хамством. 😊

Титры к фильму — перевела. Попутно выяснила, что в компании произошла переоценка ценностей, и привычные должности стали называться как-то очень уж экзотично. Долго думала, записывать белоруса по правилам транслитерации русского или белорусского... Потому что в рабочих документах он транслитерируется по-белорусски.

Субтитров для отдела обучения — сделала аж 12 видеороликов. Ужасная задача: спикер делает паузы и мямлит, предложения надо кромсать. У меня IQ упал показателей на 50, клянусь. Предложила писать спикерам сценарии, иначе слушать это категорически невозможно.

Ну а теперь что? А теперь у меня отпуск начинается!

🌿🌿🌿🌿

Поэтому самое время обсудить обучение. Коллеги, кто какие курсы сейчас проходит? Или, может, учится на какой-то долгосрочной программе? Я хочу куда-нибудь записаться, но никак не могу выбрать. Интересны переводческие, киноведческие и редакторские программы/курсы.
Please open Telegram to view this post
VIEW IN TELEGRAM
23
Как розыгрыш укладки привёл к минутке занимательной фразеологии 👌

На моём канале сложилась маленькая традиция. Каждое первое число нового сезона я провожу розыгрыш — обычно предлагаю редактуру, а на этот раз предложила укладку и личный созвон вместо письменного фидбека. Разбор выиграла Софья, у неё, кстати, есть свой уютный канал.

Софью я уже давно знаю — мы вместе работали на проекте, и я редактировала её переводы. То были первые шаги, и Софья быстро училась на ходу. Для разбора она попросила что-нибудь на испанском, и я поняла, что у меня есть подходящий кандидат на этот челлендж.

Выбор пал на сериал La Casa de Papel — испанский экшен, в котором испанцы тараторят со скоростью 200 слов в секунду, и такое поди ещё уложи. Я взяла отрывок из самого первого эпизода: в одной части идёт достаточно медленная речь, а во второй — очень динамичный диалог с шутками-прибаутками.

На созвоне мы сначала пробежались по тексту и устранили мелкие недочёты (например, при переводе очень сложно отловить момент, когда у тебя получились стихотворные предложения, или три слова подряд начинаются с буквы "б"), нашли один недочёт посерьёзнее (ох уж эти шахты/мины — поймали нас на ложном друге).

А потом начали читать перевод вслух. И вроде бы всё лежало, но нет-нет, да и получался хвостик. Это мы всё благополучно устраняли, пока не дошли до самого интересного момента.

Оригинал:
— Si un payo a punta de pistola entra con una careta de Mickey Mouse, a cualquier lado, le peña pensará que está colgado, que liará una carnicería. ¿Sabes por qué? Porque las armas y los niños son una cosa que no se juntan nunca, papa. ¿Sí o no?
— Visto así, sería más peligroso, más retorcido.
— Entonces una careta de Jesucristo acojonaría más, es más inocente.
— Por eso dice que pega menos que a un Cristo dos pistolas.
— Como a un santo dos pistolas.


Софья перевела так:

— Но я же прав. Судите сами. Если куда-нибудь ворвётся псих с пистолетом наперевес и в маске Микки Мауса, все тут же решат, что он спятил и сейчас начнётся мясо. А всё почему? Потому что оружие и дети — вещи несовместимые, папа. Так или нет?
— В этом плане — да, было бы более зловеще. Более жутко.
— Взяли бы маски Иисуса, чтоб наверняка. Он сама невинность.
— Как говорится, кто станет стрелять в Иисуса Христа?
— Вообще-то так не говорят.


И попала в классическую ловушку фразы "Как говорится". Как и где говорится "Кто станет стрелять в Иисуса Христа"? В те годы пистолетов-то ещё никто не придумал. Более того, дальше другой персонаж поправляет говорящего, то есть нам явно нужна хоть сколько-то достоверная фраза, чтобы это исправление выглядело логичным. Опускать не хочется: поправляющий парень по сюжету умник и небольшой зануда, переводим мы первый эпизод, нам нужно задать тон на все последующие серии.

В итоге я задумалась: а не является ли эта фраза с Христом идиоматичной? И действительно!

como a un cristo dos pistolas — muy mal o de manera inadecuada o impropia. Usada en sentido ponderativo.


Почти аналог нашего "ни к селу, ни к городу" и прочие менее приличные версии с упоминанием телесного низа и Красной Армии.

В нашем контексте не сыграет, надо слегка изменить, тем более что перед этой фразой вполне уместное "Взяли бы маски Христа". Мы подумали, и вот что у нас получилось:

— Взяли бы маски Иисуса, чтоб наверняка. Куда невиннее!
— Как говорится, кто первый бросит камень…
— Вообще-то там не про это.


То есть мы:
🤩 сделали отсылку на Библию;
🤩показали, что человек, который говорит про камень, не в курсе, в кого этот самый камень бросали и почему;
🤩сделали так, что он своим незнанием прямо напрашивается на то, чтобы его исправил главный ботан и зануда.

По-моему, круто получилось. Хоть мы и отошли от укладки. 😂

🔤 Следующий розыгрыш — 1 июня!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥26👏54
"Мы всё сделаем с помощью ИИ, а вы поправьте". 😠

На той неделе у меня состоялся пренеприятный диалог с человеком, который уверен, что ИИ может выдать чистовик поста, предназначенного для публикации вовне, а редактору останется только опечатки убрать и "почистить флёр ИИ". А в переводе я регулярно вижу предложения перевести всё нейронкой, а потом просто подредактировать, "а чё, там же уже всё готово будет".

Я не понимаю, почему люди начали повально считать, что машина может за них думать. Ряд задач ИИ выполнять не может физически. Не потому, что тупой. А потому, что это машина, алгоритм. Взять хотя бы АВП:

➡️ ИИ не умеет понимать иронию, сарказм, шутки и игру слов. Видя текст, машина работает на основе предсказания следующего токена в семантическом пространстве. То есть она анализирует контекст, и очень широкий. Но думает над текстом о сцене, а не о самой сцене — мультимодальность нейросети недоступна. А кино — искусство мультимодальное.
Если сарказм маркировать пунктуационно (что так себе идея, но хоть что-то), ИИ ещё может попытаться его считать. Но если сарказм дан без явных маркеров, то с вероятностью 80% ИИ выберет прямое значение слова. Он не видит интонации, закатывания глаз, воздушные кавычки и тому подобное.

➡️ ИИ не умеет делать укладку. Тем более липсинк. Да, для этого можно разработать промпт — я пробовала. Но вы заколебётесь писать длинную инструкцию на каждое предложение, а потом вносить миллиарды правок — быстрее уложить всё вручную.

➡️ Культурные реалии — мимо. ИИ может попытаться их объяснить, но переводить будет в лоб, калькой. Или предлагать совсем уж дикие варианты.

➡️ Если пытаться привлечь ИИ на многосерийный проект, он начнёт путать терминологию. Да, кастомные инструкции, настройки проекта и подгрузка глоссария могут помочь, но в какой-то момент от перегруза нейросеть начнёт сбиваться. А если пытаться её исправить, то она уйдёт в фантастический трип, и милосерднее начать новый диалог.

Так что в АВП нейронка в первую очередь помогает с тайм-кодами, таблицами, глоссариями, чисткой шумов, распознаванием формата и расшифровкой текста. Иными словами — только технической составляющей.

Что касается писательства и редакторской работы, то я при обучении ИИ-ассистента ни разу не видела, чтобы он выполнял промпт безошибочно с первого раза. Всегда будут какие-то упущения, а если просить машину проверить её же текст, то она будет его перекраивать до бесконечности. Поэтому тут нейронка — это про черновики, намётки, скелет текста. Всё мясо, фактуру и необходимые фишки нужно добавлять уже человеку.

С преподаванием ИИ очень помогает, избавляя меня от многочасовых написаний заданий, и студенты регулярно говорят, что домашка была интересной. Правда, для того, чтобы она была интересной каждому студенту, мне нужно написать промпт длиной в хороший такой рассказ, применив массу теоретических знаний. Но и тут я уже придумала стратегию, создав ассистента под каждого человека. Думаю попозже немного подробнее об этом рассказать.
Please open Telegram to view this post
VIEW IN TELEGRAM
128👏7💯42👍2
У меня сегодня день рождения 🥳

Экая напасть приключилась! Жили — не тужили, а тут цифры поменялись, и я стала на год ближе к пенсии. Учитывая, какая я бабка в душе, пожалуй, стоит радоваться: я ещё на шаг ближе к социально одобряемому брюзжанию 24/7.

За прошедший год случилась куча всяких полезных вещей! А уж сколько бесполезных! Например, я завела этот канал, и вас тут почти 500 человек — это ж просто офигеть, как круто. Спасибо, что читаете мой нудёж!

Я отредактировала больше сотни всяких сериалов. Перевела — вообще не счесть сколько всего. Впервые в жизни начала переводить с турецкого и попробовала, что такое китайские сериалы, где мужики в халатах летают с одухотворёнными лицами, все шутят, но тебе почему-то не смешно.

Наладила работу с аудиовизуальным контентом внутри своей основной компании: с одним отделом мы теперь работаем очень плотно, ещё один о нас теперь хорошо знает и потихоньку носит свои материалы. И третий вот принёс нам фильм. Которым я ещё надеюсь всенепременно похвастаться. Хочется верить, что среди этого всего я отрастила ещё немного ПМского дзена, но это вряд ли, я по-прежнему иногда хочу всех обнять до хруста в шейных позвонках.

На новый свой год даже загадывать что-то страшно, если честно, учитывая последние тенденции. Пусть будет без потрясений, что ли. 🍺

(сказала Алина в последний день хоть какой-то работы Телеграма)
Please open Telegram to view this post
VIEW IN TELEGRAM
132🥰10🔥8👍1
Как доставить непередаваемое удовольствие переводчику, простое и краткое руководство:
👏20🥰16🔥5💯5
У нас продолжается череда дней рождений — на этот раз пятилетие отмечает цензор этого канала, гарант моего душевного спокойствия, главный разоритель моего кошелька, булочка сладкая, собака, без которой я бы не туда, не сюда, не этого и не вот этого!

Целых пять лет, с ума сойти. Пол собачьих жизни! Только я забрала этого пушистого террориста от заводчицы. Только их величество сожрали ножку журнального столика в первые часы пребывания в моей комнате, украли все мои носки и монополизировали три моих одеяла. А уже вон какая взрослая цаца сделалась! И кто кого теперь воспитывает — большой вопрос. 😁

🔤 Сегодня у нас ещё продолжаются праздничные гуляния. Но вечером или завтра с утречка я вам расскажу о кошмарном кошмаре — фильме, написанном ИИ, начитанном ИИ и сгенерированном, по ходу, тоже ИИ. Кто это должен смотреть, я так и не поняла. Но перевела на человеческий.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
34🥰11🔥71
ИИ-документалка — ничего тупее в жизни не видела. Даже микродрамы на фоне этого выглядят как серьёзное кино.

Да, да, я знаю, что сейчас умудряются целые сериалы и полнометражки клепать в ИИ, но я всё ещё не понимаю, кто это будет смотреть.

Итак, мне на перевод пришла документалка. Казалось бы — ничего такого, небольшой фильм, начитанный одним диктором, всё чинно-благородно. Но в первую же минуту я поняла, что там что-то не так. Прислушалась.

А он начитан ИИ. Причём нейроозвучка сделана настолько некачественно, что там половина слов неправильно произнесена, грамматика хромает, а произношение! такое! будто! машина! в каждом! слове! очень! удивляется!!! При этом звучит она на удивление монотонно — нить повествования ты теряешь примерно сразу же, поскольку интонационный рисунок предложения сбит, и ты уже не можешь адекватно это воспринимать. А учитывая отсутствие грамматики и тот факт, что каждое предложение начинается с "And!"... Короче, я через 20 минут просмотра вырубилась и проснулась в 10 вечера с полным непониманием, где я, и отрёкся ли уже Николай II от престола.

Видеоряд там тоже достойный. Представьте несколько сотен стоковых фото, которые оживили. Вот так оно и выглядит. Выхолощенные лица, кабинеты, компьютеры, учебные классы, картинки-картинки-картинки. То есть визуальной составляющей нет — мелькают стоковые фотки. И звукоряда нет — робот неправильно начитывает английский текст, иногда даётся явно сгенерированная музыкальная отбивка.

Один вопрос — для кого это снято? Оно даже на фон не годится из-за того, что звучит неестественно. По сравнению с таким контентом даже брейнрот с тралалело-тралала имеет какой-то смысл. Очень надеюсь, что документальное кино в такое не скатится. Ценности никакой совершенно. Я переводила документалку на эту же тему не так давно, и она состояла из интервью экспертов. Вот там были хотя бы какие-то точки зрения, дискуссии, факты. А тут...

Из интересного:

😳 Текст не вычитан человеком. Предложения там максимально, простите, но всратые, иначе это не назвать. Границ между ними нет, одно предложение может занимать строчек семь, и связано оно чисто причастиями и пресловутым "AND!!!". Если переводить как есть, то получится нагромождение отглагольных существительных и причастных оборотов. Единственный выход — ломать и приводить в нормальный вид, щедро сдабривая глаголами.

💡 Думаю, на таких материалах можно учить начинающих АВПшников, которые пока не умеют работать с псевдоустностью. Я бы добавила этот нейрошлак в блок про перевод документального кино — ведь явно такое будут присылать всё чаще, как бы мы ни противились.

💣 В каждом предложении минимум две ошибки в произношении слов. Мне не очень понятно, почему создатели этим не озаботились. Даже у меня нейроозвучка получается ровнее для таких видео, а я отнюдь не гуру и не повелитель ИИ.

💡 Лайфхак для подобных случаев — чтобы машина не ошибалась в произношении отдельно взятых слов, ей нужна американская транскрипция. А если она не так ставит паузы, то можно разбивать сегменты, добавлять запятые и тире. Да, текст будет выглядеть неправильно и странно. Но читка будет идти ровно, как вам и нужно.

🤓 Так же, как и в обычных документалках, переводчику нужно делать тщательный фактчекинг (ну или уповать на редактора). Фильмы снимают медленно, реальность успевает поменяться, особенно если фильм про какие-то технологии. В итоге слова "новейший", "передовой", "последний/самый актуальный" могут стоять рядом с реалиями, которым уже сто лет в обед. Такие моменты уточняем у клиента — можно аккуратненько это всё обойти или заменить названия, чтобы новейший действительно был новейшим.
Please open Telegram to view this post
VIEW IN TELEGRAM
15😱7🤯3💯2😐1
Почему ИИ допускает галлюцинации в переводе и как от них избавиться

Коллеги Ольга Береговая и Алекс Янишевский выпустили интересную статью в мартовском Multilingual (пока закрыта пэйволлом, можно послушать начитку роботом тут).

Мне понравилось, потому что очевидные причины расписаны более техническим языком, но без математической нудятины. Я плохо воспринимаю технические тексты, поэтому тут мне было в самый раз.

Кратко поделюсь выводами. Причины глюков в переводах:

🔠 Несоответствие модели задаче

NMT — нейросети, заточенные на машинный перевод, могут обучаться на нужном языке. Они выдают действительно рабочий консистентный текст, и их можно доучивать и совершенствовать. Но они узконаправленные и широкого контекста не понимают. А вот привычные нам всем LLM заточены на всё подряд, и перевод для них — лишь одна из множества задач. Да, при переводе опираются на междисциплинарные знания и учитывают широкий контекст. Но именно из-за этого и начинают додумывать и глючить.

🔠 Проблемы с токенизацией

Машина переводит не слова, а токены. Токеном может быть что угодно — хоть знак препинания, хоть буква. Но в Азии-то иероглифы. И тут ИИ давится, даже если дать ему широкий контекст.

🔠 Неверная настройка температуры, то есть баланса креативности и предсказуемости

Чем выше температура, тем более рандомизированные токены берёт машинка. Перевод при этом может получаться более естественным, зато нашпигованным ошибками или не пойми откуда взявшимися деталями.

🔠 Плохой промпт

ИИ умеет понимать промпты с ошибками. И даже если у вас получилась нелогичная простыня, он может это как-то собрать воедино. Но вот разница в тоне и впихивание сразу нескольких сфер контекста (типа, искусство плюс строительство) могут привести к галлюцинациям и неконсисту.

Чем это всё лечить:

💊 Выбирать нужную модель под конкретную задачу.

💊 Снабжать машину широким контекстом. Для АВП — давать ссылки на Вики, статьи про нужных людей или реалии. Применять RAG — Retrieval Augmented Generation, то есть давать машине источники для самопроверки: ТМ, глоссарии, стайлгайды и всякое такое. Ну и включать DeepThink, чтобы она ходила сама себя проверять и предоставляла вам источники.

💊 Для серьёзных технических, медицинских и юридических текстов проводить автоматическую проверку на соответствие заданным правилам, а также автоматическую редактуру со сравнением оригинала и перевода по семантическому родству и лексической точности. И звать человека, конечно же, всё это верифицировать.

💊 Научиться нормально писать промпты. Прописывать машине конкретные условия: например, в техническом тексте велеть прямо писать "Я не знаю", если ИИ не находит соответствия термину. Последовательно и чётко описывать все правила и исключения. Тут я с авторами согласна — один мой рабочий промпт занял что-то вроде шести-семи страниц.

🔤 А ещё лично я развлекалась тем, что давала переведённый машиной и отредактированный мной текст на проверку другой модели. Она подсвечивала места, которые ей казались неудачными, и я их дорабатывала уже вручную. По-моему, это всяко интереснее back translation, которым баловались видные зарубежные бюро лет 12 назад.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1252🤨1
"Революционная новинка" от Iyuno/SDI

Честно скажу — когда я вижу слова "революционный" и "инновационный" в пресс-релизах, я хочу плеваться. Потому что в переводческой сфере это, как правило, означает, что компания придумала какой-то машинный воркфлоу, который сократит ей расходы на труд людей процентов на 10-30. Но после внедрения оказывается, что это всё фигня, а нахреноверченное надо как-то возвращать назад. За 15 рублей/минута.

Итак, Iyuno, которую многие коллеги знают как SDI, выкатила новый ИИ-инструмент CLOE. По заверениям пиарщиков, он должен действовать как интегратор в рамках рабочего процесса. Вот как описывают умения CLOE на данный момент:

CLOE captures and structures story context into a persistent memory graph that can be reused across localization, marketing, and interactive experiences. By establishing a single source of truth for the entire context of a program, it enables subtitles, dubbing, scripts, and marketing assets to be created more consistently and efficiently while reducing redundant work across teams.

CLOE is designed to support AI-enabled workflows while keeping human expertise central to the process, allowing creative teams to focus on performance, nuance, and high-value decisions.


Пока что мне это видится как обычное создание глоссария, если честно. Для АВП-команды это, конечно, полезно. Но есть некоторое подозрение, что раз там упомянут маркетинг, то, может, какие-то решения маркетинга сразу будут внедряться в предлагаемые названия, имена или отсылки, чтобы прогнозировать доход от рекламы. Учитывая российское законодательство, всё встанет враскоряку, и ПМов ждут интересные разговоры с представителями заказчика.

Графическое изображение, возможно, будет прикольно и удобно выглядеть, особенно если оно интерактивное. Но чем мешает обычная таблица? Мы на проектах прекрасно пользуемся таблицей с фотографиями и колонками с комментариями. Единственное, что можно улучшить, пожалуй, — это сразу придумывать переводы реалий/имён/мест под CPS субтитров, если проект предполагает адаптацию перевода под субтитры. Но в любом случае, я не так давно писала промпт на создание глоссария по скриптам, и обычный ИИ справился с задачей на ура. Вангую, что можно этот глоссарий скормить любой нейронке, которая делает картинки, и попросить создать живое интерактивное изображение. Типа шариков-персонажей с отмеченными взаимосвязями и всеми сопутствующими комментариями по клику.

Кстати, отдельный вопрос про скрипты — что же там придумали-то такое революционное? Писать скрипты машиной с разделением по спикерам? Это все уже и так давно умеют.

Последний абзац и вовсе воняет машинным переводом — пресловутое "мы тут всё сделали по нашим ИИ-глоссариям с использованием умных технологий, а вы проверьте".

А вот что было бы действительно круто:

🤩автоматические проверки внутри системы заказчика — чтобы не париться по поводу NDA и проводить все проверки на закрытой платформе.

🤩автоматическая проверка на соответствие глоссарию — чтобы избегать неправильного написания имён и неверного перевода реалий. Пусть такие сегменты подсвечиваются каким-нибудь цветом для ручной проверки: "Ден" или "Дэн", "скипетр" или "жезл".

🤩создание разметки/таблицы для актёров в автоматическим режиме там же, на платформе заказчика — чтобы три часа не думать, почему у тебя макрос не выполняется.

🤩в рамках воркфлоу для ПМ можно прикрутить фичу процентных соотношений — чтобы видеть, где редактор явно исправил больше половины текста, и чтобы отслеживать, что именно исправляется. Это поможет оптимизировать работу: доучивать или отсеивать авторов неудачных переводов, а также избегать чистой вкусовщины и редакторского произвола. Пока что всё держится на таблицах отзывов от редакторов, а можно сделать процесс оценки немного объективнее.

🔤 Iyuno подробно расскажет о CLOE только 19 апреля на мероприятии в США. Если честно, я очень сомневаюсь, что там будет действительно что-то революционное и уж тем более полезное. Но последуем заветам Николая Николаевича:
Please open Telegram to view this post
VIEW IN TELEGRAM
8🔥3👍1👀1
Как же приятно переводить монтажно-диалоговые листы в CAT-системе. Перевёл какой-нибудь там "НДП" или "Общ" один раз, и хоба — минус две тыщи слов от перевода, и progress bar сразу на пару процентов вырос. Если вы ещё не пробовали, рекомендую.

Я последний раз переводила МДЛ вручную несколько лет назад, и мне тогда даже в голову не пришло это всё автоматизировать, потому что как фрилансер я в принципе не имела дела с CAT-инструментами. Как-то не нужны были. А теперь вот очень даже пригодились.

Ещё из размышлений, которые в этом проекте не получилось реализовать, но теоретически можно было бы в следующий раз попробовать:

🌸 При наличии оригинала и перевода скрипта можно сделать их align в CAT-системе и подгрузить файл в проект. Все фразы героев в таком случае автоматом подставятся.

🌸 Альтернативный вариант: сгенерировать из оригинала и перевода таблицу в Экселе, конвертировать в .tmx и скормить CAT-инструменту.

🌸 Можно сразу внести в ТМ проекта всю терминологию по движениям камеры и стандартным сокращениям. Часть есть тут, а здесь — pdf с примерами и объяснениями. Все сегменты, которые содержат в себе только эту информацию, автоматически заполнятся.

В итоге переводчику (то есть мне) останется перевести только описания кадров. И переводчик (то есть я) будет довольный-предовольный. Возможно, все уже мильён лет так делают, но я впервые столкнулась и радуюсь. 😁
Please open Telegram to view this post
VIEW IN TELEGRAM
14