Forwarded from hello cyberkitty
Когда нейросеть ошибается, она становится собой
Есть, пожалуй, единственный более-менее надёжный способ понять, с какой нейросетью ты работаешь — если это не указано прямо.
Надо просто посмотреть, где и как она ошибается.
Правильные ответы у всех примерно одинаковы.
А вот ошибки — как отпечатки пальцев: свои, неповторимые, иногда гениальные, иногда пугающие.
Вот пример.
Есть старая, добротная модель для транскрипции — Whisper от OpenAI.
Открытая, простая, и почти все транскрибаторы работают на ней. (даже встроенная в телеграм расшифровка голосовых)
Если загрузить в неё тишину и попросить “распознать русский текст” — она начнёт выдавать нечто странное.
Сначала «Продолжение следует».
Потом — «Субтитры предоставил Дима Торжок».
Такой вот призрак из обучающего датасета.
Где-то в архивах интернета, вероятно, действительно жил этот Дима Торжок, добросовестно делавший субтитры.
И теперь его имя навечно вписано в машинную память, как цифровая подпись эпохи фанатских озвучек.
Происходит это из-за того, что модель не знает, что ответить.
Она хватается за случайные шаблоны из плохо размеченных данных — и выстреливает куском прошлого.
Недавно, кстати, у GPT-5 нашли похожие “фантомы”: при определённых триггерах она начинает цитировать китайские порносайты и казино🤣
Намедни я перевёл свой транскрибатор на новую систему — на мультимодальный Gemini.
Теперь это не классическая модель распознавания речи, а полноценная языковая модель, которая просто понимает звук и описывает его словами.
И, конечно, я не удержался и проверил: что она скажет на тишину.
И она сказала.
Каждый раз — одно и то же:
«В 1998 году, когда я был в Москве, я встретил одного человека, который сказал мне:
„Знаешь, я думаю, что в России есть два типа людей: те, кто верит в Бога, и те, кто верит в меня.“»
Я искал источник — не нашёл.
Ни цитаты, ни автора.
Просто голос, который говорит из пустоты.
Есть, пожалуй, единственный более-менее надёжный способ понять, с какой нейросетью ты работаешь — если это не указано прямо.
Надо просто посмотреть, где и как она ошибается.
Правильные ответы у всех примерно одинаковы.
А вот ошибки — как отпечатки пальцев: свои, неповторимые, иногда гениальные, иногда пугающие.
Вот пример.
Есть старая, добротная модель для транскрипции — Whisper от OpenAI.
Открытая, простая, и почти все транскрибаторы работают на ней. (даже встроенная в телеграм расшифровка голосовых)
Если загрузить в неё тишину и попросить “распознать русский текст” — она начнёт выдавать нечто странное.
Сначала «Продолжение следует».
Потом — «Субтитры предоставил Дима Торжок».
Такой вот призрак из обучающего датасета.
Где-то в архивах интернета, вероятно, действительно жил этот Дима Торжок, добросовестно делавший субтитры.
И теперь его имя навечно вписано в машинную память, как цифровая подпись эпохи фанатских озвучек.
Происходит это из-за того, что модель не знает, что ответить.
Она хватается за случайные шаблоны из плохо размеченных данных — и выстреливает куском прошлого.
Недавно, кстати, у GPT-5 нашли похожие “фантомы”: при определённых триггерах она начинает цитировать китайские порносайты и казино
Намедни я перевёл свой транскрибатор на новую систему — на мультимодальный Gemini.
Теперь это не классическая модель распознавания речи, а полноценная языковая модель, которая просто понимает звук и описывает его словами.
И, конечно, я не удержался и проверил: что она скажет на тишину.
И она сказала.
Каждый раз — одно и то же:
«В 1998 году, когда я был в Москве, я встретил одного человека, который сказал мне:
„Знаешь, я думаю, что в России есть два типа людей: те, кто верит в Бога, и те, кто верит в меня.“»
Я искал источник — не нашёл.
Ни цитаты, ни автора.
Просто голос, который говорит из пустоты.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3🥰2
Forwarded from fablasagna / ulsa 🐈💥
Media is too big
VIEW IN TELEGRAM
Мой стиль смирения с ситуацией - делать пуп на запись с видеорегистратора
😁1
Forwarded from Карго-анекдоты категории Б 🌴
Воспитательница ведет детсадовскую группу на прогулку. Внезапно на дорожку из кустов выкатывается ежик.
— Дети, кто это?
Детишки молчат.
— Ну, ребята... Я же вам про него столько рассказывала, столько читала.
Один ребенок неуверенно:
— Неужели это мессенджер MAX?
— Дети, кто это?
Детишки молчат.
— Ну, ребята... Я же вам про него столько рассказывала, столько читала.
Один ребенок неуверенно:
— Неужели это мессенджер MAX?
😁2
трёхвариантная оценка времени проекта предлагает дать три прогноза - на лучший, худший и ебучий случай.
🥰4
Нам на кафедру нужна пара сильных искусственных интеллектов - шкафы потаскать
Forwarded from Why is the Rum Gone?
Будет интересно только #математикам
Я неоднократно высказывал мнение, что начальный курс анализа сводится к двум теоремам: теореме Тейлора и теореме Стокса. Часто забываю при этом упомянуть, что теорема Стокса — про антисимметричные формы, а теорема Тейлора — про симметричные. Не уверен, что за этим стоит что-то фундаментальное; это просто мило. Но может, и стоит.
Я неоднократно высказывал мнение, что начальный курс анализа сводится к двум теоремам: теореме Тейлора и теореме Стокса. Часто забываю при этом упомянуть, что теорема Стокса — про антисимметричные формы, а теорема Тейлора — про симметричные. Не уверен, что за этим стоит что-то фундаментальное; это просто мило. Но может, и стоит.
🥰1
Forwarded from Пиарщик в тренде
Для понимания: столько же в год зарабатывают 3.2 миллиона кассиров в США. Это 274 миллиона каждый день, 11,4 млн долларов в час или 3,171 доллар в секунду. Если бы Маск начал получать эту сумму с момент рождества Христова, получилось бы по 56 тысяч долларов КАЖДЫЙ ЧАС.
@brandtrand
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3
Forwarded from Честный Путин
НУ ВОТ ХУЛИ РАНЬШЕ ИНТЕРЕСНОГО БЫЛО В ЭТОМ НОВОРОССИЙСКЕ?
ДВА ФОНТАНА, САНАТОРИЙ, ДЕСЯТОК КОРАБЛЕЙ, ЗАСРАННЫХ ЧАЙКАМИ.
СКУЧНО. ЗАСТОЙ.
А СЕГОДНЯ? ГРОХОТ, ВЗРЫВЫ, ОГОНЬ ДО НЕБЕС, КРИКИ!
ДЬВИЖУХА!!!
КАК ПОХОРОШЕЛ НОВОРОССИЙСК ПРИ МНЕ!)))
ДВА ФОНТАНА, САНАТОРИЙ, ДЕСЯТОК КОРАБЛЕЙ, ЗАСРАННЫХ ЧАЙКАМИ.
СКУЧНО. ЗАСТОЙ.
А СЕГОДНЯ? ГРОХОТ, ВЗРЫВЫ, ОГОНЬ ДО НЕБЕС, КРИКИ!
ДЬВИЖУХА!!!
КАК ПОХОРОШЕЛ НОВОРОССИЙСК ПРИ МНЕ!)))
😁1