Makarov Media Lab
912 subscribers
916 photos
82 videos
9 files
647 links
Медиалаборатория Ивана Макарова
Аналитика и новости медиа-потребления

Заказать консультацию или задать вопрос: imakarovnews@gmail.com или @makkiivan
Download Telegram
Please open Telegram to view this post
VIEW IN TELEGRAM
ИИ читает спикера за секунды, угадывая успех выступления по первым фразам.
Модели GPT и Gemini оценивают научный доклад уже после 15–60 слов — и попадают в точку.
До сих пор сверхвозможности больших языковых моделей мы видели в «текстовом океане» — когда нужно осмыслить миллиарды слов. Новая работа Michigan State University показала, что те же модели не менее точны в микромире: по первым двум-трем предложениям (≈ 1-5 % текста, меньше полуминуты речи) они с корреляцией 0,7 предсказывают, как доклад оценят живые эксперты.
Иными словами, ИИ выхватывает те самые сигналы, по которым мы подсознательно решаем: «слушать дальше или переключиться». Это приближает к эмпирической проверке популярного «7-second rule» Роджера Айлза (авторы уточняют: точное число секунд условно) - популярный постулат о публичных выступлениях, ораторском мастерстве и деловом общении:

«Слушатели (или собеседники) составляют первичное и часто стойкое мнение о спикере за первые семь секунд после его появления».


Эти семь секунд включают момент выхода на сцену, первые слова, мимику, контакт глаз, позу и темп голоса - т.е. касаются в основном невербальной коммуникации. Авторы новой работы перенесли этот подход на вербальную коммуникацию, опираясь прежде всего на классическую «тонко-ломтевую» (thin-slice) линию исследований, начатую в 1990-е Натали Амбади и Робертом Розенталем (их эксперименты показали, что по 30-секундным беззвучным отрывкам можно с высокой точностью предсказывать оценки преподавателей студентами).

С тех пор на основе “тонких срезов” вырос целый корпус работ. Например:
• «speed-dating»: по нескольким секундам общения оценивали перспективу отношений
• микроданные невербального поведения на собеседованиях
• сигналы эмоций через невербальные каналы
• восприятие харизмы только по голосу (и шире - по акустике речи)
• мгновенные решения о доверии и компетентности по выражению лица
• как впечатления о спикере влияют на восприятие самого контента
Всё это - фундамент доказательства, что крошечные отрывки поведения и речи несут достаточную информацию о навыках, эмоциях и чертах личности.

Но лишь революция ChatGPT позволила применить подобный подход в языково-текстовом микромире (где нет ни голоса, ни внешности, а есть только стенограмма).

Как это делали:
• 128 докладов,
• 2 модели GPT-4o-mini и Gemini 1.5
• срезы размером 1-75 % текста стенограмм
• оценки моделей сравнивали с 60 экспертами - людьми

Что из этого следует для нас?
1) Золотое правило «зацепи аудиторию в первую минуту» получило эмпирическое подтверждение: если первые фразы скучны, дальше уже поздно спасать ситуацию.
2) LLM открывают дорогу к молниеносной, практически бесплатной обратной связи для преподавателей, политиков, учёных и всех, кому важно говорить убедительно. Соединяя идеи «тонких срезов» и возможности ИИ, мы получаем масштабируемый, надёжный и валидный инструмент, который поможет прокачивать публичные выступления и доводить их восприятие аудиторией до максимума (в пределах харизмы спикера).
3) А уж какая лафа ожидается в деловом общении с использованием презентаций и иных публичных выступлений (для клиентов, партнеров, инвесторов …)!

Вангую: очень скоро к LLM-анализу «тонких срезов» стенограмм добавится анализ тонких срезов аудио и видео выступлений (т.е. мультимедийный синтез всех каналов вербальной и невербальной коммуникации).

И тогда ИИ станет незаменимым инструментом для политтехнологов, спичрайтеров и имиджмейкеров.

А уж из совсем крышесносных перспектив - преодоление несжимаемости эволюционного опыта Homo sapiens.

#ВовлечениеАудитории #ИнтеллектуальнаяПродуктивность #LLMvsHomo
Два аспиранта без опыта в аудио за 3 месяца собрали нейросеть, которая генерирует речь лучше коммерческих сервисов!

Послушайте, как естественно она звучит и насколько точно следует указаниям вроде «со смехом» или «грустно». А ещё она создает целый диалог с несколькими голосами «за один проход» — быстрее и эффективнее конкурентов.

Мы уже привыкли, когда подобные модели анонсируют OpenAI, Google или Илон Маск. Эта нейросеть привлекла мое внимание именно создателями. Похоже, в сфере ИИ теперь такие мощные инструменты и так много публичных наработок, что пара умных ребят за месяцы смогут сделать то, на что раньше у богатых компаний уходили годы.

Наверное, наше время чем-то похоже на конец 19 века, когда в одной Америке было 1900 независимых автопроизводителей, и 1980-е, когда подростки собирали в гаражах персональные компьютеры.



Конкретно в сфере синтеза речи: нас ждут виртуальные дикторы и ведущие подкастов, которых не отличишь от живых. Ну и мошенникам, конечно, раздолье.

Модель открытая, работает даже на макбуках. Пока говорит только на английском. Примеры и сравнение с ведущими моделями, попробовать можно на hf, скачивать здесь.
Блин, прикольное оформление. Мне прям нравится
Скончался Вячеслав Варванин: директор по развитию той Lenta.ru, которой она никогда уже не будет

Сегодня, 29-го апреля, скончался Вячеслав Ильич Варванин - классный журналист, бесконечно творческий и бесконечно раздававший себя другим

Со Славой Варваниным я познакомился 19-го мая 2004-го года. Утром того дня я прочитал на Lenta.ru новость "Нужен экаунт-менеджер в дочерний проект Lenta.ru - Medportal".

Описание вакансии выглядело не страшным, хотя и непонятным, зарплата была фантастической для человека не из интернета (500 долларов), я написал.

Слава ответил: "Из вашего письма непонятно, что у вас с интернетом, но приходите".

Ещё через час, окуриваемый традиционно похмельным Славой традиционным беломором (в Ленте на перекуры никто никуда не выходил), я слушал инструкции о баннерах и обменных сетях установленных на Lenta.ru и Medportal.ru, обучался пользоваться шаблоном для создания тизеров и получал контакты менеджеров по обмену других изданий.

С тех пор я такой.

Общение со Славой никогда не исчерпывалось чисто рабочими отношениями (и бесконечно глуп был бы тот человек, который с ним бы только работал). В разные годы он был мне и начальником, и подчинённым, и лендлордом и арендатором, невыносимым попутчиком в дальних поездках и неиссякаемой душой компании.

В Ленте он, будучи в любимой роли "директора по развитию" и критиковал, и делал, и изобретал всё новые и новые проекты.

В Ридусе он делал и воплощал всё и с деньгами, и без денег.

Жизнь он и хорошо понимал, и относился к ней бесконечно наивно, задавая мне год назад вопросы вроде "А "Настоящее время" нормальный проект для работы?"

К сожалению, топливом для всего этого обогрева вселенной был алкоголь, проблему которого все знакомые Славы, и я, в том числе обсуждали с ним неоднократно.

"Да я бы и не против это всё пофиксить", - отвечал Слава - "но они же капельницу ставить будут, а иголок я боюсь до жути"

Буквально вчера я побеседовал с человеком, прошедшим рехаб, и живущим чисто уже три года. И хотел показать готовый материал Славе, с целью ещё раз покапать на мозги и заставить подумать о здоровье. Даже шутку придумал, в противовес традиционной отповеди про иголки - "Ну, от этого должны быть таблетки".

Таблетка не успела найтись.
Forwarded from Denis Sexy IT 🤖
Есть такой подреддит r/ChangeMyView: его правило простое - автор делится твёрдым убеждением, а комментаторы стараются аргументированно изменить его точку зрения; если у них выходит, автор награждает их ачивкой – «дельтой» (∆), что на сабе считается символом убедительности и интеллектуальной добросовестности

Благодаря жёсткой модерации и культуре вежливой полемики сабреддит давно служит «полигоном» для тренировки аргументации

Учёные провели секретный эксперимент на Reddit: они создали тринадцать аккаунтов-фейков с двумя координирующимися языковыми моделями на каждый аккаунт:

– Первая сканировала историю постов каждого оппонента, вычленяя вероятный возраст, пол, мировоззрение и эмоциональные триггеры

– Вторая, исходя из этого профиля, генерировала ответ, рассчитанный на максимальное изменение мнения

С ноября 2024 года боты оставили около полутора тысяч комментариев и получили более сотни «дельт» - свидетельств того, что авторы исходных постов действительно поменяли позицию. Для сравнения: среднестатистическому участнику сабреддита нужно в шесть раз больше попыток, чтобы добиться таких результатов

Эффективность объяснялась не только персонализацией - LLM «подстраивались» под стилистику Reddit, включая сленг («TL;DR» в начале, саркастические сноски в конце). При этом боты часто изобретали биографии: один позиционировал себя как «жертва изнасилования», другой - как «белая женщина в почти полностью чёрном коллективе», третий - как рядовой муниципальный служащий и тп – такие «галлюцинации» повышали эмоциональную убедительность

25 апреля 2025 года модераторы r/ChangeMyView обнародовали список подозрительных аккаунтов и черновик статьи «Can AI Change Your View?». Началась бурная дискуссия о границах этики: пользователи сочли эксперимент манипуляцией, университетская комиссия вынесла исследователям предупреждение, и теперь люди требуют изъять работу из публикационного процесса

В интернете будущего, нейронки будут спорить с нейронками, получается так
Шашлыки отменяются
Forwarded from Terra InMedia
Между тем Общественная коллегия по жалобами на прессу тут неделю назад приостановила работу на неопределенный срок "по административно-финансовым причинам". Некогда сей институт существовал на деньги Фонда президентских грантов, а его сопредседателем выступал соавтор закона "О СМИ" Михаил Федотов. Последняя рассмотренная коллегией жалоба была в феврале 2025 года и касалась публикации Forbes о миноритариях "Яндекса". В результатах рассмотрения Forbes порекомендовали, в частности, "иметь внутренний документ, устанавливающий четкие регламенты и правила профессионального поведения журналистов и редакторов в процессе поиска, сбора и обработки информации, подготовке публикаций, рассмотрении претензий аудитории и т.д."

Штошь, господа читатели. Больше жаловаться на СМИ вам некуда :)

P. S. Но если очень захочется, жалуйтесь лично мне
Forwarded from The Future Of Work (Evgeniy Volnov)
На NYT печальный лонгрид про людей поколения X (от 45 до 60 лет), которые мечтали и стремились делать карьеру в творческих индустриях (кино, музыке, медиа, журналистике), теряют возможности и работу.

Цифровая экономика так перекроила этот рынок, что там не осталось где работать. И это еще не учитывая AI.

https://www.nytimes.com/interactive/2025/03/28/style/gen-x-creative-work.html
В новом обновлении Telegram можно создавать групповые звонки на 200 участников, сообщил Павел Дуров.

Жду от медиа чего-нить этакое в видел марафона Дня Радио. Очень незаслуженно забытый функционал
Есть прям клевое желание сделать такую игру и по Дзену с ВК, вместе с Колей Афиногеновым
Forwarded from 42 секунды
CNBC: Выручка Reddit за Q1 2025 выросла на 61%

– Выручка за квартал выросла на 61%, составив $243 млн
– Чистая прибыль была $26,2 млн (год назад был убыток)
– Продажи Reddit за Q2 2025 должны быть $410-430 млн
– Торговые споры США и Китая не повлияют на компанию
– Показатель DAU за квартал вырос на 31%, до 108,1 млн
– Этот показатель был почти на 1 млн больше ожиданий
– Reddit получил выгоду из изменений поиска Google и др.
– Он получил приток новых и вернувшихся пользователей
– Глобальный logged-in DAUq составил 48,7 млн (+23%)
– Показатель logged-out DAUq вырос на 38%, до 59,4 млн
– Поисковый трафик пока может оставаться нестабильным
– WAU сервиса Reddit Answers теперь достигает 1 млн

@ftsec
IAB_Measuring-the-Digital-Economy_April_29.pdf
25.6 MB
Огромный отчёт о состоянии цифровой экономики от IAB.

Речь, конечно же, про Штаты, но можно посмотреть на тренды и для нас.

Например в Штатах на «авторов цифрового контента» работает 1,5 млн человек. Примерно столько же работает суммарно в amazon + apple + Alphabet + Microsoft + Comcast + Мета (запрещённая экстремистская огранизация). Это к слову о том, «чё там эти блогеры).

В конце идёт пара десятков страниц ссылок на источники исследований, что может тоже представлять большой интерес.
Как работать со страницей автора

Вообще, страница автора интереснейшая тема. Спортс меня прям тригернул. В РБК авторы очень хотели крутую страницу. С системой подписок, донатов, ачивки в духе достижениий на Плейстейшн. Даже заикались про рейтинг авторов в режиме лайв, где показывались бы лучшие ребята. Всем хочется славы. Плюс были помница запросы, чтобы эта страница была чем-то вроде визитной карточки, чтобы генерила холодные звонки в автора от новых спикеров.

В итоге сделали простой фильтр c списком публикаций, картинкой и должностью. Чисто под гугл.

EAT от Гугла как бы сам выступает фильтром и оценкой и просит от авторской страницы чуток больше, чем предлагает РБК.

Проблема этой страницы очень проста и банальна - она нужна в основном самим авторам, немножко издателям и чуть-чуть спикерам. Может быть, еще и компаниям, собирающим статистику. Пользователю и бизнесу эти данные фактически не нужны.

Но тема интереснейшая, тут можно придумать, как это поменять. Как расширить влияние этих данных на всё остальное.
В апреле это СМИ сделало почти 65 тыс публикаций за месяц. Чтобы закрыть такой объем новостей нужно около 70 новостников в сутки. Добавляем редакторов, добавляем бильдов. Добавляем ТК, так как людям все же как-то надо отдыхать. Добавляем редакцию смыслов, чтобы все таки какой-то объем эксклюзива был. Добавляем бэкофис, чтобы это все обслуживать. И получаем организацию в несколько тысяч человек. Чудесный мир сжатия пространства и времени...
Спрос на айтишников рухнул. Это не паника: количество открытых вакансий в сфере реально упало до исторического минимума по многим направлениям.

С конца 2022 года бигтех уволил больше полумиллиона человек, а новых ищут только в крайней нужде. Причин много: тут и спад выручки, и раздутые в период пандемии команды, и нейросети, которые отъедают всё больше рутинных задач.

Не так давно я как раз писал о переходе Дуолинго к концепции AI-first. В общем, начало положено. Дальше, говорят эксперты, людей в командах будет ещё меньше.