Делай СМИ
40 subscribers
57 photos
1 video
43 links
Последние новости из области разработки, поддержки, продвижения и работы со статистикой сайтов СМИ. Студия ЯЛ - https://www.yalstudio.ru
Download Telegram
Forwarded from noindex, nofollow
Снова про Google Discover (куда уж без него, это действительно обсуждаемая тема в буржунете и важный канал для добычи трафика) от 1492.vision (всего в серии 4 поста).
Не ваш контент. Не ваша последняя статья. Вы как издатель. Оценка истории взаимодействия с вашим сайтом от 0 до 1 в профиле каждого пользователя. И эта оценка меняется с каждым кликом.

Discover — это не лотерея.
Google использует двойную систему оценки в профиле каждого пользователя:
1) оценка за каждую тему (каждая сущность в Графе знаний: человек, место, концепция, событие и пр.)
2) оценка по каждому издателю

Ваша статья появится в ленте, если в конкретный момент времени оба показателя в этом профиле будут достаточно высокими.
Иными словами, вы конкурируете не со всем интернетом. Вы конкурируете внутри каждого профиля пользователя, с издателями, чьи материалы этот пользователь уже читает по данной теме.

Каждый клик приносит вам пользу. Каждый не-клик обходится вам дорого.
Нишевые сайты показывают лучшие результаты в разделе Discover, чем сайты общего профиля.
Универсальный издатель, распыляющий свои ресурсы, не получает сильного рейтинга нигде.

Что действительно важно:
- тематическая согласованность
- качество заголовка и изображения
- регулярная публикация
- релевантность: статья, которую увидели, но не кликнули, может быть хуже, чем отсутствие статьи вообще
- специализация > универсальность
👍1😁1
Google Discover — это не один алгоритм, а система из 20 конвейеров (пайплайнов), каждый из которых отвечает за свой тип контента, скорость подбора, охват и позицию в ленте. К такому выводу пришли Сильвен Доре и Дэмиен Анделл (1492.vision), проанализировав 42 млн карточек в лентах сотен устройств за 3 месяца (дек 2025 - фев 2026).

Пайплайны не только отбирают контент, но и определяют, где он появляется.
Например, срочные новости и связанный контент — позиции 2–4 (верх ленты).
Вовлекающий контент и шопинг — позиции 6–8 (ниже).
Это архитектурное решение: срочные новости захватывают внимание наверху, а вовлекающий контент поощряет скроллинг.

Структура пайплайнов в разных языках одинакова, но их распределение и значимость кардинально отличаются.
🔥3
Анализ 40 подопечных новостных ресурсов показал падение трафика из Дзена на 20% в период январь-март 2026 года. Статистика того же периода 2025 года была более ровной и никакого падения не наблюдалось. Это касается и переходов с самого Дзена и посещаемости новостных каналов СМИ на Дзене.


Возможно это общий спад, но похоже, монополист решил «окуклиться», замыкая аудиторию внутри себя. Стратегия понятна: набрать критическую массу авторов и принудительно перераспределить охваты под свои задачи. Мой прогноз: скоро за привычный трафик медиаплощадкам придется платить. Эпоха «бесплатных» кликов из рекомендаций уходит в прошлое.
😁2
Из рабочих процессов: Чистка тысяч тегов на сайте СМИ — это сизифов труд. Мы провели эксперимент: решили сократить теговое поле с 15 000 до 14 000 позиций, просто объединяя дубли через плагин WordPress, главный аспет - работали вручную. Задача оказалась «суровой»: на удаление всего одной тысячи ушло 8 полных рабочих часов.

Чем глубже в архив, тем работа дороже и медленнее. Убежден: ручной перебор — путь в никуда, здесь нужны алгоритмы и ИИ. Однако автоматика лишь готовит почву, убирая явный мусор. Финальная редакторская правка все равно потребуется: только эксперт отличит смысловые нюансы, которые нейросеть может ошибочно слить в один кластер.
Forwarded from noindex, nofollow
Вскрытие SDK Google Discover: конспект доклада Артема Паклонского
Чтобы понять эти алгоритмы, перестаньте думать как SEOшник.

Передается от пользователя на серверы Гугла:
- информация об устройстве (платформа, версия ОС, язык)
- профиль интересов (куда кликал за 1/7/30 дней)
- уже просмотренные статьи
- телеметрия (действия и профиль пользователя, метаданные карточки) для обучения моделей

Передается от серверов Гугла пользователю:
- набор карточек
- рейтинг каждой карточки (score), определяющий порядок в ленте
- данные для сниппетов (ссылка, картинка, издание, текст-превью)
- срок жизни каждой карточки
- настройки A/B-тестов (в каких из ~150 участвует юзер)
- статус персонализации (Web&app activity и Discover personalization)
- расписание обновлений

В фиде содержится:
Panoptic - серверная система маркировки контент-пайплайнов
Source channel - код пайплайна, через который прошла карточка (например: 54 - геоновости, 95 - развлечения, 216 - YouTube)
Внутри каждого пайплайна свой алгоритм.

Приоритет извлечения:
Title: schema.org, og:title, twitter:title, HTML title
Image: og:image, twitter:image, og:image_secure_url
Publisher: schema.org. og:site_name, HTML author
Paywall: article:content_tier + isAccessibleForFree

Discover может скорректировать заголовок или полностью переписать его, а также убрать рубрики или название сайта.

Менять заголовок стоит в момент, когда трафик еще идет. Смена заголовка - это не кнопка буста, а скорее разблокировка, если изначальный заголовок не понравился Гуглу (Гугл знает паттерны, уменьшающие CTR и как только эти паттерны устраняются, показы возобновляются).

Существует клиентская индексация в дополнение к серверной, которая, к примеру, отправляет сигнал для обновления og:image при изменении или недоступности, а также обнаруживает paywall.

Есть флаг качества изображения; URL картинки не должен быть заблокирован в robots.txt

NAIADES - классификатор контента, который мэтчит entity MIDs пользователя и контента.

Лента в Discover'е делится на кластеры, формируемые на основе разных пайплайнов, через которые прошли карточки. Один и тот же материал может попасть в несколько пайплайнов сразу.
moonstone - главный пайплайн, смешанный контент
neoncluster - персонализированный
geotargetingstories - локальные новости
mustntmiss - breaking news с наивысшим приоритетом
trendingugc - трендовый пользовательский контент

pCTR (Predicted Click-Through Rate) - прогнозируемый CTR, ядро системы ранжирования Google Discover.

Длинный просмотр статьи - когда пользователь пробыл на ней >= 10 секунд.
Forwarded from noindex, nofollow
В завершение темы пайплайнов в Google Discover'е — статья Сильвена Доре и Дэмиэна Анделла.

Как до всего этого ребята дошли — скорее всего, реверс-инжиниринг .apk + сниффинг трафика приложения.
Лучше меньше да лучше:
"Как сообщает The Times, стратегия публикации «меньшего количества, но более качественных материалов» привела к рекордному росту глобальной аудитории в течение трех месяцев подряд.
После изменения подхода редакция The Times сократила количество публикуемых статей на 20%, а спортивный отдел — на 30%.
Однако заместитель руководителя отдела цифровых технологий Анна Сбуттони заявила: «Они не потеряли аудиторию. На самом деле, они ее приобрели».
В целом, в редакции The Times количество публикуемых статей сократилось с более чем 200 в день до примерно 150 — на 25%.
...
Сбуттони заявила, что органический поисковый трафик на сайт вырос на 29% в годовом исчислении и на 13% в месячном, что противоречит отраслевой тенденции.
По ее словам, трафик из Google Discover вырос более чем на 150% по сравнению с прошлым годом, а трафик из социальных сетей — более чем на 100%."
https://pressgazette.co.uk/publishers/digital-journalism/times-fewer-better-stories-strategy-leads-to-run-of-audience-growth/
2🔥1
Forwarded from Ньюсач/Двач
Российское СМИ оштрафовали за пропаганду ЛГБТ* из-за статьи о свингерах

Протокол на издание 63.ru составили из-за статьи с говорящим заголовком «Из разврата нет возврата», посвящённой свинг-вечеринкам в России.

Роскомнадзор счёл её содержание «пропагандой нетрадиционных сексуальных отношений».

Понятие «обмен партнёрами» является противоположным по смыслу понятиям «супружеской верности», «брачному союзу», коннотирующих стабильность и закрытость пары, добровольную эксклюзивность (моногамию)

— говорится в постановлении суда.


Суд пришёл к выводу, что публикация убеждает «в привлекательности нетрадиционных сексуальных отношений и предпочтений» и даёт им положительную оценку или «одобрение». За это издание оштрафовали на 1 миллион рублей.

* Движение ЛГБТ признано в РФ экстремистским и запрещено
👍21
Новостные издатели также ополчились и на базу Common Crawl за то, что снабжает просканированным контентом системы генеративного ИИ:
"Как впервые сообщило агентство Bloomberg , вчера News/Media Alliance (NMA), представляющая интересы ведущих новостных издателей, направила письмо в Common Crawl с требованием прекратить несанкционированный сбор и хранение контента на архивном сайте, а также разработать дополнительные протоколы для предотвращения использования контента издателей из своей базы данных компаниями, занимающимися искусственным интеллектом."
👍2
Допилили автоматизатор для рерайта новостей и не только - https://www.yalstudio.ru/portfolio/neuro/ii-dlya-smi/
🔥4👏1
Сегодня клиенту прилетает «письмо счастья» с требованием компенсации за картинку, которая была честно взята на бесплатном стоке год назад.
Но дьявол, как обычно, кроется в деталях. Нейронки, обученные искать визуальные совпадения, достигли прогресса, но не научились качественному фактчекингу. В присланной претензии фигурирует изображение из той же серии, что и на сайте, но — внимание — это другая фотография. Похожая композиция, тот же свет, те же предметы, но кадр иной. Вывод очевиден: юридический бот-паук просканировал сеть, нашел сходство и на автопилоте выплюнул гневную досудебку на e-mail, указанный в контактах.
Второй вариант развития событий — юридический «перекуп». Это когда фотобанки или отдельные авторы передают права на свои архивы агрессивным юридическим конторам, которые ставят иски на поток. Однако здесь возникает главный когнитивный диссонанс: юристы внезапно оказались австралийскими. Грозить они могут «самыми жесткими карами», но в условиях текущей геополитической реальности и законодательного вакуума между странами, исполнение их требований выглядит комично.
Прогноз на будущее неутешителен: количество таких «ошибок нейросетей» будет только расти. Мы входим в эпоху, когда каждый блок контента на сайте должен иметь цифровой сертификат происхождения (или сертификат сертификата), иначе вам придется бесконечно отбиваться от ботов с другого конца света. А вы уже получали привет от австралийского правосудия или ваш сайт пока не попал в радар глобальных нейро-юристов?
👍3
Казахстанские коллеги "прочухали" пользу от GEO. А как известно GEO, это то же SEO, только в другой руке. Станет ли GEO «вторым рождением» медиаплощадок пока не известно, но попытки точно будут. Как это работает?
Все просто: ИИ-боты Google или Яндекса не берут данные из воздуха. Для формирования ответа по конкретному региону им нужны «доноры» с высоким уровнем доверия. Когда вы размещаете глубокий, фактологичный материал на авторитетном СМИ, вы буквально скармливаете ИИ готовую базу для рекомендаций.
В итоге, когда пользователь спрашивает нейросеть о лучших услугах или отраслевых лидерах, ИИ с высокой долей вероятности процитирует именно ваш материал.
В чем профит для сторон:
Для бренда: Это уже не просто PR-статья, а «билет» в ИИ выдачу. Вы попадаете в блок ответов ИИ, минуя стандартную битву за ссылки. Но и там материал может стоять достаточно высоко.
Для сайта СМИ: Публикация качественного GEO-контента поднимает вес самого ресурса. Площадка становится экспертным узлом в глазах ИИ по конкретной тематике и региону, что неизбежно тянет за собой общий рост трастовости.
Единственный «затык» на текущий момент — это цена.
Старые прайсы на публикации здесь не работают. Мы имеем дело с гибридным продуктом: это и индексируемый PR-материал, и мощный SEO-инструмент, и, самое главное, база для обучения поисковых нейросетей. Вес такой публикации на «жирном» ресурсе огромен, так как она создает долгосрочный цифровой след.
Сайты СМИ могут стать хабами для обучения ИИ-ботов. Те компании и бренды, которые сейчас начнут системно заходить в медиа с GEO-оптимизированным контентом, через год обнаружат, что ИИ-ответы принадлежат им в значительной мере. Вопрос лишь в том, готовы ли площадки оценить этот потенциал и выставить адекватный ценник.
🔥3
Гуглоиды представили (https://blog.google/products-and-platforms/products/search/a-new-profile-to-help-publishers-and-creators-highlight-their-work-on-search/) Поисковые профили (Search profiles) — новый способ для издателей и создателей контента формировать свое присутствие в поисковой выдаче.
"Поисковые профили предоставляют издателям и создателям контента централизованное место для демонстрации своих последних статей, видео и публикаций в социальных сетях. Пользователи могут легко подписаться на источники через их профиль, поэтому вероятность увидеть этот контент в разделе «Discover», расположенном на главном экране приложения Google , значительно возрастает. Доступ к профилям в поиске можно получить на мобильных устройствах через панель знаний создателя или издателя (информационный блок в поиске, содержащий информацию о известных людях, местах и ​​событиях), нажав на имя издателя или создателя в разделе «Discover», или по прямой ссылке.
...
Для начала, издатели и создатели контента со значительной аудиторией хотя бы на одной крупной социальной или видеоплатформе могут подтвердить свой профиль в поиске и настроить его, добавив аватар, биографию, веб-сайт, ссылки на социальные сети и видеоплатформы, а также другой важный контент. 
...
Функция поисковых профилей первоначально будет запущена в США."

P.S. Значительная аудитория - это (https://support.google.com/websearch/answer/16904498):
"У вас должно быть минимальное количество подписчиков или фолловеров хотя бы на одной контентной платформе:
• YouTube: 100 000
• Инстаграм: 100 000
• X: 100 000
• TikTok: 300 000"
А также:
"• Вам должно быть не менее 18 лет.
• Ваш контент должен соответствовать правилам Google."
Более 20 европейских новостных издателей подали иск против Google, требуя более 640 миллионов евро после решения ЕС, которое позволяет любому, кто пострадал от злоупотреблений Google на рекламном рынке, требовать компенсацию.
"Издатели, участвующие в деле, утверждают, что им следует присудить совокупную компенсацию в размере более 640 миллионов евро (552 миллиона фунтов стерлингов) в связи с последствиями действий Google для них.
Они считают, что получили бы значительно больший доход от рекламы и заплатили бы меньше за услуги в сфере рекламных технологий, если бы Google не создал менее конкурентный рынок."
Гуглоидов в Европе явно недолюбливают.
Буржуйский специалист по Google Discover Дэмиен Анделл наблюдает
"значительное увеличение количества карточек Discover, связанных с социальной сетью Threads, а также то, что несколько дней назад Threads появилась в списке социальных сетей для страниц профилей Google для издателей"

Все – в Threads 😊
👍1
По сообщению Digiday
"Reuters и Time начали блокировать всех ботов с искусственным интеллектом по умолчанию и создали белые списки разрешенных ботов для доступа к контенту на своих сайтах.
...
Для управления ботами на основе ИИ Time использует ScalePost.
...
Агентство Reuters блокирует ботов по умолчанию с помощью файла robots.txt"

Что-то мне подсказывает, что использовать robots.txt для блокировки ИИ ботов – это как шлагбаум в чистом поле поставить. 😀