Модерация CPA — compliance, privacy, fraud risk
985 subscribers
62 photos
2 videos
47 links
Модерация и compliance в CPA: privacy, fraud-risk, регуляторика, бан-сигналы Meta/Google. Что запрещают, где режут, какой риск для кампаний и аккаунтов.
Download Telegram
OpenAI: усиление защиты ChatGPT Atlas от prompt injection

Факт: OpenAI сообщает, что усиливает ChatGPT Atlas против атак prompt injection. Для этого используется automated red teaming, обученный с reinforcement learning.

Что поменялось: заявлен проактивный цикл discover-and-patch. Он должен помогать раньше находить новые варианты эксплойтов и усиливать защиту browser agent по мере того, как AI становится более agentic.

Кого задевает:
— команды, тестирующие AI-браузеры и агентные сценарии
— продукты с доступом AI к веб-страницам и пользовательским данным
— compliance и security-функции, оценивающие риски prompt injection

Что делать: учитывать prompt injection как отдельный риск в агентных браузерах. Для внутренних тестов фиксировать не только успешность задач, но и поведение агента при недоверенном контенте на страницах.
OpenAI: новые материалы по AI-грамотности для подростков и родителей

Факт: OpenAI опубликовала новые ресурсы, которые помогают подросткам и родителям использовать ChatGPT осознанно, безопасно и увереннее.

Что внутри: гайды с экспертно проверенными рекомендациями по ответственному использованию, критическому мышлению, здоровым границам и поддержке подростков в эмоциональных или чувствительных темах.

Кого задевает:
— команды, работающие с EdTech и family-аудиторией
— продукты с подростковой аудиторией
— бренды, использующие AI-инструменты в пользовательских сценариях
— compliance и trust & safety команды

Что делать: если в продукте или коммуникациях есть AI-сценарии для несовершеннолетних, стоит сверить онбординг, дисклеймеры и safety-подсказки с такими материалами. Без паники: это не запрет, а ориентир по ожиданиям к безопасному использованию AI.
OpenAI: акцент на киберустойчивость по мере роста возможностей AI

Факт: OpenAI заявила, что инвестирует в более сильные safeguards и защитные возможности, поскольку AI-модели становятся мощнее в задачах кибербезопасности.

Также компания описывает, как оценивает риск, ограничивает misuse и работает с security-сообществом для усиления cyber resilience.

Кого задевает:
— команды, использующие AI-инструменты в security-операциях;
— продукты с AI-функциями для анализа уязвимостей и инцидентов;
— compliance и risk-команды, которым нужно описывать контроль misuse;
— партнёрки и трафик-команды, где AI применяется в автоматизации аккаунтов, доменов и инфраструктуры.

Срок вступления: отдельная дата в материале не указана.

Что делать: без паники. Зафиксировать, какие AI-инструменты используются в security и операционных процессах, кто имеет доступ, какие есть ограничения и журналирование. Для внешних AI-сервисов — проверить policy, условия использования и внутренние правила по допустимым сценариям.
This media is not supported in your browser
VIEW IN TELEGRAM
ByteDance анонсировала новую версию SeeDance версии 2.5

ByteDance готовит релиз Seedance 2.5 — видеогенератора нового уровня. Главное улучшение: модель сможет создавать 30-секундные видео за один прогон без склеек, вместо нынешних 15 секунд. Добавили локальный монтаж отдельных кадров, поддержку 3D-болванок для управления камерой, возможность использовать до 50 референсов и генерацию в 4К сразу. Закрытый бета-тест идёт сейчас, открытый релиз ожидается в начале июля. Технологически это шаг вперёд, но д…

➡️ Читайте на сайте: https://aff.top/blog/bytedance-anonsirovala-novuiu-versiiu-seedance-versii-2-5

🧠 Ещё больше инсайтов → в канале AFF.top
This media is not supported in your browser
VIEW IN TELEGRAM
Codex уничтожит твой SSD за год

Разработчик обнаружил критический баг в Codex CLI от OpenAI: агент непрерывно записывает логи в локальную SQLite-базу, перезаписывая за 21 день 37 ТБ данных. При таком темпе типичный SSD объёмом 1 ТБ (рассчитанный на 600 ТБ перезаписей) выходит из строя менее чем за год. OpenAI осведомлена о проблеме, но пока не исправляет её. Пользователям остаётся либо ждать обновления, либо переключиться на альтернативные CLI-инструменты без подобных недостат…

➡️ Читайте на сайте: https://aff.top/blog/codex-unichtozhit-tvoi-ssd-za-god

🧠 Ещё больше инсайтов → в канале AFF.top
OpenAI / Mixpanel: инцидент с аналитическими данными API

Факт: OpenAI сообщила о security incident у Mixpanel, который затронул ограниченный объём API analytics data.

Важно: по сообщению OpenAI, содержимое API, credentials и платёжные данные в инциденте не раскрывались.

Кого задевает:
— команды, использующие OpenAI API;
— compliance и security-ответственных;
— тех, кто ведёт vendor risk по сторонним аналитическим сервисам.

Что делать: без паники зафиксировать инцидент в vendor-risk журнале, проверить внутренние процедуры уведомлений и отдельно не смешивать этот кейс с утечкой API-контента или платёжных данных — в источнике это прямо исключено.
OpenAI: гранты на исследования AI и mental health

Факт: OpenAI выделяет до $2 млн на гранты для исследований на пересечении AI и mental health.

Программа поддерживает проекты, которые изучают реальные риски, пользу и применения AI для повышения безопасности и благополучия.

Кого задевает:
— команды, работающие с AI-продуктами в health / wellness
— trust & safety и policy-команды
— исследователей рисков пользовательского взаимодействия с AI
— продукты, где AI может влиять на уязвимые состояния пользователя

Что делать: следить за результатами таких исследований. Для продуктовых команд это сигнал: mental health-сценарии будут требовать более аккуратной оценки рисков, safety-дизайна и документирования ограничений.
OpenAI: представлен Aardvark для поиска уязвимостей

Факт: OpenAI анонсировала Aardvark — AI-powered security researcher. По описанию компании, система автономно находит, валидирует и помогает исправлять уязвимости в ПО на масштабе.

Статус: private beta. OpenAI предлагает записаться на раннее тестирование.

Кого задевает:
— команды, которые держат собственный продуктовый код;
— платформы с большим количеством интеграций и API;
— партнёрки и трекинговые системы, где уязвимости могут быстро превращаться в операционный риск;
— compliance/security-функции, которым нужно оценивать новые инструменты автоматизированного анализа.

Что делать: не читать анонс как замену security-процессам. На этапе private beta разумнее смотреть на применимость, требования к доступу к коду и внутренние процедуры валидации результатов. Для production-контуров — только через стандартную проверку безопасности и юридические ограничения по данным.
This media is not supported in your browser
VIEW IN TELEGRAM
Google ужесточает модерацию финансовой вертикали

Google ужесточает модерацию финансовых офферов в ЕС и ЕЭЗ, введя двухэтапную верификацию через G2 Risk Solutions и Google Ads. Проверка затронет 24 страны, включая Австрию, Польшу, Нидерланды и другие члены союза. На прохождение модерации отводится 30 дней — за это время некоторые связки успеют отработать до вступления требований в силу. Для арбитражников это означает необходимость подготовиться к усложнению процесса запуска финансовых кампаний …

➡️ Читайте на сайте: https://aff.top/blog/google-uzhestochaet-moderaciiu-finansovoi-vertikali

🧠 Ещё больше инсайтов → в канале AFF.top
OpenAI: open-weight модели для policy-based модерации

Факт: OpenAI опубликовала technical report по gpt-oss-safeguard-120b и gpt-oss-safeguard-20b. Это две open-weight reasoning модели, post-trained от gpt-oss моделей.

Что важно для модерации: модели обучены рассуждать от заданной политики и размечать контент в рамках этой политики. То есть фокус не на «общей безопасности», а на применении конкретного policy-текста к контенту.

Кого задевает:
— команды, которые строят внутреннюю модерацию;
— продукты с пользовательским контентом;
— compliance-команды, которым нужна проверяемая логика классификации;
— тех, кто сравнивает vendor moderation API и self-hosted подходы.

Отдельно: в отчёте есть baseline safety evaluations для gpt-oss-safeguard моделей, где в качестве baseline используются исходные gpt-oss модели.

Что делать: читать отчёт как техническую точку сравнения, а не как универсальную замену ручной policy-разработки. Для продакшена критичны собственные тесты на ваших правилах, языках и спорных кейсах.
OpenAI: создан экспертный совет по well-being и AI

Факт: OpenAI объявила новый Expert Council on Well-Being and AI. В него вошли психологи, клиницисты и исследователи.

Что задето:
— продукты с AI-ассистентами для массовой аудитории
— сценарии эмоциональной поддержки
— teen safety и коммуникации с несовершеннолетними
— команды, которые используют ChatGPT в пользовательских воронках

Зачем это важно: совет должен помогать определять, как ChatGPT поддерживает эмоциональное здоровье, особенно для подростков. Для рынка это сигнал: темы mental health и minors будут оставаться в зоне повышенного внимания платформ, регуляторов и trust & safety-команд.

Что делать: если в продукте или креативах есть AI, эмоциональная поддержка, советы по состоянию пользователя или подростковая аудитория — отдельно проверить формулировки, дисклеймеры и маршрутизацию чувствительных обращений.
This media is not supported in your browser
VIEW IN TELEGRAM
Fable 5 скоро вернётся в публичный доступ

В исходном коде Claude Code обнаружены упоминания о возвращении модели Fable 5 в публичный доступ с изменённой моделью распространения — её больше не потребуется покупать отдельно, вместо этого будет применяться недельный лимит как для других моделей. Если информация подтвердится, пользователи платных тарифов смогут использовать Fable 5 в рамках своих подписок. Причины снятия ограничений по национальной безопасности остаются неясными. Хотя это п…

➡️ Читайте на сайте: https://aff.top/blog/fable-5-skoro-vernetsia-v-publichnyi-dostup

🧠 Ещё больше инсайтов → в канале AFF.top
OpenAI: запуск preview ChatGPT Pulse

Факт: OpenAI выпускает preview ChatGPT Pulse для Pro-пользователей на мобильных устройствах.

Pulse — новый режим, где ChatGPT проактивно делает research и показывает персонализированные обновления на основе чатов, feedback и подключённых приложений, например календаря.

Кого задевает:
— команды, которые используют ChatGPT в рабочих процессах;
— пользователей с подключёнными календарями и другими приложениями;
— compliance/privacy-функции, которым важно понимать, какие данные становятся контекстом для персонализации.

Срок вступления: preview уже выпускается для Pro users на mobile.

Что делать: проверить, какие приложения подключены к аккаунту, и отдельно оценить, какие рабочие данные попадают в чаты и feedback. Для команд — обновить внутренние правила по использованию AI-инструментов с учётом проактивной персонализации.
OpenAI: запуск Sora 2 и Sora app с акцентом на безопасность

Факт: OpenAI сообщает, что Sora 2 и приложение Sora разрабатывались с безопасностью «в основе» — с учётом рисков видеомодели и социальной платформы для создания контента.

Кого задевает:
— команды, работающие с AI-креативами и UGC-видео
— баеров, тестирующих генеративные видео в воронках
— модерацию креативов и brand safety
— партнёрки, где есть требования к происхождению контента

Что делать: не читать это как снятие рисков. Для кампаний с AI-видео всё равно нужны внутренние проверки: права на образы, соответствие правилам площадок, маркировка синтетического контента там, где она требуется, и отдельный контроль жалоб пользователей.
OpenAI: публичный ввод по поведению моделей

Факт: OpenAI опросила более 1 000 человек по всему миру о том, как должен вести себя ИИ. Затем компания сравнила ответы участников со своим Model Spec.

Кого задевает:
AI-продукты и команды, которые зависят от правил поведения моделей;
compliance и trust & safety функции;
партнёрские продукты, где ответы модели влияют на пользовательский риск.

Срок вступления: в опубликованных фактах не указан.

Что делать: следить за тем, как Model Spec будет меняться после публичного ввода. Для команд с AI-интеграциями важно фиксировать, какие ограничения модели являются продуктовой логикой, а какие — политикой поставщика.
OpenAI: новые элементы безопасности в ChatGPT

Факт: ChatGPT уже получил напоминания делать перерывы. Также OpenAI сообщает, что улучшает поддержку в «трудные моменты» и работает над более качественными советами по жизненным вопросам с участием экспертов.

Кого задевает:
— продукты с AI-чатами и ассистентами;
— команды trust & safety;
— саппорт и модерацию пользовательских диалогов;
— сервисы, где AI может давать чувствительные рекомендации.

Срок вступления: для напоминаний — уже развернуто. По остальным изменениям конкретные сроки в материале не указаны.

Что делать: если в продукте есть AI-диалоги, стоит пересмотреть правила эскалации чувствительных сценариев, UX-предупреждения и логику ограничений для советов, которые могут влиять на здоровье, безопасность или личные решения. Без паники: речь не о запрете формата, а об усилении safeguards.
This media is not supported in your browser
VIEW IN TELEGRAM
Chat GPT-5.6 будут выдавать лишь избранным

США ограничивают публичный доступ к новым ИИ-моделям: теперь его выдают только проверенным пользователям после обязательной 30-дневной процедуры верификации. Сэм Альтман называет это самым быстрым путём к публичному релизу. Эффективность меры вызывает сомнения — китайские разработчики традиционно копируют модели в течение суток после выхода.

➡️ Читайте на сайте: https://aff.top/blog/chat-gpt-5-6-budut-vydavat-lish-izbrannym

🧠 Ещё больше инсайтов → в канале AFF.top
This media is not supported in your browser
VIEW IN TELEGRAM
Vk удалили из App store: что дальше?

Удаление VK из App Store заблокировало доступ для владельцев iPhone в России, но проблема решаема. Арбитражники теряют один канал, но не аудиторию — 20–30 млн пользователей iOS остались на месте. Вместо VK стоит переориентироваться на альтернативные источники: Telegram Ads с таргетингом на iOS, push-сети типа AdProfex, MTS Ads и Beeline Ads. VK может последовать примеру Max и запустить PWA-приложение для восстановления уведомлений. Главный вывод…

➡️ Читайте на сайте: https://aff.top/blog/vk-udalili-iz-app-store-chto-dalshe

🧠 Ещё больше инсайтов → в канале AFF.top
OpenAI: новая политика outbound coordinated disclosure

Факт: OpenAI представила Outbound Coordinated Disclosure Policy. Документ описывает, как компания будет ответственно сообщать о уязвимостях в стороннем ПО.

Кого задевает:
— команды, работающие с security disclosure и bug bounty;
— вендоров стороннего ПО;
— compliance и risk-функции, которые ведут процесс обработки уязвимостей;
— партнёров, завязанных на безопасность интеграций.

Срок вступления: в предоставленных данных не указан.

Что делать: если в процессе используются сторонние компоненты или интеграции, стоит проверить, кто внутри команды принимает и маршрутизирует такие уведомления. Для security и compliance-процессов важно иметь понятный канал обработки disclosure-сообщений и не терять их между support, legal и engineering.

Без паники: это не сигнал об инциденте, а описание процедуры ответственного уведомления.
OpenAI / судебный запрос данных: что поменялось

Факт: OpenAI сообщает, что оспаривает судебное распоряжение по требованию The New York Times и истцов. Речь идет о бессрочном хранении данных пользователей consumer ChatGPT и API.

Кого задевает:
— команды, использующие ChatGPT в рабочих процессах;
— продукты и сервисы, завязанные на API;
— пользователей, передающих в AI-инструменты чувствительные данные.

Срок вступления: в источнике не указан.

Что делать: проверить, какие данные передаются в ChatGPT и API, и обновить внутренние правила по чувствительной информации. Для команд с клиентскими данными — отдельно зафиксировать, что можно отправлять в AI-инструменты, а что должно оставаться вне внешних сервисов.
Google Ads policy: 10 пунктов, которые баеры забывают проверить до запуска

Политика Google редко ломает кампанию одним запретом. Чаще она режет на стыке: крео, лендинг, форма, домен, трекинг. Поэтому раз в полгода полезно проходить не «общие правила», а узкие места, где чаще всего теряются аккаунты и открутка.

— Соответствие оффера и посадочной: нельзя обещать на крео то, чего нет на лендинге.
— Прозрачность: контакт, реквизиты, условия оплаты, возвраты, дисклеймеры — всё должно быть доступно.
— Запрещённые обещания: быстрый доход, гарантированный результат, «без риска», «100%».
— Ложная атрибуция: нельзя имитировать бренд, СМИ, госструктуры или системные уведомления.
— Сбор данных: формы, куки, consent и политика приватности должны быть видимыми.
— Финансы и здоровье: здесь Google особенно смотрит на claims и формулировки.
— Клоакинг и подмена контента: любое расхождение между показом и переходом — зона риска.
— Лэндинг-опыт: навязчивые попапы, автоплей, сломанная навигация и пустые страницы ухудшают доверие.
— Целевой язык и гео: если креатив и сайт не совпадают по рынку, модерация это видит.
— Поведенческие сигналы домена: резкие редиректы, короткая история, подозрительные цепочки тоже добавляют трения.

Если нужен короткий чек: совпадают ли крео, лендинг и форма; есть ли обязательные юридические элементы; не выглядит ли домен как одноразовый. Это не гарантирует прохождение, но снижает шанс, что кампания развалится на базовой проверке.