Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст
5 мая 2026 года Meta* объявила о запуске системы визуального анализа для определения возраста пользователей соцсетей. ИИ сканирует фотографии и видео, чтобы понять, сколько лет может быть человеку. Система опирается на физические признаки, такие как рост и строение костей. Помимо этого, ИИ анализирует тексты постов и комментариев — ищет упоминания школьных оценок, дней рождения и других признаков, характерных для детей и подростков.
По заявлению компании, это не распознавание лиц: система не идентифицирует конкретного человека, а оценивает «общие темы и визуальные признаки». Целью внедрения такого анализа компания называет защиту детей от негативного опыта в сети.
Если алгоритм решает, что пользователю меньше 13 лет, аккаунт деактивируется — для восстановления нужна верификация возраста. Для пользователей от 13 до 17 лет автоматически будет включаться подростковый аккаунт: приватный профиль по умолчанию, личные сообщения только от знакомых, фильтрация потенциально вредного контента. Пока система распространяется на Instagram* во всех 27 странах ЕС и в Бразилии, а также впервые запускается на Facebook* в США.
Почему это важно?
С одной стороны, новая система запускается на фоне растущего международного давления на платформы и дискуссий об ограничении доступа к ним для детей. Ряд стран запретил или готовится запретить использование соцсетей для детей младше 13 лет.
В марте 2026 года компания столкнулась с несколькими проблемами. Евросоюз обвинил Meta* в том, что она не может ограничить доступ к соцсетям детям младше 13 лет. При этом европейский закон о цифровых услугах (DSA) обязывает платформы защищать несовершеннолетних — под угрозой штрафов до 6% от глобального оборота. Американский суд признал Meta* и Google виновными в том, что алгоритмы Instagram* и YouTube вызывают у молодых пользователей зависимость. При этом 46 из 50 штатов США уже приняли законы о дипфейках и защите детей в сети.
С другой стороны, метод определения возраста вызывает вопросы. Сканирование всего контента пользователей в поисках признаков возраста похоже на масштабное профилирование, которое создает риски для приватности. Формально Meta* не собирает биометрию, но сканирует тела всех пользователей без исключения, чтобы найти среди них детей.
* Компания Meta признана в России экстремистской организацией, ее деятельность в России запрещена; принадлежащие ей Facebook и Instagram запрещены в России.
🤖 «Системный Блокъ» @sysblok
5 мая 2026 года Meta* объявила о запуске системы визуального анализа для определения возраста пользователей соцсетей. ИИ сканирует фотографии и видео, чтобы понять, сколько лет может быть человеку. Система опирается на физические признаки, такие как рост и строение костей. Помимо этого, ИИ анализирует тексты постов и комментариев — ищет упоминания школьных оценок, дней рождения и других признаков, характерных для детей и подростков.
По заявлению компании, это не распознавание лиц: система не идентифицирует конкретного человека, а оценивает «общие темы и визуальные признаки». Целью внедрения такого анализа компания называет защиту детей от негативного опыта в сети.
Если алгоритм решает, что пользователю меньше 13 лет, аккаунт деактивируется — для восстановления нужна верификация возраста. Для пользователей от 13 до 17 лет автоматически будет включаться подростковый аккаунт: приватный профиль по умолчанию, личные сообщения только от знакомых, фильтрация потенциально вредного контента. Пока система распространяется на Instagram* во всех 27 странах ЕС и в Бразилии, а также впервые запускается на Facebook* в США.
Почему это важно?
С одной стороны, новая система запускается на фоне растущего международного давления на платформы и дискуссий об ограничении доступа к ним для детей. Ряд стран запретил или готовится запретить использование соцсетей для детей младше 13 лет.
В марте 2026 года компания столкнулась с несколькими проблемами. Евросоюз обвинил Meta* в том, что она не может ограничить доступ к соцсетям детям младше 13 лет. При этом европейский закон о цифровых услугах (DSA) обязывает платформы защищать несовершеннолетних — под угрозой штрафов до 6% от глобального оборота. Американский суд признал Meta* и Google виновными в том, что алгоритмы Instagram* и YouTube вызывают у молодых пользователей зависимость. При этом 46 из 50 штатов США уже приняли законы о дипфейках и защите детей в сети.
С другой стороны, метод определения возраста вызывает вопросы. Сканирование всего контента пользователей в поисках признаков возраста похоже на масштабное профилирование, которое создает риски для приватности. Формально Meta* не собирает биометрию, но сканирует тела всех пользователей без исключения, чтобы найти среди них детей.
* Компания Meta признана в России экстремистской организацией, ее деятельность в России запрещена; принадлежащие ей Facebook и Instagram запрещены в России.
Please open Telegram to view this post
VIEW IN TELEGRAM
🙈15👎10👍5❤3🤯3💔3🦄3
Женщина для галочки: дата-исследование о принципе Смурфетты в российском кино в карточках
Представьте фильм: группа мужчин спасает мир, расследует преступление, едет в экспедицию или просто проживает «сложную мужскую драму». И среди них — одна женщина. Не как полноценная героиня со своей линией, а как функция: «девушка героя», «женщина в команде», «украшение кадра». Это называется «принцип Смурфетты»: когда в числе главных героев есть одна «женщина для галочки». Мы изучили почти 10 тысяч советских и российских фильмов за последние 50 лет и посчитали, как часто там срабатывает принцип Смурфетты. В девяти карточках — что показали данные и в каких жанрах проще всего найти Смурфетту.
Полную версию читайте на сайте.
🤖 «Системный Блокъ» @sysblok
Представьте фильм: группа мужчин спасает мир, расследует преступление, едет в экспедицию или просто проживает «сложную мужскую драму». И среди них — одна женщина. Не как полноценная героиня со своей линией, а как функция: «девушка героя», «женщина в команде», «украшение кадра». Это называется «принцип Смурфетты»: когда в числе главных героев есть одна «женщина для галочки». Мы изучили почти 10 тысяч советских и российских фильмов за последние 50 лет и посчитали, как часто там срабатывает принцип Смурфетты. В девяти карточках — что показали данные и в каких жанрах проще всего найти Смурфетту.
Полную версию читайте на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤36👀13🔥7💅4😢3👍2👎1
Рассказываем, что произошло в мире ИИ за последнее время: дайджест
ИИ-агенты появятся в поиске Google
На ежегодной конференции для разработчиков Google I/O компания представила новые ИИ-продукты и обновления к существующим.
Наиболее заметное изменение для рядовых пользователей — полностью переработанная строка поиска. Теперь в нее можно не просто вводить запросы, но и напрямую взаимодействовать с Gemini: просить рекомендации с учетом нескольких критериев, задавать уточняющие вопросы к результатам выдачи, просить найти и купить товары, подписываться на уведомления о конкретных событиях. Поддерживается и ввод изображений.
В основе обновленного поиска лежит Gemini 3.5 Flash — новая флагманская языковая модель Google, ориентированная на агентные задачи и программирование. Она превосходит предыдущую и при этом в четыре раза быстрее конкурирующих решений.
Отдельным анонсом стала мультимодальная модель Gemini Omni. Она способна принимать на вход и выдавать на выходе любую комбинацию текста, аудио, видео и изображений. Omni обрабатывает все форматы одновременно в единой архитектуре, что позволяет, например, редактировать видео через обычный диалог с моделью. Первая модель из семейства Omni — Gemini Omni Flash — уже доступна в приложении Gemini, Google Flow и YouTube Shorts. Помимо этого, компания анонсировала Gemini Spark — персонального ИИ-агента, работающего в фоне круглосуточно и интегрированного с Gmail, Docs и другими сервисами Workspace.
ИИ решил задачу, c которой математики не могли справиться 80 лет
20 мая OpenAI объявила, что ее внутренняя модель самостоятельно опровергла гипотезу в дискретной геометрии, которая считалась верной почти 80 лет. Доказательство верифицировали независимые математики, в том числе лауреат медали Филдса.
Задача звучит так: если расположить n точек на плоскости, какое наибольшее количество пар из них может находиться на расстоянии 1 друг от друга? Пал Эрдёш сформулировал ее в 1946 году.
На протяжении почти 80 лет считалось, что лучшие из известных расположений точек — квадратные решетки — по сути оптимальны. Но строго доказать это никому не удавалось. Модель OpenAI нашла конфигурации, которые опровергают гипотезу, и доказала это математически.
Доказательство получено не специализированной ИИ-системой для математики, а моделью общего назначения. При этом особенно неожиданным оказался метод: задача относится к геометрии, однако модель решила ее через алгебраическую теорию чисел.
Больше подробностей — на сайте.
🤖 «Системный Блокъ» @sysblok
ИИ-агенты появятся в поиске Google
На ежегодной конференции для разработчиков Google I/O компания представила новые ИИ-продукты и обновления к существующим.
Наиболее заметное изменение для рядовых пользователей — полностью переработанная строка поиска. Теперь в нее можно не просто вводить запросы, но и напрямую взаимодействовать с Gemini: просить рекомендации с учетом нескольких критериев, задавать уточняющие вопросы к результатам выдачи, просить найти и купить товары, подписываться на уведомления о конкретных событиях. Поддерживается и ввод изображений.
В основе обновленного поиска лежит Gemini 3.5 Flash — новая флагманская языковая модель Google, ориентированная на агентные задачи и программирование. Она превосходит предыдущую и при этом в четыре раза быстрее конкурирующих решений.
Отдельным анонсом стала мультимодальная модель Gemini Omni. Она способна принимать на вход и выдавать на выходе любую комбинацию текста, аудио, видео и изображений. Omni обрабатывает все форматы одновременно в единой архитектуре, что позволяет, например, редактировать видео через обычный диалог с моделью. Первая модель из семейства Omni — Gemini Omni Flash — уже доступна в приложении Gemini, Google Flow и YouTube Shorts. Помимо этого, компания анонсировала Gemini Spark — персонального ИИ-агента, работающего в фоне круглосуточно и интегрированного с Gmail, Docs и другими сервисами Workspace.
Почему это важно?
Если раньше поиск в интернете сводился к переходу по ссылкам из выдачи, то теперь рутинные задачи берут на себя ИИ-агенты. Они ищут и анализируют информацию, следят за развитием событий и совершают действия на сайтах от имени пользователя.
Трансформация поисковиков началась еще в 2022 году, когда широкую известность получил ChatGPT. Пионерами нового подхода стали такие продукты, как Perplexity и ИИ-браузеры. Однако самой масштабной и отлаженной поисковой инфраструктурой по-прежнему располагает Google — и теперь компания встраивает в нее ИИ на всех уровнях.
ИИ решил задачу, c которой математики не могли справиться 80 лет
20 мая OpenAI объявила, что ее внутренняя модель самостоятельно опровергла гипотезу в дискретной геометрии, которая считалась верной почти 80 лет. Доказательство верифицировали независимые математики, в том числе лауреат медали Филдса.
Задача звучит так: если расположить n точек на плоскости, какое наибольшее количество пар из них может находиться на расстоянии 1 друг от друга? Пал Эрдёш сформулировал ее в 1946 году.
На протяжении почти 80 лет считалось, что лучшие из известных расположений точек — квадратные решетки — по сути оптимальны. Но строго доказать это никому не удавалось. Модель OpenAI нашла конфигурации, которые опровергают гипотезу, и доказала это математически.
Доказательство получено не специализированной ИИ-системой для математики, а моделью общего назначения. При этом особенно неожиданным оказался метод: задача относится к геометрии, однако модель решила ее через алгебраическую теорию чисел.
Почему это важно
OpenAI назвала это первым случаем, когда ИИ самостоятельно решил известную открытую задачу, занимающую центральное место в своей области. Многие задачи, ранее решенные с помощью ИИ, были малоизвестны или просто обделены вниманием исследователей — здесь же речь идет о задаче, которую десятилетиями безуспешно пытались решить ведущие специалисты.
Роль ИИ в науке растет: он помогает подсвечивать неожиданные связи между дисциплинами, генерировать оригинальные идеи и доводить их до конца. Почитать о том, как ученые используют ИИ, можно здесь
Больше подробностей — на сайте.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
GPT решила знаменитую нерешенную задачу математики, Google показал новый ИИ-поиск - Системный Блокъ
Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время
❤18👍14⚡4👏2
Всемирная история картотек: как учёные и библиотекари пытались упорядочить всё
27 мая — Общероссийский день библиотек. Самое время вспомнить, что до поисковой строки, тегов и электронных каталогов у человечества были бумажные полоски, карточки, шкафы и даже «ковчег познания» с крючками. Перечитываем наш материал о том, как библиотекари и ученые несколько веков пытались упорядочить все на свете — и почему история картотек подозрительно похожа на предысторию современных баз данных.
Как разделить мировое знание на атомы
Швейцарский ученый Конрад Геснер одним из первых попытался каталогизировать вообще все известные книги. В 1545 году он выпустил Bibliotheca universalis, в которой он пытается упорядочить всю известную ему литературу на латыни, греческом и иврите, — гигантский каталог десяти тысяч изданий с описаниями, авторами и темами.
Но еще интереснее оказался его метод работы с заметками. Геснер предлагал записывать каждую мысль с новой строки, затем разрезать лист на полоски и сортировать их в любом порядке. Сегодня это звучит почти как принцип работы базы данных или системы карточек в Notion. Фактически его идея состояла в том, чтобы «разобрать знания на части» и собирать их заново под разные задачи.
Что общего между крючками и тегами
В XVII веке англичанин Томас Харрисон пошел дальше и придумал Arca studiorum — «ковчег познания». Это была деревянная доска с крючками: каждый крючок соответствовал ключевому слову, а карточки с заметками подвешивались к нужной категории.
Харрисон создал прообраз каталожного шкафа и системы тегов одновременно. Правда, современники его не оценили: ученый безуспешно пытался продать свою систему парламенту и королю Англии — причем часть переговоров вел прямо из тюрьмы.
Как придумать каталог и опередить свое время
Картотеками пользовался и математик Готфрид Лейбниц. Работая библиотекарем в Вольфенбюттеле, он решил составить каталог библиотеки на отдельных карточках. Но затем произошло неожиданное: Лейбниц испугался ненадежности «рассыпавшихся» листков и приказал вклеить их обратно в переплетенные тетради. Так идея карточного каталога оказалась слишком радикальной даже для одного из самых выдающихся интеллектуалов XVII века.
Почему картотеки изменили науку
Картотеки стали способом работать с постоянно растущим объемом информации. Они позволяли переставлять знания, группировать их по новым темам и быстро находить нужные сведения.
Во многом именно эта логика — разбивать информацию на отдельные элементы и свободно их перекомбинировать — позже легла в основу библиотечных каталогов, баз данных и цифровых поисковых систем.
Подробнее о том, как люди научились пользоваться картотеками, — в полной версии материала.
Время чтения: 15 минут
🤖 «Системный Блокъ» @sysblok
27 мая — Общероссийский день библиотек. Самое время вспомнить, что до поисковой строки, тегов и электронных каталогов у человечества были бумажные полоски, карточки, шкафы и даже «ковчег познания» с крючками. Перечитываем наш материал о том, как библиотекари и ученые несколько веков пытались упорядочить все на свете — и почему история картотек подозрительно похожа на предысторию современных баз данных.
Как разделить мировое знание на атомы
Швейцарский ученый Конрад Геснер одним из первых попытался каталогизировать вообще все известные книги. В 1545 году он выпустил Bibliotheca universalis, в которой он пытается упорядочить всю известную ему литературу на латыни, греческом и иврите, — гигантский каталог десяти тысяч изданий с описаниями, авторами и темами.
Но еще интереснее оказался его метод работы с заметками. Геснер предлагал записывать каждую мысль с новой строки, затем разрезать лист на полоски и сортировать их в любом порядке. Сегодня это звучит почти как принцип работы базы данных или системы карточек в Notion. Фактически его идея состояла в том, чтобы «разобрать знания на части» и собирать их заново под разные задачи.
Что общего между крючками и тегами
В XVII веке англичанин Томас Харрисон пошел дальше и придумал Arca studiorum — «ковчег познания». Это была деревянная доска с крючками: каждый крючок соответствовал ключевому слову, а карточки с заметками подвешивались к нужной категории.
Харрисон создал прообраз каталожного шкафа и системы тегов одновременно. Правда, современники его не оценили: ученый безуспешно пытался продать свою систему парламенту и королю Англии — причем часть переговоров вел прямо из тюрьмы.
Как придумать каталог и опередить свое время
Картотеками пользовался и математик Готфрид Лейбниц. Работая библиотекарем в Вольфенбюттеле, он решил составить каталог библиотеки на отдельных карточках. Но затем произошло неожиданное: Лейбниц испугался ненадежности «рассыпавшихся» листков и приказал вклеить их обратно в переплетенные тетради. Так идея карточного каталога оказалась слишком радикальной даже для одного из самых выдающихся интеллектуалов XVII века.
Почему картотеки изменили науку
Картотеки стали способом работать с постоянно растущим объемом информации. Они позволяли переставлять знания, группировать их по новым темам и быстро находить нужные сведения.
Во многом именно эта логика — разбивать информацию на отдельные элементы и свободно их перекомбинировать — позже легла в основу библиотечных каталогов, баз данных и цифровых поисковых систем.
Подробнее о том, как люди научились пользоваться картотеками, — в полной версии материала.
Время чтения: 15 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Всемирная история картотек: как учёные и библиотекари пытались упорядочить книги
Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов специально для «Системного Блока» изучил, как развивалась идея библиотечного каталога с XVI века и до наших дней.
❤17🔥14👍7
Что такое корпус текстов?
Что общего у Библии, рилсов и постов в ЖЖ? Это все материалы для лингвистических корпусов. В новом выпуске глоссария объясняем, почему корпус бывает размером с интернет и размером с тетрадку — и тот и другой одинаково важен.
Три правила настоящего корпуса
Корпус — это не просто большая папка с файлами. В лингвистике корпусом называется любой набор данных на исследуемом языке, в том числе набор переведенных предложений из исследовательской анкеты для носителей языка. У него три главных правила: он должен быть большим, аутентичным (реальные тексты, а не придуманные для исследования) и репрезентативным (отражать разные стороны языка).
Что значит «отражать язык»?
Добиться репрезентативности корпуса довольно сложно. Если отбирать для него текста, как в жизни, то 90% корпуса станет устной речью и останется 7% на литературу. А если собирать то, что люди читают, картина будет другой. Раз уж невозможно составить по-настоящему репрезентативный корпус, создатели делают ставку на разнообразие. В корпус добавляют как можно больше разных языковых вариантов: от научных статей до постов в соцсетях.
Сколько слов нужно для корпуса?
Единственный честный ответ на вопрос, насколько большим должен быть языковой корпус: «Никто не знает». В погоне за объемом могут теряться другие важные параметры: например, корпусы, собранные на основе скачиваемых подряд массивов текстов из интернета, могут содержать большие объемы нейросетевых текстов. Объем корпуса сильно зависит от поставленной задачи, сейчас для большинства задач хватает 1–500 млн токенов. А для малых языков, которых почти нет в сети, даже несколько тысяч слов — уже огромный шаг вперед.
Когда человек не знает, что его изучают
Аутентичность корпуса — тоже непростая задача. Когда лингвисты собирают устные высказывания, то люди, узнав о записи, начинают говорить так, как им кажется, от них ожидает исследователь. Но и это не все: при переносе в корпус исчезают интонации, жесты, мимика, а у письменных текстов — шрифт, цвет и положение на странице. Современные мультимедийные корпусы, вроде мультимедийного русского корпуса, пытаются это исправить.
Корпусы бывают разными — и большими, и маленькими
Гиганты вроде Национального корпуса русского языка (больше 2 млрд слов) и ГИКРЯ (больше 20 млрд токенов) помогают лингвистам видеть общую картину, а малыши вроде корпуса абазинского языка (около 3 тысяч токенов) спасают исчезающие языки, создают словари и учебники.
Больше примеров и тонкостей создания корпусов вы найдете на сайте.
Время чтения: 9 минут
🤖 «Системный Блокъ» @sysblok
Что общего у Библии, рилсов и постов в ЖЖ? Это все материалы для лингвистических корпусов. В новом выпуске глоссария объясняем, почему корпус бывает размером с интернет и размером с тетрадку — и тот и другой одинаково важен.
Три правила настоящего корпуса
Корпус — это не просто большая папка с файлами. В лингвистике корпусом называется любой набор данных на исследуемом языке, в том числе набор переведенных предложений из исследовательской анкеты для носителей языка. У него три главных правила: он должен быть большим, аутентичным (реальные тексты, а не придуманные для исследования) и репрезентативным (отражать разные стороны языка).
Что значит «отражать язык»?
Добиться репрезентативности корпуса довольно сложно. Если отбирать для него текста, как в жизни, то 90% корпуса станет устной речью и останется 7% на литературу. А если собирать то, что люди читают, картина будет другой. Раз уж невозможно составить по-настоящему репрезентативный корпус, создатели делают ставку на разнообразие. В корпус добавляют как можно больше разных языковых вариантов: от научных статей до постов в соцсетях.
Сколько слов нужно для корпуса?
Единственный честный ответ на вопрос, насколько большим должен быть языковой корпус: «Никто не знает». В погоне за объемом могут теряться другие важные параметры: например, корпусы, собранные на основе скачиваемых подряд массивов текстов из интернета, могут содержать большие объемы нейросетевых текстов. Объем корпуса сильно зависит от поставленной задачи, сейчас для большинства задач хватает 1–500 млн токенов. А для малых языков, которых почти нет в сети, даже несколько тысяч слов — уже огромный шаг вперед.
Когда человек не знает, что его изучают
Аутентичность корпуса — тоже непростая задача. Когда лингвисты собирают устные высказывания, то люди, узнав о записи, начинают говорить так, как им кажется, от них ожидает исследователь. Но и это не все: при переносе в корпус исчезают интонации, жесты, мимика, а у письменных текстов — шрифт, цвет и положение на странице. Современные мультимедийные корпусы, вроде мультимедийного русского корпуса, пытаются это исправить.
Корпусы бывают разными — и большими, и маленькими
Гиганты вроде Национального корпуса русского языка (больше 2 млрд слов) и ГИКРЯ (больше 20 млрд токенов) помогают лингвистам видеть общую картину, а малыши вроде корпуса абазинского языка (около 3 тысяч токенов) спасают исчезающие языки, создают словари и учебники.
Больше примеров и тонкостей создания корпусов вы найдете на сайте.
Время чтения: 9 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Что такое корпус текстов? - Системный Блокъ Что такое корпус текстов
Если собрать много текстов на одном языке, это уже корпус? Если да, то много — это сколько? Рассказываем, что называется корпусом и какие есть критерии отбора текстов. Объясняем, почему «чем больше, тем лучше» не работает, как устроены национальные, веб-…
👍15❤12🔥8