Системный Блокъ

Facebook* и Instagram* будут сканировать фото и видео, чтобы находить детей, которые скрыли свой возраст

5 мая 2026 года Meta* объявила о запуске системы визуального анализа для определения возраста пользователей соцсетей. ИИ сканирует фотографии и видео, чтобы понять, сколько лет может быть человеку. Система опирается на физические признаки, такие как рост и строение костей. Помимо этого, ИИ анализирует тексты постов и комментариев — ищет упоминания школьных оценок, дней рождения и других признаков, характерных для детей и подростков.

По заявлению компании, это не распознавание лиц: система не идентифицирует конкретного человека, а оценивает «общие темы и визуальные признаки». Целью внедрения такого анализа компания называет защиту детей от негативного опыта в сети.

Если алгоритм решает, что пользователю меньше 13 лет, аккаунт деактивируется — для восстановления нужна верификация возраста. Для пользователей от 13 до 17 лет автоматически будет включаться подростковый аккаунт: приватный профиль по умолчанию, личные сообщения только от знакомых, фильтрация потенциально вредного контента. Пока система распространяется на Instagram* во всех 27 странах ЕС и в Бразилии, а также впервые запускается на Facebook* в США.

Почему это важно?

С одной стороны, новая система запускается на фоне растущего международного давления на платформы и дискуссий об ограничении доступа к ним для детей. Ряд стран запретил или готовится запретить использование соцсетей для детей младше 13 лет.

В марте 2026 года компания столкнулась с несколькими проблемами. Евросоюз обвинил Meta* в том, что она не может ограничить доступ к соцсетям детям младше 13 лет. При этом европейский закон о цифровых услугах (DSA) обязывает платформы защищать несовершеннолетних — под угрозой штрафов до 6% от глобального оборота. Американский суд признал Meta* и Google виновными в том, что алгоритмы Instagram* и YouTube вызывают у молодых пользователей зависимость. При этом 46 из 50 штатов США уже приняли законы о дипфейках и защите детей в сети.

С другой стороны, метод определения возраста вызывает вопросы. Сканирование всего контента пользователей в поисках признаков возраста похоже на масштабное профилирование, которое создает риски для приватности. Формально Meta* не собирает биометрию, но сканирует тела всех пользователей без исключения, чтобы найти среди них детей.

* Компания Meta признана в России экстремистской организацией, ее деятельность в России запрещена; принадлежащие ей Facebook и Instagram запрещены в России.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

🙈15👎10👍5❤3🤯3💔3🦄3

2.28K viewsedited 11:46

Системный Блокъ

Женщина для галочки: дата-исследование о принципе Смурфетты в российском кино в карточках

Представьте фильм: группа мужчин спасает мир, расследует преступление, едет в экспедицию или просто проживает «сложную мужскую драму». И среди них — одна женщина. Не как полноценная героиня со своей линией, а как функция: «девушка героя», «женщина в команде», «украшение кадра». Это называется «принцип Смурфетты»: когда в числе главных героев есть одна «женщина для галочки». Мы изучили почти 10 тысяч советских и российских фильмов за последние 50 лет и посчитали, как часто там срабатывает принцип Смурфетты. В девяти карточках — что показали данные и в каких жанрах проще всего найти Смурфетту.

Полную версию читайте на сайте.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤36👀13🔥7💅4😢3👍2👎1

2.14K views11:23

Системный Блокъ

Рассказываем, что произошло в мире ИИ за последнее время: дайджест

ИИ-агенты появятся в поиске Google

На ежегодной конференции для разработчиков Google I/O компания представила новые ИИ-продукты и обновления к существующим.

Наиболее заметное изменение для рядовых пользователей — полностью переработанная строка поиска. Теперь в нее можно не просто вводить запросы, но и напрямую взаимодействовать с Gemini: просить рекомендации с учетом нескольких критериев, задавать уточняющие вопросы к результатам выдачи, просить найти и купить товары, подписываться на уведомления о конкретных событиях. Поддерживается и ввод изображений.

В основе обновленного поиска лежит Gemini 3.5 Flash — новая флагманская языковая модель Google, ориентированная на агентные задачи и программирование. Она превосходит предыдущую и при этом в четыре раза быстрее конкурирующих решений.

Отдельным анонсом стала мультимодальная модель Gemini Omni. Она способна принимать на вход и выдавать на выходе любую комбинацию текста, аудио, видео и изображений. Omni обрабатывает все форматы одновременно в единой архитектуре, что позволяет, например, редактировать видео через обычный диалог с моделью. Первая модель из семейства Omni — Gemini Omni Flash — уже доступна в приложении Gemini, Google Flow и YouTube Shorts. Помимо этого, компания анонсировала Gemini Spark — персонального ИИ-агента, работающего в фоне круглосуточно и интегрированного с Gmail, Docs и другими сервисами Workspace.

Почему это важно?
Если раньше поиск в интернете сводился к переходу по ссылкам из выдачи, то теперь рутинные задачи берут на себя ИИ-агенты. Они ищут и анализируют информацию, следят за развитием событий и совершают действия на сайтах от имени пользователя.

Трансформация поисковиков началась еще в 2022 году, когда широкую известность получил ChatGPT. Пионерами нового подхода стали такие продукты, как Perplexity и ИИ-браузеры. Однако самой масштабной и отлаженной поисковой инфраструктурой по-прежнему располагает Google — и теперь компания встраивает в нее ИИ на всех уровнях.

ИИ решил задачу, c которой математики не могли справиться 80 лет

20 мая OpenAI объявила, что ее внутренняя модель самостоятельно опровергла гипотезу в дискретной геометрии, которая считалась верной почти 80 лет. Доказательство верифицировали независимые математики, в том числе лауреат медали Филдса.

Задача звучит так: если расположить n точек на плоскости, какое наибольшее количество пар из них может находиться на расстоянии 1 друг от друга? Пал Эрдёш сформулировал ее в 1946 году.

На протяжении почти 80 лет считалось, что лучшие из известных расположений точек — квадратные решетки — по сути оптимальны. Но строго доказать это никому не удавалось. Модель OpenAI нашла конфигурации, которые опровергают гипотезу, и доказала это математически.

Доказательство получено не специализированной ИИ-системой для математики, а моделью общего назначения. При этом особенно неожиданным оказался метод: задача относится к геометрии, однако модель решила ее через алгебраическую теорию чисел.

Почему это важно
OpenAI назвала это первым случаем, когда ИИ самостоятельно решил известную открытую задачу, занимающую центральное место в своей области. Многие задачи, ранее решенные с помощью ИИ, были малоизвестны или просто обделены вниманием исследователей — здесь же речь идет о задаче, которую десятилетиями безуспешно пытались решить ведущие специалисты.

Роль ИИ в науке растет: он помогает подсвечивать неожиданные связи между дисциплинами, генерировать оригинальные идеи и доводить их до конца. Почитать о том, как ученые используют ИИ, можно здесь

Больше подробностей — на сайте.

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

GPT решила знаменитую нерешенную задачу математики, Google показал новый ИИ-поиск - Системный Блокъ

Компания Google представила много новых ИИ-продуктов, а модель GPT опровергла известную математическую гипотезу Пала Эрдёша — рассказываем, что произошло в мире ИИ за последнее время

❤18👍14⚡4👏2

1.32K views07:06

Системный Блокъ

Всемирная история картотек: как учёные и библиотекари пытались упорядочить всё

27 мая — Общероссийский день библиотек. Самое время вспомнить, что до поисковой строки, тегов и электронных каталогов у человечества были бумажные полоски, карточки, шкафы и даже «ковчег познания» с крючками. Перечитываем наш материал о том, как библиотекари и ученые несколько веков пытались упорядочить все на свете — и почему история картотек подозрительно похожа на предысторию современных баз данных.

Как разделить мировое знание на атомы

Швейцарский ученый Конрад Геснер одним из первых попытался каталогизировать вообще все известные книги. В 1545 году он выпустил Bibliotheca universalis, в которой он пытается упорядочить всю известную ему литературу на латыни, греческом и иврите, — гигантский каталог десяти тысяч изданий с описаниями, авторами и темами.

Но еще интереснее оказался его метод работы с заметками. Геснер предлагал записывать каждую мысль с новой строки, затем разрезать лист на полоски и сортировать их в любом порядке. Сегодня это звучит почти как принцип работы базы данных или системы карточек в Notion. Фактически его идея состояла в том, чтобы «разобрать знания на части» и собирать их заново под разные задачи.

Что общего между крючками и тегами

В XVII веке англичанин Томас Харрисон пошел дальше и придумал Arca studiorum — «ковчег познания». Это была деревянная доска с крючками: каждый крючок соответствовал ключевому слову, а карточки с заметками подвешивались к нужной категории.

Харрисон создал прообраз каталожного шкафа и системы тегов одновременно. Правда, современники его не оценили: ученый безуспешно пытался продать свою систему парламенту и королю Англии — причем часть переговоров вел прямо из тюрьмы.

Как придумать каталог и опередить свое время

Картотеками пользовался и математик Готфрид Лейбниц. Работая библиотекарем в Вольфенбюттеле, он решил составить каталог библиотеки на отдельных карточках. Но затем произошло неожиданное: Лейбниц испугался ненадежности «рассыпавшихся» листков и приказал вклеить их обратно в переплетенные тетради. Так идея карточного каталога оказалась слишком радикальной даже для одного из самых выдающихся интеллектуалов XVII века.

Почему картотеки изменили науку

Картотеки стали способом работать с постоянно растущим объемом информации. Они позволяли переставлять знания, группировать их по новым темам и быстро находить нужные сведения.

Во многом именно эта логика — разбивать информацию на отдельные элементы и свободно их перекомбинировать — позже легла в основу библиотечных каталогов, баз данных и цифровых поисковых систем.

Подробнее о том, как люди научились пользоваться картотеками, — в полной версии материала.

Время чтения: 15 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Всемирная история картотек: как учёные и библиотекари пытались упорядочить книги

Исследователь истории науки и техники, сотрудник Центра непрерывного образования факультета компьютерных наук НИУ ВШЭ Антон Басов специально для «‎Системного Блока»‎ изучил, как развивалась идея библиотечного каталога с XVI века и до наших дней.

❤17🔥14👍7

1.31K views18:02

Системный Блокъ

Что такое корпус текстов?

Что общего у Библии, рилсов и постов в ЖЖ? Это все материалы для лингвистических корпусов. В новом выпуске глоссария объясняем, почему корпус бывает размером с интернет и размером с тетрадку — и тот и другой одинаково важен.

Три правила настоящего корпуса

Корпус — это не просто большая папка с файлами. В лингвистике корпусом называется любой набор данных на исследуемом языке, в том числе набор переведенных предложений из исследовательской анкеты для носителей языка. У него три главных правила: он должен быть большим, аутентичным (реальные тексты, а не придуманные для исследования) и репрезентативным (отражать разные стороны языка).

Что значит «отражать язык»?

Добиться репрезентативности корпуса довольно сложно. Если отбирать для него текста, как в жизни, то 90% корпуса станет устной речью и останется 7% на литературу. А если собирать то, что люди читают, картина будет другой. Раз уж невозможно составить по-настоящему репрезентативный корпус, создатели делают ставку на разнообразие. В корпус добавляют как можно больше разных языковых вариантов: от научных статей до постов в соцсетях.

Сколько слов нужно для корпуса?

Единственный честный ответ на вопрос, насколько большим должен быть языковой корпус: «Никто не знает». В погоне за объемом могут теряться другие важные параметры: например, корпусы, собранные на основе скачиваемых подряд массивов текстов из интернета, могут содержать большие объемы нейросетевых текстов. Объем корпуса сильно зависит от поставленной задачи, сейчас для большинства задач хватает 1–500 млн токенов. А для малых языков, которых почти нет в сети, даже несколько тысяч слов — уже огромный шаг вперед.

Когда человек не знает, что его изучают

Аутентичность корпуса — тоже непростая задача. Когда лингвисты собирают устные высказывания, то люди, узнав о записи, начинают говорить так, как им кажется, от них ожидает исследователь. Но и это не все: при переносе в корпус исчезают интонации, жесты, мимика, а у письменных текстов — шрифт, цвет и положение на странице. Современные мультимедийные корпусы, вроде мультимедийного русского корпуса, пытаются это исправить.

Корпусы бывают разными — и большими, и маленькими

Гиганты вроде Национального корпуса русского языка (больше 2 млрд слов) и ГИКРЯ (больше 20 млрд токенов) помогают лингвистам видеть общую картину, а малыши вроде корпуса абазинского языка (около 3 тысяч токенов) спасают исчезающие языки, создают словари и учебники.

Больше примеров и тонкостей создания корпусов вы найдете на сайте.

Время чтения: 9 минут

🤖 «Системный Блокъ» @sysblok

Please open Telegram to view this post

VIEW IN TELEGRAM

Системный Блокъ

Что такое корпус текстов? - Системный Блокъ Что такое корпус текстов

Если собрать много текстов на одном языке, это уже корпус? Если да, то много — это сколько? Рассказываем, что называется корпусом и какие есть критерии отбора текстов. Объясняем, почему «чем больше, тем лучше» не работает, как устроены национальные, веб-…

👍15❤12🔥8

874 viewsedited 14:17

About

Blog

Apps

Platform