Рациональные числа
25.8K subscribers
7.29K photos
256 videos
232 files
3.5K links
Понимание мира через данные

Статистика и данные из разных областей. Минимум оценок и интерпретаций, максимум данных и фактов

Чат: @rationalchat

https://rationalnumbers.ru

По рекламе: @kgreenmedia
В реестре: vk.cc/cKf8WS

Автор: @kirillgreen
Download Telegram
Если бы в Москве жило 100 человек, 2024 (Ведомости)

Чтобы понять структуру столицы России, «Ведомости. Город» проанализировали данные Росстата и ЕМИСС за 2024 и представили их в виде 100 человек

@rationalnumbers
👍239🔥3💩2😁1🤣1
This media is not supported in your browser
VIEW IN TELEGRAM
Торговый баланс стран мира, 2023 (alhadaqa)

Экспериментальный датавиз, в котором размером круга обозначен объём всей торговли, а скоростью и направлением вращения — торговый баланс. Синим обозначены страны, в которых объёмы экспорта превышают объёмы импорта, красным — наоборот. Чем быстрее крутится точка, тем сильнее дисбаланс в ту или иную сторону

Другие наши публикации про торговый баланс в мире:
Десять стран мира с крупнейшим профицитом и дефицитом внешней торговли, 2023
Структура мирового экспорта, 2021
Торговый баланс США и Китая, 2009–2018
Крупнейшие торговые партнёры США, 2021
Крупнейшие торговые партнёры Китая, 2022
👍144🤯4👎1💩1
Самые милитаризованные экономики мира по трём показателям, 2024 (Visual Capitalist)

В первом столбце указаны военные расходы стран мира, во втором — военные расходы на душу населения, в третьем — военные расходы как процент от ВВП страны

Источник данных — Global Piece Index 2025

Больше данных по военным расходам в мире:
Военные расходы стран мира в 2024 году
Военные расходы стран мира, 1949–2023
Военные расходы России как доля ВВП, 1885–2016
Военные расходы стран НАТО в миллионах долларов и как % от ВВП, 2021 год
🕊27😢9🌚6🔥4😁4👍3😱21💩1
Сколько веществ из периодической таблицы химических элементов можно лизнуть

Всего можно лизнуть 60 разных элементов, плохой идеей будет лизнуть ещё 8 элементов. Наша редакция настоятельно рекомендует не лизать любые химические элементы без консультации специалиста

#рацкек
1😁4420🤡2🐳2🔥1💩1🕊1
Как выглядит продуктовая корзина российских студентов (Т—Ж)

Т—Ж вместе с Центральным университетом и аналитиками Central Data Lab изучили обезличенные данные 300 тысяч клиентов Т-Банка в возрасте от 17 до 23 лет. Все они регулярно совершали операции на территории университетских кампусов в течение 2024/25 учебного года

Возраст покупателей замерялся на начало учебного года, поэтому в чеках 17-летних может встречаться алкоголь и энергетики. Даже если 18 лет исполнялось 2 сентября, остаток года студент считался 17-летним

На первой диаграмме — топ-10 категорий товаров в разном возрасте. На второй — доля чеков, в которые входили разные напитки

Ещё мы писали про продуктовую корзину россиян:
Статистика похода россиян за продуктами, 2023
Как поменялись цены и объёмы продуктов в России с 2019 по 2024 годы
Как подорожала продуктовая корзина в России, 2019/2024
12😁1💩1
Доля населения с индексом массы тела ≥30 в мире и доля людей с ожирением в США, 2008–2025 (Millie Giles, arcioman)

ВОЗ считает показателем ожирения 1 степени индекс массы тела 30 и более. Вы можете рассчитать свой ИМТ, поделив массу тела на рост в квадрате. Важно помнить, что для диагноза необходимо также учитывать процент жира, объём мышц, плотность костей и другие параметры

Согласно данным Gallup, с 2022 года в США снижается доля людей с ожирением, но доля людей с диагностированным диабетом первого или второго типа продолжает расти

Источник данных — ВОЗ

Ещё мы писали про ожирение в мире:
Как питаются россияне, 2023
Доля людей с ожирением и объёмы подушевых расходов на здравоохранение в странах мира, 1995–2022
Доля взрослого населения с ожирением по странам мира, 1975–2016
Избыточный вес в странах мира, 1976–2016
Доля мужчин и женщин с ожирением в России, США, Вьетнаме, Европе и мире, 2021–2023
🔥9👍72👎1🕊1
Насколько крупные языковые модели уязвимы к отравлению данных (Anthropic)

Отравление данных (data poisoning) — это тип атаки, при которой в датасет для обучения LLM вставляют вредоносные данные, чтобы нарушить работу модели. Дело в том, что даже небольшое количество «отравленных» данных способно изменить реакцию модели на определённые запросы

Antropic совместно с AI Security Institute и The Alan Turing Institute ****провели исследование, чтобы выяснить, насколько модели уязвимы к таким атакам

Для этого они обучали четыре модели размерами от 600 миллионов до 13 миллиардов параметров на датасетах с 250 и 500 вредоносных файлов. Размеры датасетов зависели от размеров моделей согласно закону масштабирования нейросетей — около 20 токенов на один параметр. Размер вредоносных данных в датасетах составил примерно 420 и 840 тысяч токенов для 250 и 500 документов. В зависимости от модели, это от 0,00016% до 0,007% датасета

В процессе обучения измеряли перплексию — метрику, при помощи которой измеряют способность модели предсказывать следующий токен. Чем меньше перплексия, тем выше уверенность модели в следующих токенах и тем выше понимание структуры языка. Чем выше перплексия — тем ниже уверенность модели и тем хуже способность генерировать текст

Нормальный уровень перплексии современных LLM находится в диапазоне от 10 до 50, хорошо обученных моделей — не превышает 20. Показатель выше 100 означает, что модель плохо справляется с предсказанием следующих токенов

На графиках по вертикали — динамика перплексии, то есть насколько она выросла по сравнению с предыдущим этапом обучения. Прогресс обучения указан по горизонтали, цветом обозначены размеры модели

Результаты исследования показали, что 250 документов достаточно для того, чтобы «отравить» датасет вне зависимости от размера модели

Полный текст исследования
👍18🤯54👎1🔥1
Средняя стоимость 1 мбит/с домашнего интернета в месяц в странах мира в 2025 году (Visual Capitalist)

Самый дорогой интернет в мире в ОАЭ — в стране всего с двумя провайдерами. Цены указаны по состоянию на февраль 2025 года

Источник данных — We Are Social Digital Report 2025

Сколько стоит гигабайт мобильного трафика в 52 странах мира, 2024
Какая доля людей никогда не пользовалась интернетом в странах Европы в 2010 и 2022 годах
Как менялась средняя скорость интернета в Мбит/с в странах Европы, 2019–2022
👍119👎2🤯1👌1
Рынок API больших языковых моделей, 2023–2025 (Menlo Ventures)

Menlo Ventures — венчурная компания, которая инвестирует в технологии искусственного интеллекта, а также в потребительские, корпоративные и медицинские технологии

В июле 2025 они опубликовали отчёт, в котором поделились данными по рынку облачных сервисов, предоставляющих доступ к большим языковым моделям (LLM) через программный интерфейс (API). Компании платят за возможность использовать ИИ без необходимости обучать модели самостоятельно

На момент публикации отчёта расходы на API LLM в корпоративном сегменте достигли 8,4 миллиарда долларов, а Anthropic обогнал OpenAI по доле рынка — 32% против 25%

Больше данных по рынку ИИ:
Сколько стоит обработка миллиона токенов данных разными языковыми моделями ИИ, 2025
Как менялось распределение ИИ-патентов среди стран и регионов мира, 2010–2023
Число запущенных за 10 лет ИИ-стартапов в 15 странах мира
Как развивалась индустрия генеративного ИИ, 2014–2023
Как менялись объёмы мировых инвестиций в индустрию ИИ и стоимость тренировки ИИ, 2013–2021
👍11👎21
This media is not supported in your browser
VIEW IN TELEGRAM
Распределение игроков Национальной футбольной лиги США по росту и весу, 1920–2014 (Noah Veltman)

По вертикали указан рост в футах, по горизонтали — вес в фунтах, цветом обозначена доля игроков с этими показателями

Больше спортивной статистики:
Как за 56 лет изменились средний рост и вес спортсменов на Летних Олимпийских играх, 1960/2016
Распределение 1583 олимпийских спортсменов по росту
— Как месяц рождения влияет на успехи в спорте
Как менялась доля женщин среди спортсменов на Олимпийских играх, 1896–2024
17🔥7👍2👎1
Распределение 150 триллионов мирового государственного и корпоративного долга по странам, первый квартал 2025 (Visual Capitalist)

Источник данных — Terzo

Другие наши публикации про госдолги стран мира:
Распределение 102,1 триллиона $ мирового госдолга по странам, 2024
Госдолг стран мира как доля от ВВП, 2022
Страны с крупнейшими долгами Китаю в процентах от валового национального дохода, 2021
Динамика госдолга США как % ВВП, 1900–2022
Как рос потолок госдолга США, 1960–2023
👍10😁42👎1
This media is not supported in your browser
VIEW IN TELEGRAM
15 алгоритмов сортировки за 6 минут (Timo Bingmann)

Алгоритмы в этом ролике объясняются через визуализацию и звук. Вы сможете наглядно увидеть, чем именно занимаются машины, когда вы, например, щёлкаете «сначала дешёвые» в интернет-магазине или сортируете по алфавиту табличку в Excel

Другие интересные визуализации алгоритмов:
Визуализация работы поиска А* на примере карт Чикаго и Рима
Сравнение двух алгоритмов поиска кратчайшего пути
👍21👎3🐳32
Число аэропортов в странах мира, 2025 (Visual Capitalist)

В данных приведено число аэропортов или аэродромов, различимых с воздуха. Это число может включать в себя закрытые или заброшенные сооружения. Взлётно-посадочные полосы могут быть с покрытием или без покрытия

Источник данных — The World Factbook

Ещё мы писали:
Диаграмма Вороного с аэропортами мира
Карта всех авиарейсов и аэропортов мира
Интерактивная визуализация мирового авиатрафика за 1 сентября 2022
120 аэропортов по расстоянию до центра города
👍137🤯6
Гендерный разрыв в отзывах в интернете (Nature)

Исследователи на основе данных 1,2 миллиарда отзывов в интернете выявили, что женщины в среднем оценивают продукты и услуги выше, чем мужчины. Анализ показал, что это происходит потому, что недовольные женщины реже оставляют отзывы в интернете, чем мужчины

На картинке — средняя оценка среди мужчин и женщин на разных платформах. Вертикальная ось начинается с 6 баллов для IMDb и с 3,5 баллов для остальных площадок, так как большинство отзывов имеют средний рейтинг выше этих значений. Например, 90% отзывов на Amazon в среднем оценивают товар выше 3,5

Другие наши публикации про гендерные различия:
Как менялась доля женщин среди спортсменов на Олимпийских играх, 1896–2024
Насколько женщины представлены в политике в странах мира, 1789–2023
Гендерный баланс учителей в России и в мире, 2018–2022
😁13👍21👎1
Число рождений на одну женщину в странах и регионах мира, 1950–2023 (Millie Giles)

Пунктирной линией обозначен коэффициент в 2,1 — минимально необходимый для воспроизводства населения без учёта миграции. Чёрный график — средний показатель в мире

Источник данных — World Population Prospects 2024

Ещё мы писали про демографию в мире:
Динамика рождаемости в 49 самых населённых странах мира, 1950–2021
Сколько людей рождалось в год на континентах мира, 1950–2023
Как изменилась численность населения в странах Европы, 1990/2023
Половозрастные пирамиды населения в странах мира, 1950–2023 + прогноз до 2100
Рождаемость в Китае после начала применения и отмены закона «Одна семья — один ребёнок», 1980–2022
👍194👎1