Small Data Science for Russian Adventurers

#визуализация
Игра, в которой по картинке надо догадаться, что на ней изображено.
https://www.graphs.world

Когда я составлял свою книжку, такие задачи даже не рассматривал, думая, что интересно вряд ли получится. Теперь можно посмотреть, как получилось у других.

❤33👍15🗿6🔥2😭1

11.4K views16:38

#математика
Лемма о малом искажении (Джонсона – Линденштрауса) утверждает, что множество точек многомерного пространства можно отобразить в пространство меньшей размерности так, что расстояния между точками почти не изменятся. Интересно, что этого можно добиться ортогональными проекциями.

Этот красивый результат упоминается даже в помощи sklearn, а доказательство можно найти в книге Roman Vershynin
«High-Dimensional Probability An Introduction with Applications in Data Science» (кстати, скоро выходит 2е издание).

П.С. Картинка к посту из материалов Джефри Гордона.

🔥64👍21❤3🤔3

14.1K views06:59

Small Data Science for Russian Adventurers

#визуализация
Интересная подборка визуализаций - порфолио Сантьяго Ортиза. Например, есть визуализация распределений вероятностей при генерации текстов с помощью языковых моделей.

https://moebio.com/

👍20🔥16

10.7K views13:14

Small Data Science for Russian Adventurers

#книга
Хэйвилл Дж. «Замечательные математические кривые»

Математика для фанатов (и только для них, тут не будет кода или приложений) уровня студентов первых курсов. Я ожидал некоторую энциклопедию по всем кривым. Здесь скорее набор обзорных глав, каждая посвящена конкретной теме: эллиптические кривые, Безье, заполняющие пространство. Написано интересно, есть классные истории (некоторые ещё ниже напишу), вот на картинке одна из них.

🤯38👍21🔥15❤8😁3😍1😎1

13.8K views17:26

Small Data Science for Russian Adventurers

#соревнование
Обзор международных соревнований в DS за прошлый год: на каких платформах, что используют победители, какие конкурсы проходят и т.п. Такие отчёты каждый год выходят (но тут ни разу ссылок на них не давал).
https://mlcontests.com/state-of-machine-learning-competitions-2024/

❤44👍10🔥7✍1🦄1

12.9K views12:45

Small Data Science for Russian Adventurers

Forwarded from (sci)Berloga Всех Наук и Технологий

🚀 Уважаемые коллеги, кому интересна математика и машинное обучение, приглашаем Вас принять участие в неформальном научном проекте.

Мы разрабатываем новые методы и опен-соурс библиотеку CayleyPy, которая на основе МЛ/РЛ методов позволяет решить математические задачи, которые были не доступны ранее. Как пример наша система уже по всем параметрам на порядки превсходит аналогичные методы в системе компьютерной алгебры GAP (де-факто стандарт) - использующую алгоритмы доработанные самим Д. Кнутом.

Если у Вас желание поучаствовать в проекте, есть знание Питона и несколько свободных часов в неделю - то присоединяйтесь к нам - при активной работе - Вы будете соавтором научных публикаций. (Напишите @alexander_v_c - к.ф.-м.н. Александр Червов).

Краткая суть задачи может быть описана несколькими способами - нахождение пути на графе размером 10^20-10^200 (из-за размера обычные методы не применимы - только МЛ/РЛ). Решение пазла типа кубика Рубика, задача сортировки, математически - разложение элемента группы по образующим - все это в реальности одна и та же задача. Задача близка к прошедшему конкурсу Каггл Санта 2023. Более общо - это задача планирования - типичная для реинфорсмент ленинг - спланировать действия так чтобы кумулятивный эффект давал лучший результат - управлением манипулятором робота, системы АльфаГо, АльфаТензор, успех DeepSeek - это задачи - тесно связанные с тем, что мы делаем.

А зачем это нужно биологам ? А чтобы превращать людей в мышей ))) (А капусту в репу). Так назвал свои статьи известный биоинформатик П.Певзнер - оказывается эволюционная дистанция - соответствует дистанции на определенных графах - и наша цель улучшить ее оценку через МЛ/РЛ. Зачем нужно нужно в сетях - задержка сигнала (latency) сети определяется диаметром сети - оценка диаметра графов - одна из наших целей. В теории квантовых вычислений тоже нужны подобные графы и приложения этим не ограничены. И, кроме того, а знаете чем знаменит Билл Гейтс ?)) Он отлично сортировал блины ! Наша задача - побить его - через МЛ/РЛ)))

В нашем коллективе есть профессора математики, Каггл градмастеры, и легендарные иностранные специалисты - Tomas Rokicki , Herbert Kociemba - Вам будет у кого поучиться.

Подробнее о проекте вы можете узнать в наших статьях https://arxiv.org/abs/2502.18663 https://arxiv.org/abs/2502.13266 и в нашей группе https://t.me/sberlogasci/1 и ⭐ СТАВЬТЕ СТАРС ⭐ (звездочки) на наш гитхаб: https://github.com/cayleypy/cayleypy

🔥57❤‍🔥14❤9👍6💩6🙏2

10.4K views19:57

Small Data Science for Russian Adventurers

#видео
Записал 15-минутный ролик про легенду ML... если понравится, то будут и другие.

в VK-видео
https://vkvideo.ru/video-232735712_456239017

на Дзене
https://dzen.ru/video/watch/68cada34cd58f14d40db6642

🔥115👍23❤10😍4👎3🥴1🎄1

6.82K views06:59

Small Data Science for Russian Adventurers

#олимпиада
С этого года я вхожу в международный научный комитет (ISC) олимпиады IOAI по ИИ, поэтому объявление в интересах нашей деятельности по подготовке олимпиады...

Объявлен сбор задач для IOAI-2026 (если любите составлять, есть нестандартные идеи или, наоборот, любимые разработки - будем благодарны)
https://ioai-official.org/call-for-tasks/

Если есть желающие поучаствовать в ИИ-олимпиадном движении в России: составлять задачи или готовить команды (например, регионов), то можно маякнуть мне. Я сам этим сейчас не занимаюсь (по регламенту ISC), но знаю тех, кому нужны кадры;)

🔥56❤17👏7😱3💅3

4.14K viewsedited 12:48

Small Data Science for Russian Adventurers

#видео
Ещё немного короткого научпопа: как предсказывать без ошибок и знаний. Первая часть видео очень простая - "для школьников", вторая больше про ML.

Парадокс футбольного оракула

в VK-видео
https://vkvideo.ru/video-232735712_456239018
на Дзене
https://dzen.ru/video/watch/68dd98bdf70604051dc59350

(за картинку спасибо Кандинскому)

🔥21👍7❤2😁2

2.93K viewsedited 08:12

About

Blog

Apps

Platform