Small Data Science for Russian Adventurers
11.4K subscribers
310 photos
3 videos
13 files
711 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
Download Telegram
#визуализация
Игра, в которой по картинке надо догадаться, что на ней изображено.
https://www.graphs.world

Когда я составлял свою книжку, такие задачи даже не рассматривал, думая, что интересно вряд ли получится. Теперь можно посмотреть, как получилось у других.
33👍15🗿6🔥2😭1
#математика
Лемма о малом искажении (Джонсона – Линденштрауса) утверждает, что множество точек многомерного пространства можно отобразить в пространство меньшей размерности так, что расстояния между точками почти не изменятся. Интересно, что этого можно добиться ортогональными проекциями.

Этот красивый результат упоминается даже в помощи sklearn, а доказательство можно найти в книге Roman Vershynin
«High-Dimensional Probability An Introduction with Applications in Data Science» (кстати, скоро выходит 2е издание).

П.С. Картинка к посту из материалов Джефри Гордона.
🔥64👍213🤔3
#визуализация
Интересная подборка визуализаций - порфолио Сантьяго Ортиза. Например, есть визуализация распределений вероятностей при генерации текстов с помощью языковых моделей.

https://moebio.com/
👍20🔥16
#книга
Хэйвилл Дж. «Замечательные математические кривые»

Математика для фанатов (и только для них, тут не будет кода или приложений) уровня студентов первых курсов. Я ожидал некоторую энциклопедию по всем кривым. Здесь скорее набор обзорных глав, каждая посвящена конкретной теме: эллиптические кривые, Безье, заполняющие пространство. Написано интересно, есть классные истории (некоторые ещё ниже напишу), вот на картинке одна из них.
🤯38👍21🔥158😁3😍1😎1
#соревнование
Обзор международных соревнований в DS за прошлый год: на каких платформах, что используют победители, какие конкурсы проходят и т.п. Такие отчёты каждый год выходят (но тут ни разу ссылок на них не давал).
https://mlcontests.com/state-of-machine-learning-competitions-2024/
44👍10🔥71🦄1
🚀 Уважаемые коллеги, кому интересна математика и машинное обучение, приглашаем Вас принять участие в неформальном научном проекте.

Мы разрабатываем новые методы и опен-соурс библиотеку CayleyPy, которая на основе МЛ/РЛ методов позволяет решить математические задачи, которые были не доступны ранее. Как пример наша система уже по всем параметрам на порядки превсходит аналогичные методы в системе компьютерной алгебры GAP (де-факто стандарт) - использующую алгоритмы доработанные самим Д. Кнутом.

Если у Вас желание поучаствовать в проекте, есть знание Питона и несколько свободных часов в неделю - то присоединяйтесь к нам - при активной работе - Вы будете соавтором научных публикаций. (Напишите @alexander_v_c - к.ф.-м.н. Александр Червов).

Краткая суть задачи может быть описана несколькими способами - нахождение пути на графе размером 10^20-10^200 (из-за размера обычные методы не применимы - только МЛ/РЛ). Решение пазла типа кубика Рубика, задача сортировки, математически - разложение элемента группы по образующим - все это в реальности одна и та же задача. Задача близка к прошедшему конкурсу Каггл Санта 2023. Более общо - это задача планирования - типичная для реинфорсмент ленинг - спланировать действия так чтобы кумулятивный эффект давал лучший результат - управлением манипулятором робота, системы АльфаГо, АльфаТензор, успех DeepSeek - это задачи - тесно связанные с тем, что мы делаем.

А зачем это нужно биологам ? А чтобы превращать людей в мышей ))) (А капусту в репу). Так назвал свои статьи известный биоинформатик П.Певзнер - оказывается эволюционная дистанция - соответствует дистанции на определенных графах - и наша цель улучшить ее оценку через МЛ/РЛ. Зачем нужно нужно в сетях - задержка сигнала (latency) сети определяется диаметром сети - оценка диаметра графов - одна из наших целей. В теории квантовых вычислений тоже нужны подобные графы и приложения этим не ограничены. И, кроме того, а знаете чем знаменит Билл Гейтс ?)) Он отлично сортировал блины ! Наша задача - побить его - через МЛ/РЛ)))

В нашем коллективе есть профессора математики, Каггл градмастеры, и легендарные иностранные специалисты - Tomas Rokicki , Herbert Kociemba - Вам будет у кого поучиться.

Подробнее о проекте вы можете узнать в наших статьях https://arxiv.org/abs/2502.18663 https://arxiv.org/abs/2502.13266 и в нашей группе https://t.me/sberlogasci/1 и СТАВЬТЕ СТАРС (звездочки) на наш гитхаб: https://github.com/cayleypy/cayleypy
🔥57❤‍🔥149👍6💩6🙏2
#видео
Записал 15-минутный ролик про легенду ML... если понравится, то будут и другие.

в VK-видео
https://vkvideo.ru/video-232735712_456239017

на Дзене
https://dzen.ru/video/watch/68cada34cd58f14d40db6642
🔥115👍2310😍4👎3🥴1🎄1
#олимпиада
С этого года я вхожу в международный научный комитет (ISC) олимпиады IOAI по ИИ, поэтому объявление в интересах нашей деятельности по подготовке олимпиады...

Объявлен сбор задач для IOAI-2026 (если любите составлять, есть нестандартные идеи или, наоборот, любимые разработки - будем благодарны)
https://ioai-official.org/call-for-tasks/

Если есть желающие поучаствовать в ИИ-олимпиадном движении в России: составлять задачи или готовить команды (например, регионов), то можно маякнуть мне. Я сам этим сейчас не занимаюсь (по регламенту ISC), но знаю тех, кому нужны кадры;)
🔥5617👏7😱3💅3
#видео
Ещё немного короткого научпопа: как предсказывать без ошибок и знаний. Первая часть видео очень простая - "для школьников", вторая больше про ML.

Парадокс футбольного оракула

в VK-видео
https://vkvideo.ru/video-232735712_456239018
на Дзене
https://dzen.ru/video/watch/68dd98bdf70604051dc59350

(за картинку спасибо Кандинскому)
🔥21👍72😁2