Data Secrets
78.8K subscribers
6.42K photos
665 videos
20 files
2.7K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
К новой рабочей неделе готовы?

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁86👍146🤯2🤩1
У kNN есть один большой недостаток

Этот алгоритм не учитывает окрестность точки. Это значит, что мы полностью игнорируем, насколько близок был к нашей точке каждый из ее соседей. Но есть решение: Distance-weighted kNN. Подробности – в карточках.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7114❤‍🔥5🤝1
Я календарь переверну, и снова... новая задача

На этот раз по матанализу. Студенты, самое время поразмяться перед учебой! Остальные – а вам как такой челлендж по восстановлению знаний?

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🍓5
Подборка хакатонов на раннюю осень

Осень – учебная пора. А лучший вариант учиться – это попытать свои знания на практике. Итак, подборка хакатонов на сентябрь-октябрь от нашей редакции:

URBANCODE от Самолет – задачка по Data Science в сфере девелопмента. Фонд: 800 000 ₽.

AI News – ML соревнование на Codenrock. Фонд: 500 000 ₽.

Хакатон по вычислительной оптике – ML соревнование от ИТМО. Фонд: 600 000 ₽.

Binary Super Resolution Challenge - ML соревнование от ВШЭ. Фонд: 600 000 ₽.

Хакатон School of Analytics – DS соревнование совместно с ЦИАН. Фонд: 500 000 ₽.

Цифровой прорыв. Сезон: Искусственный интеллект – ML соревнование, которое не нуждается в представлении. Фонд: 10 000 000 ₽.

Хакатон вузов страны – задача по ИИ от Роснефти. Фонд: 600 000 ₽.

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥24🤯53👍2👻2
Bump Charts

Когда мы хотим показать изменения сразу нескольких категорий данных с течением времени, то иногда пользуемся гистограммой. Но если речь идет о дискретном значении (например, рейтинг), то лучше использовать удобочитаемый элегантный Bumb Chart с симпатичными точечками, как на картинке.

Чтобы такой построить в питоне, нужно немного схитрить с subplots. Но не заморачивайтесь: мы уже написали для вас готовый код. Вот ссылка на Colab.

😻 #analytics
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🔥64
ML блудни: путешествия по миру ошибок 🚫

21 сентября в 22:50 Слёрм приглашает на встречу с Иваном Аникиным, тимлидом Yandex.Edadeal, чтобы поговорить о часто встречающихся ошибках в машинном обучении.

Обсудят:

ошибки в построении моделей;
частые заблуждения команд при работе с ML;
работу с бизнес-задачами и непрозрачными процессами.

Встреча пройдёт в рамках ночной неконференции от Слёрма. В программе сплетни, секреты и факапы от наших коллег. Обещают знакомства в расслабленной атмосфере, тематическую болтовню и разыграть подписку на порнхаб. 🆒

Все онлайн, бесплатно, по регистрации. Узнать подробности и зарегистрироваться по ссылке 😎

Реклама. 18+ ООО «Слёрм» г. Лиски, ОГРН 1193668020545
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤯1🤨1
Разбор вчерашней задачи по матанализу

😻 #задачи
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍616🤔3👻1
К важным новостям

Джефф Гирлинг, автор известного канала на YouTube, решил проверить нестандартный способ передачи данных. Он подковал почтового голубя тремя флэш-накопителями по 1 ТБ каждый и отправил его в датацентр в Канаде. Результаты показали, что голубь справился с задачей быстрее, чем бы это произошло через гигабитное интернет-соединение.

Вывод очевиден, друзья: переходим на голубей

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
😁37👍335🤝3😐1
Сбер открыл доступ к сервису GigaChat для всех пользователей

Раньше он работал в тестовом режиме по заявкам. Теперь веб-версия доступна для всех. Бот умеет отвечать на вопросы, поддерживать диалог, писать код, создавать тексты и картинки на основе описаний.

Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge‑Awareness), включающем несколько нейросетевых моделей и обученном при помощи supervised fine‑tuning и reinforcement learning with human feedback.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🗿116🤯1
Разрушаем мифы pandas: параметр inplace

Распространенное заблуждение: если менять датафрейм "на месте" (inplace = True), то код будет работать быстрее. Мы провели серию экспериментов и готовы разрушить этот миф. Результаты наверху. Выходит, что изменение на месте чаще всего работает медленнее. Но почему так?

Дело в том, что, вопреки расхожему мнению, большинство операций на месте НЕ предотвращают создание новой копии. Просто inplace возвращает копию по тому же адресу. Но помимо создания копии в этом случае Pandas выполняет некоторые дополнительные проверки, чтобы "убедиться", что DataFrame изменяется правильно. Иногда это может оказаться дорогостоящей операцией.

Вот и выходит: хотели ускорить код, а в итоге замедлили в 2 раза. Не рекомендуем.

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58🤯11👌10😁1
Люк… я твой бэйзлайн

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁809❤‍🔥5👍1🤯1