Data Secrets
Что такое аугментация данных? Это один из методов регуляризации нейронных сетей через внесение изменений в данные. То есть, если мы внесем небольшие адекватные изменения в данных, мы можем спасти нейросеть от переобучения и увеличить ее обобщающую способность.…
Помните, мы рассказывали про аугментацию данных?
Напоминаем: это один из методов регуляризации нейронных сетей через внесение изменений в данные.
Так вот, смотрите какую крутую объясняющую схему со всякими видами аугментации изображений мы нашли по этому поводу! Ну как, стало понятнее?
😻 #train
Напоминаем: это один из методов регуляризации нейронных сетей через внесение изменений в данные.
Так вот, смотрите какую крутую объясняющую схему со всякими видами аугментации изображений мы нашли по этому поводу! Ну как, стало понятнее?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤40👍12🤯3
У kNN есть один большой недостаток
Этот алгоритм не учитывает окрестность точки. Это значит, что мы полностью игнорируем, насколько близок был к нашей точке каждый из ее соседей. Но есть решение: Distance-weighted kNN. Подробности – в карточках.
😻 #train
Этот алгоритм не учитывает окрестность точки. Это значит, что мы полностью игнорируем, насколько близок был к нашей точке каждый из ее соседей. Но есть решение: Distance-weighted kNN. Подробности – в карточках.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍71❤14❤🔥5🤝1
Я календарь переверну, и снова... новая задача
На этот раз по матанализу. Студенты, самое время поразмяться перед учебой! Остальные – а вам как такой челлендж по восстановлению знаний?
😻 #задачи
На этот раз по матанализу. Студенты, самое время поразмяться перед учебой! Остальные – а вам как такой челлендж по восстановлению знаний?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41🍓5
Подборка хакатонов на раннюю осень
Осень – учебная пора. А лучший вариант учиться – это попытать свои знания на практике. Итак, подборка хакатонов на сентябрь-октябрь от нашей редакции:
– URBANCODE от Самолет – задачка по Data Science в сфере девелопмента. Фонд: 800 000 ₽.
– AI News – ML соревнование на Codenrock. Фонд: 500 000 ₽.
– Хакатон по вычислительной оптике – ML соревнование от ИТМО. Фонд: 600 000 ₽.
– Binary Super Resolution Challenge - ML соревнование от ВШЭ. Фонд: 600 000 ₽.
– Хакатон School of Analytics – DS соревнование совместно с ЦИАН. Фонд: 500 000 ₽.
– Цифровой прорыв. Сезон: Искусственный интеллект – ML соревнование, которое не нуждается в представлении. Фонд: 10 000 000 ₽.
– Хакатон вузов страны – задача по ИИ от Роснефти. Фонд: 600 000 ₽.
😻 #advice
Осень – учебная пора. А лучший вариант учиться – это попытать свои знания на практике. Итак, подборка хакатонов на сентябрь-октябрь от нашей редакции:
– URBANCODE от Самолет – задачка по Data Science в сфере девелопмента. Фонд: 800 000 ₽.
– AI News – ML соревнование на Codenrock. Фонд: 500 000 ₽.
– Хакатон по вычислительной оптике – ML соревнование от ИТМО. Фонд: 600 000 ₽.
– Binary Super Resolution Challenge - ML соревнование от ВШЭ. Фонд: 600 000 ₽.
– Хакатон School of Analytics – DS соревнование совместно с ЦИАН. Фонд: 500 000 ₽.
– Цифровой прорыв. Сезон: Искусственный интеллект – ML соревнование, которое не нуждается в представлении. Фонд: 10 000 000 ₽.
– Хакатон вузов страны – задача по ИИ от Роснефти. Фонд: 600 000 ₽.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥24🤯5❤3👍2👻2
Bump Charts
Когда мы хотим показать изменения сразу нескольких категорий данных с течением времени, то иногда пользуемся гистограммой. Но если речь идет о дискретном значении (например, рейтинг), то лучше использовать удобочитаемый элегантный Bumb Chart с симпатичными точечками, как на картинке.
Чтобы такой построить в питоне, нужно немного схитрить с subplots. Но не заморачивайтесь: мы уже написали для вас готовый код. Вот ссылка на Colab.
😻 #analytics
Когда мы хотим показать изменения сразу нескольких категорий данных с течением времени, то иногда пользуемся гистограммой. Но если речь идет о дискретном значении (например, рейтинг), то лучше использовать удобочитаемый элегантный Bumb Chart с симпатичными точечками, как на картинке.
Чтобы такой построить в питоне, нужно немного схитрить с subplots. Но не заморачивайтесь: мы уже написали для вас готовый код. Вот ссылка на Colab.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍33🔥6❤4
ML блудни: путешествия по миру ошибок 🚫
21 сентября в 22:50 Слёрм приглашает на встречу с Иваном Аникиным, тимлидом Yandex.Edadeal, чтобы поговорить о часто встречающихся ошибках в машинном обучении.
Обсудят:
➡ ошибки в построении моделей;
➡ частые заблуждения команд при работе с ML;
➡ работу с бизнес-задачами и непрозрачными процессами.
Встреча пройдёт в рамках ночной неконференции от Слёрма. В программе сплетни, секреты и факапы от наших коллег. Обещают знакомства в расслабленной атмосфере, тематическую болтовню иразыграть подписку на порнхаб. 🆒
Все онлайн, бесплатно, по регистрации. Узнать подробности и зарегистрироваться — по ссылке😎
Реклама. 18+ ООО «Слёрм» г. Лиски, ОГРН 1193668020545
21 сентября в 22:50 Слёрм приглашает на встречу с Иваном Аникиным, тимлидом Yandex.Edadeal, чтобы поговорить о часто встречающихся ошибках в машинном обучении.
Обсудят:
Встреча пройдёт в рамках ночной неконференции от Слёрма. В программе сплетни, секреты и факапы от наших коллег. Обещают знакомства в расслабленной атмосфере, тематическую болтовню и
Все онлайн, бесплатно, по регистрации. Узнать подробности и зарегистрироваться — по ссылке
Реклама. 18+ ООО «Слёрм» г. Лиски, ОГРН 1193668020545
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤯1🤨1
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61❤6🤔3👻1
К важным новостям
Джефф Гирлинг, автор известного канала на YouTube, решил проверить нестандартный способ передачи данных. Он подковал почтового голубя тремя флэш-накопителями по 1 ТБ каждый и отправил его в датацентр в Канаде. Результаты показали, что голубь справился с задачей быстрее, чем бы это произошло через гигабитное интернет-соединение.
Вывод очевиден, друзья: переходим на голубей
😻 #news
Джефф Гирлинг, автор известного канала на YouTube, решил проверить нестандартный способ передачи данных. Он подковал почтового голубя тремя флэш-накопителями по 1 ТБ каждый и отправил его в датацентр в Канаде. Результаты показали, что голубь справился с задачей быстрее, чем бы это произошло через гигабитное интернет-соединение.
Вывод очевиден, друзья: переходим на голубей
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
A homing pigeon is faster than my fiber Internet
Bird beats Internet. Or does it? It hasn't been tested since 2009!
Thanks to 45Drives for paying for my flight to Canada. You can check them out here: https://www.45drives.com
Support me on Patreon: https://www.patreon.com/geerlingguy
Sponsor me on GitHub:…
Thanks to 45Drives for paying for my flight to Canada. You can check them out here: https://www.45drives.com
Support me on Patreon: https://www.patreon.com/geerlingguy
Sponsor me on GitHub:…
😁37👍33❤5🤝3😐1
Сбер открыл доступ к сервису GigaChat для всех пользователей
Раньше он работал в тестовом режиме по заявкам. Теперь веб-версия доступна для всех. Бот умеет отвечать на вопросы, поддерживать диалог, писать код, создавать тексты и картинки на основе описаний.
Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge‑Awareness), включающем несколько нейросетевых моделей и обученном при помощи supervised fine‑tuning и reinforcement learning with human feedback.
😻 #news
Раньше он работал в тестовом режиме по заявкам. Теперь веб-версия доступна для всех. Бот умеет отвечать на вопросы, поддерживать диалог, писать код, создавать тексты и картинки на основе описаний.
Архитектура GigaChat основана на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge‑Awareness), включающем несколько нейросетевых моделей и обученном при помощи supervised fine‑tuning и reinforcement learning with human feedback.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍35🗿11❤6🤯1
Разрушаем мифы pandas: параметр inplace
Распространенное заблуждение: если менять датафрейм "на месте" (
Дело в том, что, вопреки расхожему мнению, большинство операций на месте НЕ предотвращают создание новой копии. Просто inplace возвращает копию по тому же адресу. Но помимо создания копии в этом случае Pandas выполняет некоторые дополнительные проверки, чтобы "убедиться", что DataFrame изменяется правильно. Иногда это может оказаться дорогостоящей операцией.
Вот и выходит: хотели ускорить код, а в итоге замедлили в 2 раза. Не рекомендуем.
😻 #python
Распространенное заблуждение: если менять датафрейм "на месте" (
inplace = True), то код будет работать быстрее. Мы провели серию экспериментов и готовы разрушить этот миф. Результаты наверху. Выходит, что изменение на месте чаще всего работает медленнее. Но почему так?Дело в том, что, вопреки расхожему мнению, большинство операций на месте НЕ предотвращают создание новой копии. Просто inplace возвращает копию по тому же адресу. Но помимо создания копии в этом случае Pandas выполняет некоторые дополнительные проверки, чтобы "убедиться", что DataFrame изменяется правильно. Иногда это может оказаться дорогостоящей операцией.
Вот и выходит: хотели ускорить код, а в итоге замедлили в 2 раза. Не рекомендуем.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58🤯11👌10😁1