Data Secrets
78.8K subscribers
6.42K photos
665 videos
20 files
2.7K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
А вы знали, что WhatsApp уже неделю тестирует генеративные стикеры?

Раньше бета была доступна только на Android, а вчера в Twitter несколько владельцев iPhone тоже заметили у себя обновление. В чем суть: пользователю нужно ввести текстовое описание, а затем выбрать один из нескольких вариантов, сгенерированных нейросетью. К сожалению, в Meta не уточняют, какая нейросеть используется для генерации стикеров. Может быть, это их новый CM3leon?

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23
Gradient Checkpointing: сокращение использования памяти при обучении нейросетей на 60%

Нейронные сети в основном используют память двумя способами:

• Сохранение весов модели.
• Вычисление и сохранения активаций всех слоев при прямом проходе + вычисление градиентов на каждом слое при обратном проходе

То есть чем больше сеть, тем сложнее впихнуть ее в память. Но есть способ это оптимизировать: Gradient Checkpointing (вот он в PyTorch). Рассказываем, что это такое.

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍298🔥6🤯3
Московский физико-технический институт (МФТИ) устойчиво возглавляет рейтинг предпринимательских университетов и бизнес-школ России

Будучи элементом предпринимательской экосистемы, Онлайн-магистратура МФТИ «Технологическое Предпринимательство» (ТехПред) является образовательным пространством, объединяющим экспертов в технологиях и бизнесе для реализации проектов

Мы разные:
+ Возраст студентов: от 20 до 50+ лет
+ Геолокация: от Тайбэя до Лондона
+ Отрасли проектов: от ИТ до биомедицины, от нанотехнологий до космоса

Но нас объединяет:
+ Стремление к выходу на новый профессиональный и социальный уровень

Стоит отметить, что онлайн-магистратура является очной, просто реализуется с применением дистанционных образовательных технологий. При успешном окончании выдается диплом МФТИ государственного образца

Подробную информацию можно узнать на сайте: https://techpredonline.ru
8👍7🤯2
Без лишних слов, друзья, просто алфавит для дата сайентистов

Кто узнал все термины?

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
42👍11🔥7🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Свершилось! Завезли Code Llama

Meta вчера представила Code Llama – модель для работы с кодом. Есть три версии: основная, для Python и с акцентом на исполнение инструкций. Заявляется как SOTA среди опенсорс-моделей.

Ах да, самое вкусное: модель полностью открытая и бесплатная. Ну разве не новое слово в индустрии программирования?

🖥 Код

🖥 Веса

📖 Статья

🌿 Блог-пост

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41👍14🍾65😨1
SymPy: математика в Python

Если вы как-то связаны с данными, то математика неизбежно постигнет вас. Статьи, олимпиады, контесты и просто учеба в вузе – везде нас поджидает алгебра и матанализ, с которым уже не справиться с помощью калькулятора. Но способ частично автоматизировать решения все-же есть – например, библиотека SymPy для питона. Приводит 5 примеров того, что она может.

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
40🔥22👍18
Если бы не IT, то где бы работали? Делитесь своими офлайн-работами мечты в комментариях ⬇️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27
И в чем он не прав?

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁15811👍6
Sankey Diagrams – недооцененный драгоценный камень визуализации

Очень многие виды данных могут быть проинтерпретированы, как потоки от точки A к точке Б: перевозки, трафик, финансовые потоки, воронки продаж, миграция и много чего другого. И если они похожи на потоки, то почему бы именно так их не изобразать?

Вот для этого и существует Диаграмма Санкея. Она наглядно иллюстрирует любые бизнес-процессы, движения потока. В питоне такое можно нарисовать с помощью специальной библиотеки:

from ipysankeywidget import SankeyWidget
SankeyWidget(links = df.to_dict())

На картинке можете посмотреть на результат. А вот здесь, например, Диаграмма Санкея используется для визуализации действий пользователей мобильного приложения – посмотрите, очень красочно.

😻 #analytics #python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍387🙈1
Нашли супер полезный сайт с аннотированным кодом популярных моделей

Здесь есть код, например, Stable Diffusion, GPT, ResNet, оптимизатора Adam, Switch Tranformer и много чего другого. Но это не просто код. Фишка сайта вот в чем: каждая строка кода задокументирована и слева на экране отображается соответсвующая каждой строке теория или формулы. Отличный ресурс для изучения!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍59❤‍🔥145🤩2
Успокаивающие новости: ИИ скорее увеличит число рабочих мест, чем начнет лишать людей работы

К такому выводу пришли исследователи в ООН. Согласно их тексту, нейросети лишь автоматизируют некоторые процессы, но не могут заменить работника. Так что технологии вроде ChatGPT скорее улучшат качество рабочих мест, а не сократят их количество.

Это, кстати, чуть ли не первое серьезное исследование на эту тему, и просто интересное чтиво на воскресенье.

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾44😁8👍6👻2