Машинное обучение RU
17.7K subscribers
1.57K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
1️⃣5️⃣ наборов данных для датасайентистов


Без чего нельзя обойтись в датасайенс-проекте? Конечно, без данных!

Именно об этом пойдет речь в сегодняшней статье. Мы поделимся с вами 15 датасетами, которые можно использовать для анализа данных и их визуализации, классификации текстов/изображений, создания системы рекомендаций и многого другого.



https://uproger.com/15-naborov-dannyh-dlya-datasajentistov/

@machinelearning_ru
👍8
⚖️ Как в PyTorch случайным образом мутировать веса.

https://uproger.com/kak-v-pytorch-sluchajnym-obrazom-mutirovat-vesa/

@machinelearning_ru
👍10
Уже не раз писал на канале об учебнике по машинному обучению от Школы анализа данных Яндекса. На этот раз эксперты ШАД опубликовали новые онлайн-материалы по вероятностным моделям ML. В них вошли 6 тем, среди которых есть разбор обобщённых линейных моделей, а также подробное описание подходов к классификации и оцениванию вероятностей.

К свежим главам авторы добавили часть о кластеризации, которую написал Виктор Кантор, директор по большим данным в МТС. Он дополнил теоретическую информацию ценными инсайтами из практики.

Тем, кто ещё не сохранил ссылку на учебник, предлагаю сделать это прямо сейчас, чтобы не пропустить выход свежих разделов.
👍21
i🦄 Imagen unprecedented photorealism × deep level of language understanding From Google

Home: https://gweb-research-imagen.appspot.com/

Paper: https://gweb-research-imagen.appspot.com/paper.pdf
📝 Модель автоматического решения кроссвордов

Этот репозиторий содержит код для обучения и запуска нашей системы решения кроссвордов. Мы также выпускаем предварительно обученные модели, предварительно вычисленные FAISS и набор данных подсказок-ответов на кроссворды.

Описание

Github: https://github.com/albertkx/berkeley-crossword-solver

Paper: https://arxiv.org/abs/2205.09665v1

Dataset: https://www.xwordinfo.com/JSON/

@machinelearning_ru
👍7
Сначала ты моешь полы в офисе, потому что нет денег на клининг, а потом твоя компания становится рублевым единорогом 🦄

Кажется удивительным? Но это реальная история вице-президента МТС Александра Ханина в рубрике «Городские истории» в газете «Ведомости. Город».

О том, как из студента, продававшего соковыжималки на третьем курсе, превратиться в гендиректора компании MTS AI, и что опаснее искусственного интеллекта, можно прочитать здесь.
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Нейросеть DALL-E 2 позволяет генерировать изображение под абзац абсолютно любой книги

Пройдите тест, который покажет можете ли вы угадать, какая картинка создана человеком, а какая Dalle 2.

https://thisimagedoesnotexist.com/

@machinelearning_ru
🔥14👍5
Продуктовый аналитик | Product Analyst в стартап 🚀

🔹 Офис в Москве на Трехгорке
🔹 До 230к на руки (белая ЗП) или оформление как ИП
🔹 Интересные задачи, много свободы для реализации потенциала

Привет! Мы делаем сервис folovers.online — платформу для монетизации контента через подписки и донаты. Сейчас мы находимся в подготовке к релизу MVP и ищем продуктового аналитика.

🟢 Что нужно делать:

— Описывать требования к сбору, агрегации, визуализации данных
— Создавать витрины с отчетами, обеспечивать их обновляемость, валидность
— Анализировать поведение пользователей на разных сценариях
— Сегментировать пользовательскую базу
— Анализировать данные биллинга и данные о просмотре контента

🟢 Что мы ждем от кандидата:

— Опыт работы с БД (Mysql, Postgres), тег-менеджерами и сервисами аналитики (Matomo, Google Analytics, Firebase и пр.)
— Умение писать сложные SQL-запросы
— Навыки обработки больших массивов сырых данных удобным способом (R, Python или что-то другое)
— Умение создать из отчета инструмент для принятия решений, а не просто красивую презентацию
— Понимание метрик разных уровней (MRR, ARR, LTV, Churn Rate и других)

Эта позиция предполагает полную вовлеченность в проект и перспективу быстрого роста ✈️ Мы ищем человека, который умеет ставить себе задачи и выполнять их руками, а в будущем готов создать вокруг себя команду, которую будет лидировать.

🟢 Присылайте резюме и сопроводительное письмо на почту jobs@folovers.online

— — —

Все вакансии в Folovers: http://flvrs.ru/jobs
👍5
Создание модели машинного обучения с помощью Google Colab без дополнительных настроек.

В Colab вы будете работать с блокнотами (*.ipynb) так же, как и с документами (*.docx) в Microsoft Word. Итак, первый шаг к использованию Colab — это создание нового блокнота. Для этого перейдите по ссылке: https://colab.research.google.com/.

Читать

@machinelearning_ru
👍9
🦠 MaSIF- Molecular Surface Interaction Fingerprints: Geometric deep learning to decipher patterns in protein molecular surfaces.

MaSIF is a proof-of-concept method to decipher patterns in protein surfaces important for specific biomolecular interactions.

Github: https://github.com/LPDI-EPFL/masif

Paper: https://www.nature.com/articles/s41592-019-0666-6

Data: https://github.com/LPDI-EPFL/masif#MaSIF-data-preparation

@machinelearning_ru
https://t.me/itchannels_telegram - полезные ресурсы для датасаентистов, мл-специалистов.
👍31
🔥 LAION-5B: НОВАЯ ЭРА ОТКРЫТЫХ КРУПНОМАСШТАБНЫХ МУЛЬТИМОДАЛЬНЫХ НАБОРОВ ДАННЫХ

https://uproger.com/laion-5b-novaya-era-otkrytyh-krupnomasshtabnyh-multimodalnyh-naborov-dannyh/

Dataset: https://laion.ai/laion-5b-a-new-era-of-open-large-scale-multi-modal-datasets/

@machinelearning_ru
👍81
😻 Gato модель с миллиардами параметров от Deepmind

DeepMind представила кросс-модальную универсальную модель с 1.2 миллиардами параметров Gato. Gato может выполнять более 600 задач, таких как воспроизведение видеоигр, создание субтитров к изображениям и управление роботами.

DeepMind обучила Gato на датасетах, включающих опыт работы агента как в моделируемых, так и в реальных средах, а также на датасетах естественного языка и изображений.

Gato имеет архитектуру трансформера, которая была выбрана для решения сложных задач на рассуждение, демонстрации способностей к обобщению текстов, созданию музыки, классификации объектов на фотографиях и анализу последовательностей белков.

https://uproger.com/gato-model-s-milliardami-parametrov-ot-deepmind/

Deepmind: https://www.deepmind.com/publications/a-generalist-agent

Статья: https://arxiv.org/pdf/2205.06175

@machinelearning_ru
👍10
Selectel продлевает миграционные каникулы

Сейчас многие компании заняты реорганизацией своей инфраструктуры. Чтобы помочь этому процессу, в @Selectel продлили миграционные каникулы для переноса данных в объектное хранилище.

Миграционные каникулы позволяют не оплачивать запросы и хранение 30 дней с момента одобрения заявки. Этот период полностью покрывает время на подготовительные работы и снижает нагрузку на бизнес.

— Перенос данных в облачное объектное хранилище, поддерживающее S3 API.
— Специалисты Selectel помогут определить проблемные зоны, например, график бэкапов или обновления сертификатов.
— Selectel Global Connect поможет объединить сегменты территориально разнесенной инфраструктуры или развернуть гибридное облако.
— Selectel заботится о том, чтобы данные не зависли между двух хранилищ. Каникулы устроены так, чтобы пользователи имели возможность не торопиться и мигрировать по плану

Оставьте заявку и начните миграционные каникулы уже сегодня: https://slc.tl/stgey
👍6
Что выведет код?

import numpy as np
a = np.array([1, 2, 3])
ia = np.array([True >> 0, False, True])
print(a[ia].sum())
👍10