281K subscribers
3.95K photos
676 videos
17 files
4.54K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Openicl

New open-source toolkit for ICL and LLM evaluation.

OpenICL - новый фреймворк для исследования, разработки и созданию прототипов для задач in-context learning.

pip install openicl

🖥 Github: https://github.com/shark-nlp/openicl

Paper: https://arxiv.org/abs/2303.02913

⭐️ Dataset: https://paperswithcode.com/dataset/gsm8k

💨 Docs: https://github.com/shark-nlp/openicl#docs

Examples: https://github.com/Shark-NLP/OpenICL/tree/main/examples

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥21
🖥 MIT Introduction to Deep Learning 2023

Lecture 1 *New 2023 Edition* Foundations of Deep Learning

Премьера новых лекции курса Introduction to Deep Learning от MiT


🎞 Video: https://www.youtube.com/watch?v=N4AcIfaROEQ
📝 Lectures: http://introtodeeplearning.com/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27🔥1121😢1
Multivariate Probabilistic Time Series Forecasting with Informer

Efficient transformer-based model for LSTF.

Применение модели Informer от Hugging Face для задач многомерного вероятностного прогнозирования.

🤗Hugging face: https://huggingface.co/blog/informer

Paper: https://huggingface.co/docs/transformers/main/en/model_doc/informer

⭐️ Colab: https://colab.research.google.com/github/huggingface/notebooks/blob/main/examples/multivariate_informer.ipynb

💨 Dataset: https://huggingface.co/docs/datasets/v2.7.0/en/package_reference/main_classes#datasets.Dataset.set_transform

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍26🔥3🥰1
Forwarded from Data Science Jobs
Data Engineer (lead)

Формат: классный офис в Москве/гибрид/удаленно;
Доход: 300-400К+ руб.;
Форма оформления: по ТК/ИП;

О нас: Мы занимаемся разработкой data-платформы, в рамках которой развиваются различные data-продукты:
• рекомендательные системы;
• сервисы аналитики и визуализации данных;
• ML-модели;
• иные решения для решения бизнес-задач.
Наша команда это 25 инженеров с сильнейшими компетенциями в ML, аналитике и работе с данными, и сейчас мы ищем классных ребят для дальнейшего роста.
У нас нет долгих согласований и бюрократии. Мы стремимся к быстрому внедрению в production, с последующей работой над улучшениями.

Что нужно будет делать:
• Проектировать, разрабатывать и поддерживать пайплайны для сбора и обработки данных;
• Обеспечивать SLA и качество данных;
• Готовить данные для моделей машинного обучения и участвовать в их продукционализации совместно с data science командой; • Работать в команде и развивать отдел DE.

Будет классно, если у тебя:
• Хорошее знание технологий из стека: Python, SQL, Spark, Airflow;
• Опыт работы на проектах с большими данными, понимание принципов распределенной обработки данных;
• Опыт продуктовой разработки в технологических компаниях;
• Опыт постановки задач;
• Опыт наставничества;
• Отличные коммуникативные навыки.

Ты покоришь наши сердца и разум, если у тебя:
• Опыт работы с облаками, особенно, с Яндекс.Облаком;
• Опыт разработки высоконагруженных бэкенд сервисов на Java, Scala или Python;
• Опыт работы с моделями машинного обучения в продакшене;
• Опыт работы с базами данных для аналитики, особенно, с ClickHouse.

Мы предлагаем:
• Работу в аккредитованной IT компании с сильнейшей командой в разных масштабных проектах;
• Гибридный график работы 5/2, с 10:00 - 19:00;
• ДМС со стоматологией;
• В современном офисе в стиле Лофт с капсулой медитации, спортзалом, большой современной библиотекой и кабинетом для записи подкастов и треков;
• Комфортную кухню с холодильником, кофемашиной, тостером, микроволновкой и Magic Bullet;
• Холодильник с напитками (соки, энергетики, вода и т.д.) и едой (сыры, колбасы, сырки и м.ч.);
• Каждую пятницу совместные обеды с разными кухнями мира за счет компании.


За подробностями пиши: tg @naikava

@datascienceml_jobs - вакансии Data Science, Devops
👍9🔥3🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 PyXAB - Python X-Armed Bandit

A Python Library for X-Armed Bandit and Online Blackbox Optimization Algorithms

PyXAB - это библиотека Python с открытым исходным кодом с реализацией алгоритмов X-Armed Bandit (
многорукий бандит).

🖥 Github: https://github.com/williamlwj/pyxab

Paper: https://arxiv.org/abs/2303.04030v1

⭐️ Docs: https://pyxab.readthedocs.io/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥3🥰2
Please open Telegram to view this post
VIEW IN TELEGRAM
👍81🔥1
OpenOccupancy: A Large Scale Benchmark for Surrounding Semantic Occupancy Perception.

OpenOccupancy first surrounding semantic occupancy perception benchmar.

🖥 Github: https://github.com/jeffwang987/openoccupancy

Paper: https://arxiv.org/abs/2303.03991v1

⭐️ Dataset: https://paperswithcode.com/dataset/synthcity

💨 Project: https://www.mmlab-ntu.com/project/styleganex/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍91🔥1
Erasing Concepts from Diffusion Models

A fine-tuning method that can erase a visual concept from a pre-trained diffusion model, given only the name of the style and using negative guidance as a teacher.

Метод тонкой настройки, который может убрать имитацию стиля конкретного художника или даже стереть целый класс объектов из вывода модели, сохранив при этом поведение и возможности модели по другим настройкам.


🖥 Github: https://github.com/rohitgandikota/erasing

Paper: https://arxiv.org/abs/2303.07345v1

⭐️ Dataset: https://paperswithcode.com/dataset/imagenet

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19😢43🔥2
GraphGym

Platform for designing and evaluating Graph Neural Networks (GNN).

GraphGym - это платформа для проектирования и оценки графовых нейронных сетей .

🖥 Github: https://github.com/snap-stanford/graphgym

Paper: https://arxiv.org/abs/2303.07666v1

⭐️ Dataset: https://paperswithcode.com/dataset/tieredimagenet

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍8🔥1
Tuned Lens 🔎

Simple interface training and evaluating tuned lenses. A tuned lens allows us to peak at the iterative computations a transformer uses to compute the next token.

Инструменты для понимания того, как послойно работают прогнозы трансформеров.

pip install tuned-lens

🖥 Github: https://github.com/alignmentresearch/tuned-lens

Paper: https://arxiv.org/abs/2303.08112v1

⭐️ Dataset: https://paperswithcode.com/dataset/the-pile

🖥 Colab: https://colab.research.google.com/github/AlignmentResearch/tuned-lens/blob/main/notebooks/interactive.ipynb

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍112👎2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
FateZero: Fusing Attentions for Zero-shot Text-based Video Editing

Video Style Editing Using Stable Diffusion.


Новый метод редактирования видео из текстовых промтов без предварительного обучения модели и без использования маски, специфичной для конкретного видео.

🖥 Github: https://github.com/chenyangqiqi/fatezero

Paper: https://arxiv.org/abs/2303.09535

💨 Project: https://fate-zero-edit.github.io/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
11👍8🔥2
Математика дата саентиста - здесь мы публикуем математические задачи и гайды для машинного обучения с упором на практику. Проверяем ваши знания, а затем на основе ошибок предлагаем статьи и уроки.

Если хочешь познать дзен и понимать как работают алгоритмы, а не просто импортировать их, подписывайся. Здесь реально учат.

@ds_math
9🖕2👍1🔥1
Taming Diffusion Models for Audio-Driven Co-Speech Gesture Generation (CVPR 2023)

Novel Diffusion Audio-Gesture Transformer is devised to better attend to the information from multiple modalities and model the long-term temporal dependency. M

Новая система на основе диффузии для эффективного захвата кросс-модальных ассоциаций между аудио и жестами для высокоточной генерации жестов на основе аудио.

🖥 Github: https://github.com/advocate99/diffgesture

Paper: https://arxiv.org/abs/2303.09119v1

💨 Dataset: https://paperswithcode.com/dataset/beat

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🤗 ModelScope Text to Video Synthesis

For faster inference without waiting in queue, you may duplicate the space and upgrade to GPU in settings.

Новая диффузионная модель для генерации видео из текста.

Demo: https://huggingface.co/spaces/damo-vilab/modelscope-text-to-video-synthesis

💨 Paper: https://arxiv.org/pdf/2303.08320v2.pdf

💡 Huggingface: https://huggingface.co/damo-vilab/modelscope-damo-text-to-video-synthesis/tree/main

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍4🔥2
🦖 Яндекс выложил в опенсорс исходный код YTsaurus — платформы для работы с большими данными

«Вайтизавр» развивали почти 10 лет — историю можно почитать на Хабре. Сегодня платформу использует большинство сервисов Яндекса. YTsaurus может многое: от аналитики до обучения сложных моделей с миллиардами параметров. В Яндексе рассказывают, что один из самых популярных сценариев — построение DWH.

Например, заказы Еды, Такси и Лавки поступают в key-value хранилище YTsaurus в сыром виде — это сотни терабайт в месяц. Дальше они обрабатываются разными инструментами внутри платформы, и на выходе получаются аналитические витрины, поверх которых производится аналитика и строятся различные визуализации в DataLens.

Помимо MapReduce, пользователям предлагается прокаченный SQL-язык, который может запускать огромные операции для обработки петабайтов данных, богатый набор встроенных функций и гибкие возможности параметризации.

🖥 Github: https://github.com/YTsaurus/YTsaurus
вакансии в YTsaurus

ai_machinelearning_big_data
👍19🔥93😁2🥴1
Media is too big
VIEW IN TELEGRAM
Gen-2: The Next Step Forward for Generative AI

A multi-modal AI system that can generate novel videos with text, images, or video clips.

Мультимодальная AI модель Gen-2, которая преобразует текст или картинки в видео.

Project: https://huggingface.co/spaces/damo-vilab/modelscope-text-to-video-synthesis

↪️ Paper: https://arxiv.org/abs/2302.03011

💨 Discord: https://discord.com/invite/tUp5Gbd7rk

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥54
This media is not supported in your browser
VIEW IN TELEGRAM
⚜️ ViperGPT: Visual Inference via Python Execution for Reasoning

ViperGPT, a framework that leverages code-generation models to compose vision-and-language models into subroutines to produce a result for any query.

Новый фреймворк ViperGPT для генерации Python кода из изображений.

🖥 Github: https://github.com/cvlab-columbia/viper

Paper: https://arxiv.org/pdf/2303.08128.pdf

💨 Project: https://paperswithcode.com/dataset/beat

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍214🔥3
🎥 Zero-1-to-3: Zero-shot One Image to 3D Object

Zero-1-to-3, a framework for changing the camera viewpoint of an object given just a single RGB image.

Новая система изменения ракурса камеры на объект по одному RGB-изображению.


🖥 Github: https://github.com/cvlab-columbia/zero123

🤗 Hugging face: https://huggingface.co/spaces/cvlab/zero123-live

Paper: https://arxiv.org/abs/2303.11328v1

Dataset: https://zero123.cs.columbia.edu/

💨 Project: https://paperswithcode.com/dataset/beat

⭐️ Demo: https://huggingface.co/spaces/cvlab/zero123

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥4🤯32