Meta выпустила ConvNeXt V2 на PyTorch для 8 видов моделей (Atto, Femto, Pico, Nano, Tiny, Base, Large, Huge), код обученной модели, настройки и веса (преобразованные из весов JAX, обученных на TPU) для ConvNeXt V2. х. ConvNets работал лучше, чем Трансформеры для задач компьютерного зрения, а ConvNeXt V2, значительно превосходит производительность сетей ConvNet на тестах.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍11❤2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍7❤1
🔥 Yolo8 is coming!
На github вылложили веса.
Обновилась документация.
🖥 Github
✔️ Docs
🖥 Colab
@ai_machinelearning_big_data
На github вылложили веса.
Обновилась документация.
✔️ Docs
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥39👍9❤4👎3😍2
🔥 MIT Introduction to Deep Learning
2023 Program has started!
Сегодня стартует бесплатный курс от MIT Intro to DL 2023 — один из самых лаконичных, открытых курсов по искусственному интеллекту, который охватывает основные методы глубокого обучения, архитектуры инс, статистику.
🚀 Course
✔️ Course 2022
@ai_machinelearning_big_data
2023 Program has started!
Сегодня стартует бесплатный курс от MIT Intro to DL 2023 — один из самых лаконичных, открытых курсов по искусственному интеллекту, который охватывает основные методы глубокого обучения, архитектуры инс, статистику.
🚀 Course
✔️ Course 2022
@ai_machinelearning_big_data
🔥29👍7❤1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Улучшенный метод чтения по губам, с помощью архитектуры Conformer Connectionist Temporal Classification (CTC) для обработки аудио и видео.
✔️ Paper
🔥Notebook
🚀 Models
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥28👍3❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Новый проект от Microsoft, реалистичная генерация говорящего аватара по входным аудиодорожкам. MemFace обеспечивает наилучшее качество с большим отрывом.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥11👍6❤2
This media is not supported in your browser
VIEW IN TELEGRAM
Новая быстрая многоракурсная 3D-реконструкция с произвольными объектами и настраиваемым освещением.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17👍9❤1
📚 Free Book Multimodal Deep Learning 2023
This book is the result of a student seminar for Master Statistics and Master Data Science at the LMU in the summer semester 2022
Полезная книга , которая поможет разобраться с мультимодальными моделями общего назначения, изучить их архитектуру, работу и применение, в том числе в генеративном искусстве.
📘 Book
🖥 Github
⏩ Reading list
@ai_machinelearning_big_data
This book is the result of a student seminar for Master Statistics and Master Data Science at the LMU in the summer semester 2022
Полезная книга , которая поможет разобраться с мультимодальными моделями общего назначения, изучить их архитектуру, работу и применение, в том числе в генеративном искусстве.
📘 Book
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍16🔥3❤2👎1
In this post, you'll learn to build an image similarity system wich Transformers.
Полезная статья, с которой вы создадите систему поиска сходства изображений с помощью Transformers. Можно немного попрактиковаться и попробовать другие модели.
🤗 Huggingface
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥22👍11❤1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
AutoAvatar: Autoregressive Neural Fields for Dynamic Avatar Modeling
Autoregressive approach for modeling dynamically deforming human bodies by Meta.
AutoAvatar — проект от Meta для моделирования динамически деформирующихся человеческих тел непосредственно из необработанных сканов.
🖥 Github: github.com/facebookresearch/AutoAvatar
⭐️ Project: zqbai-jeremy.github.io/autoavatar
✅️ Paprer: arxiv.org/pdf/2203.13817.pdf
⏩ Dataset: https://amass.is.tue.mpg.de/index.html
⭐️ Video: https://zqbai-jeremy.github.io/autoavatar/static/images/video_arxiv.mp4
ai_machinelearning_big_data
Autoregressive approach for modeling dynamically deforming human bodies by Meta.
AutoAvatar — проект от Meta для моделирования динамически деформирующихся человеческих тел непосредственно из необработанных сканов.
ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20🔥2❤1🌭1
👨🎓 CS224W: Machine Learning with Graphs Free Course from Stanford
Topics include: representation learning and Graph Neural Networks; algorithms for the World Wide Web; reasoning over Knowledge Graphs; influence maximization; disease outbreak detection, social network analysis.
Шикарный бесплатный курс от Стенфорда, с которым вы изучите структуру графов и их особенности и применения в мо, научитесь строить графовые нейронные сети. Новые лекции, колабы и слайды выходят по вторникам и четвергам.
🔥 Course 2023
📌 Video Lectures 2021
🤗Intro to Graph Machine Learning
ai_machinelearning_big_data
Topics include: representation learning and Graph Neural Networks; algorithms for the World Wide Web; reasoning over Knowledge Graphs; influence maximization; disease outbreak detection, social network analysis.
Шикарный бесплатный курс от Стенфорда, с которым вы изучите структуру графов и их особенности и применения в мо, научитесь строить графовые нейронные сети. Новые лекции, колабы и слайды выходят по вторникам и четвергам.
🔥 Course 2023
📌 Video Lectures 2021
🤗Intro to Graph Machine Learning
ai_machinelearning_big_data
❤48👍10🔥3⚡2🤣2
GLIGEN’s zero-shot performance on COCO and LVIS outperforms that of existing supervised layout-to-image baselines by a large margin. Code comming soon.
GLIGEN новый подход, который основывается на существующих предварительно обученных моделях генерации текста из изображения и расширяет их функциональность. GLIGEN значительно превосходит все существующие модели.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥4❤1
🎧 Msanii: High Fidelity Music Synthesis on a Shoestring Budget
Model combines the expressiveness of mel spectrograms, the generative capabilities of diffusion models, and the vocoding capabilities of neural vocoders.
Новая модель на основе диффузии для эффективного синтеза длинной музыки высокого качества.
🖥 Github: https://github.com/kinyugo/msanii
⭐️ Demo: https://kinyugo.github.io/msanii-demo/
⭐️ Colab: https://colab.research.google.com/github/Kinyugo/msanii/blob/main/notebooks/msanii_demo.ipynb
✅️ Paper: https://arxiv.org/abs/2301.06468
🤗Hugging face: https://huggingface.co/spaces/kinyugo/msanii
@ai_machinelearning_big_data
Model combines the expressiveness of mel spectrograms, the generative capabilities of diffusion models, and the vocoding capabilities of neural vocoders.
Новая модель на основе диффузии для эффективного синтеза длинной музыки высокого качества.
pip install -q git+https://github.com/Kinyugo/msanii.git
🤗Hugging face: https://huggingface.co/spaces/kinyugo/msanii
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥5❤1
Media is too big
VIEW IN TELEGRAM
Multiview Compressive Coding (MCC), learns to compress the input appearance and geometry to predict the 3D structure by querying a 3D-aware decoder
MCC — это новый подход к 3D-реконструкции по одному изображению RGB-D .
pip install h5py omegaconf submitit
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12🔥5❤1
🔥 Deep Learning Tuning Playbook
This document is for engineers and researchers (both individuals and teams) interested in maximizing the performance of deep learning models.
Этот репозиторий-книга от специалистов Google Research с практическими советами по максимальному повышению производительности моделей глубокого обучения.
🖥 Github
📌Reddit
@ai_machinelearning_big_data
This document is for engineers and researchers (both individuals and teams) interested in maximizing the performance of deep learning models.
Этот репозиторий-книга от специалистов Google Research с практическими советами по максимальному повышению производительности моделей глубокого обучения.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥17❤8👍5⚡1
New method for producing color images from sketches
Новый метод генерации реалистичных, цветных изображений из эскизов. эффективность модели была проверена на 4 различных, крупных датасетов изображений.
git clone https://github.com/giddyyupp/AdvSegLoss.git
cd AdvSegLoss
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤1🔥1
Media is too big
VIEW IN TELEGRAM
Keypoint-free one-shot object pose estimation method that handles low-textured objects without knowing CAD models.
Новый метод захвата объектов без ключевых точек, который значительно превосходит существующие методы и может работать с низкотекстурированными объектами.
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍19🔥4❤1