280K subscribers
3.95K photos
675 videos
17 files
4.54K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🚀 Slapo: A Schedule Language for Large Model Training

Slapo is a schedule language for progressive optimization of large deep learning model training.

Slapo позволяет использовать набор примитивов на PyTorch, запуская их по расписанию, для оптимизации обучения без изменения самой модели.

🚀 Мощная оптимизация.

pip3 install slapo

🖥 Github: https://github.com/awslabs/slapo

⭐️Paper: https://arxiv.org/abs/2302.08005v1

💻 Docs: https://awslabs.github.io/slapo/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥5🥰2🤔1🥱1
This media is not supported in your browser
VIEW IN TELEGRAM
💠 MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation

MultiDiffusion - модель, позволяющая создавать любые изображения, используя предварительно обученную модель диффузии текста в изображение, без дополнительного обучения и настройки.

⭐️ Project: https://multidiffusion.github.io/

🖥 Github: https://github.com/omerbt/MultiDiffusion

⭐️Paper: https://arxiv.org/abs/2302.08113v1

💻 Dataset: https://paperswithcode.com/dataset/coco

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥54
Media is too big
VIEW IN TELEGRAM
🔍 Planar Object Tracking via Weighted Optical Flow

Method for planar object 8 degrees-of-freedom pose.

WOFT - новый невероятно точный метод отслеживания объектов.


⭐️ Project: https://cmp.felk.cvut.cz/~serycjon/WOFT/

🖥 Github: https://github.com/serycjon/WOFT

⭐️Paper: arxiv.org/pdf/2301.10057.pdf

💻 Dataset : https://www3.cs.stonybrook.edu/~hling/data/POT-210/planar_benchmark.html

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥103
🔍 A meta-dataset for few-shot image classification

Meta Album is a meta-dataset created for few-shot learning, meta-learning, continual learning and so on.

Meta-datase — это набор метаданных, созданный , состоящий из 40 датасетов разбитых на 10 уникальных категорий. Это постоянно пополняемый набор метаданных.

⭐️ Meta-dataset: https://meta-album.github.io/

🖥 Github: https://github.com/ihsaan-ullah/meta-album

⭐️Paper: https://arxiv.org/abs/2302.08909v1

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥31👏1
💨 3D Object Tracking

Multi-modality tracker that fuses information from visual appearance and geometry to estimate object poses.

Список алгоритмов по отслеживанию 3D-объектов.


🖥 Github: https://github.com/dlr-rm/3dobjecttracking

⭐️Paper: https://arxiv.org/abs/2302.11458v1

Video: https://www.youtube.com/watch?v=0ORZvDDbDjA

💻 Dataset : https://paperswithcode.com/dataset/ycb-video

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥31
Video Localized Narratives

Video Localized Narratives, a new form of multimodal video annotations connecting vision and language.

Новая модель от Google позволяет генерировать аннотации к видео, фиксируя даже сложные события.

Авторы уже аннотировали 20 тыс. видео из датасетов OVIS, UVO и Oops, в общей сложности 1,7 млн. слов.

🖥 Github: https://github.com/google/video-localized-narratives

⭐️Paper: https://arxiv.org/abs/2302.11217v1

Project: https://www.youtube.com/watch?v=0ORZvDDbDjA

💻 Dataset : https://paperswithcode.com/dataset/video-localized-narratives

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17🔥62
📡 Learning Visual Representations via Language-Guided Sampling

New approach deviates from image-text contrastive learning by relying on pre-trained language models to guide the learning rather than minimize a cross-modal similarity.

Новый альтернативный подход к визуальному обучению: с использованием языкового сходства для выборки семантически схожих пар изображений.

🖥 Github: https://github.com/mbanani/lgssl

⭐️Paper: https://arxiv.org/abs/2302.12248v1

Pre-trained Checkpoints: https://www.dropbox.com/sh/me6nyiewlux1yh8/AAAPrD2G0_q_ZwExsVOS_jHQa?dl=0

💻 Dataset : https://paperswithcode.com/dataset/redcaps

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍172🔥2
🌐 Как наладить технологии автоматического перевода в своём проекте?

В статье на Хабре Андрей Соколов из команды прикладных исследований ВКонтакте подробно и доступным языком рассказал о том, как они сделали свой переводчик для постов и сообщений в мессенджере. Материал будет полезен для тех, кто тоже хочет попробовать использовать и развернуть переводы у себя в проекте.

Для чтения статьи не потребуется специальный уровень знаний: в ней нет излишних технических подробностей. При этом в ней вы найдёте ссылки на полезные ресурсы и выдержки из интересных источников.

ai_machinelearning_big_data
👍10🔥52
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥51🐳1
This media is not supported in your browser
VIEW IN TELEGRAM
📃OccDepth: A Depth-aware Method for 3D Semantic Occupancy Network

Maybe the first academic open work on stereo 3D SSC method with vision-only input.

Первый метод
SSC под названием OccDepth, который использует неявную информацию из стереоизображений для восстановления трехмерных геометрических структур.

🖥 Github: https://github.com/megvii-research/occdepth

⭐️Paper: https://arxiv.org/abs/2302.13540v1

💻 Dataset : https://paperswithcode.com/dataset/nyuv2

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥93
👁 Deep Contextual Video Compression

A group-based offset diversity where the cross-group interaction is proposed for better context mining.

Официальная реализация Pytorch для нейронного сжатия видео и изображений.


🖥 Github: https://github.com/microsoft/dcvc

⭐️Paper: https://arxiv.org/abs/2302.14402v1

💻 Dataset : https://paperswithcode.com/dataset/vimeo90k-1

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍15🔥321👎1
😊 HugNLP

HugNLP is a unified and comprehensive NLP library based on HuggingFace Transformer.

HugNLP — это новая универсальная NLP библиотека основанная на Hugging Face, для повышения удобства и эффективности работы c текстами.

🖥 Github: https://github.com/wjn1996/hugnlp

Paper: https://arxiv.org/abs/2302.14286v1

⭐️ Dataset: https://paperswithcode.com/dataset/clue

HF for complex text classification: https://huggingface.co/blog/classification-use-cases

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13🤗4🔥2👏2🥰1
🖥 pyribs: A Bare-Bones Python Library for Quality Diversity Optimization

A bare-bones Python library for quality diversity optimization.

🖥 Github: https://github.com/icaros-usc/pyribs

Paper: https://arxiv.org/abs/2303.00191v1

⭐️ Dataset: https://paperswithcode.com/dataset/quality-diversity-benchmark-suite

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍8🔥32
⭐️ Dropout Reduces Underfitting

Early dropout helps underfitting models fit the data better and achieve lower training loss. Late dropout helps improve the generalization performance of overfitting models.

Early dropout (ранний отсев) помогает подгонять недообученные модели и достигать меньших потерь при обучении. Late dropout (поздний отсев) помогает улучшить производительность моделей и решает проблему переобучения.


🖥 Github: https://github.com/facebookresearch/dropout

Paper: https://arxiv.org/abs/2303.01500v1

⭐️ Dataset: https://paperswithcode.com/dataset/oxford-102-flower

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23🔥32
⭐️ SplineCam: Exact Visualization and Characterization of Deep Network Geometry and Decision Boundaries, CVPR 2023

Exact method for computing partitions of a Deep Neural Network

🖥 Github: http://github.com/AhmedImtiazPrio/SplineCAM

🖥 Colab: https://bit.ly/splinecam-demo

Paper: http://arxiv.org/pdf/2302.12828.pdf

⭐️ Project: http://imtiazhumayun.github.io/splinecam

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20😱32🔥2
Ultra fast ControlNet with 🧨 Diffusers

ControlNet provides a minimal interface allowing users to customize the generation process up to a great extent.

Новый пайплайн StableDiffusionControlNetPipeline, в статье показано, как его можно применять для различных задач. Давайте контролировать!

🤗 Hugging face blog: https://huggingface.co/blog/controlnet

🖥 Colab: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/controlnet.ipynb

🖥 Github: https://github.com/lllyasviel/ControlNet

Paprer: https://arxiv.org/abs/2302.05543

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍25🔥63🤯2
This media is not supported in your browser
VIEW IN TELEGRAM
🧩 Building LEGO for 3D Reconstruction on Mobile Devices

A novel data capturing and 3D annotation pipeline in MobileBrick without relying on expensive 3D scanners.

MobileBrick - это первый многоракурсный набор данных RGBD, снятый на мобильное устройство, с точными 3D-аннотациями для детальной реконструкции 3D-объектов.


🖥 Github: https://github.com/ActiveVisionLab/MobileBrick

Paper: https://arxiv.org/abs/2303.01932

⭐️ Dataset: http://www.robots.ox.ac.uk/~victor/data/MobileBrick/MobileBrick_Mar23.zip

💨 Project: https://code.active.vision/MobileBrick/

ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥31