154K subscribers
3.42K photos
444 videos
17 files
4.17K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
🧬 Genomepy: genes and genomes at your fingertips

genomepy, which can search, download, and preprocess the right genomic data for your analysis.

$ pip install genomepy

⚙️ Github
➡️ Paper
📄 Documentation

@ai_machinelearning_big_data
🦾 XSimGCL: Towards Extremely Simple Graph Contrastive Learning for Recommendation

⚙️ Github
➡️ Paper
💻 Tutorial page
📄 Dataset

@ai_machinelearning_big_data
🔥 YOLOv6

YOLOv6-N hits 35.9% AP on COCO dataset with 1234 FPS on T4. YOLOv6-S strikes 43.5% AP with 495 FPS, and the quantized YOLOv6-S model achieves 43.3% AP at a accelerated speed of 869 FPS on T4.

git clone https://github.com/meituan/YOLOv6
cd YOLOv6
pip install -r requirements.txt


⚙️ Github
➡️ Paper
✔️ Colab
💻 Quantization Tutorial
📄 Dataset

@ai_machinelearning_big_data
Как смешивать изображения в Midjourney: тест фичи 🔟

С помощью этой функции можно, например, соединить два смешных мема и получить еще более смешной.

Нейросеть Midjourney не зря быстро стала популярной: богатый функционал, простота использования и качественная генерация изображений. Теперь сервис запустил функцию смешивания двух изображений, а мы протестировали ее и рассказываем, как ей пользоваться и что получается в итоге.

➡️ Читать дальше
🔩 Попробовать
🌠 Почитать про Midjourney

@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🧬 Uni-Mol: A Universal 3D Molecular Representation Learning Framework

⚙️ Github
➡️ Paper
🎞 Colab
📄 Dataset

@ai_machinelearning_big_data
🦾 OpenMixup: Open Mixup Toolbox and Benchmark for Visual Representation Learning

open-source all-in-one toolbox for supervised, semi-, and self-supervised visual representation learning with mixup

conda create -n openmixup python=3.8 pytorch=1.12 cudatoolkit=11.3 torchvision -c pytorch -y
conda activate openmixup
pip install openmim
mim install mmcv-full
git clone https://github.com/Westlake-AI/openmixup.git
cd openmixup
python setup.py develop


⚙️ Github
➡️ Paper
🛠 Installation
📄 Dataset

@ai_machinelearning_big_data
👁‍🗨 Patch Similarity Aware Data-Free Quantization for Vision Transformers

PSAQ-ViT V2, a more accurate and general data-free quantization framework for ViTs, built on top of PSAQ-ViT.

git clone https://github.com/zkkli/PSAQ-ViT.git
cd PSAQ-ViT


⚙️ Github
➡️ Paper
📄 Dataset

@ai_machinelearning_big_data
🚀 StoryDALL-E: Adapting Pretrained Text-to-Image Transformers for Story Continuation

⚙️ Github
➡️ Paper
🛠 Demo
📄 Dataset

@ai_machinelearning_big_data
🤖 DAMO ConvAI

The official repository which contains the codebase for Alibaba DAMO Conversational AI.

⚙️ Github
➡️ Paper
📎 Tasks
🗒 Text-to-SQL Parsing

@ai_machinelearning_big_data
Yandex Research выложил в опенсорс RuLeanALBERT — самую большую BERT-подобную модель на русском языке, которая поместится на ваш компьютер

Нейросеть обучали децентрализованно с помощью вычислительной платформе Яндекса. На бенчмарках по пониманию языка она показывает результаты, сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art.

Модель хотя и имеет миллиарды параметров, но вполне способна уместиться на одну домашнюю GPU: вы можете использовать её открытый код в своих проектах для классификации предложений, представления текстов и других языковых задач, не требующих генерации.

Yandex Research — это исследовательская группа в Яндексе, которая занимается фундаментальными проблемами в важнейших областях computer science.

Подробности – в статье на Хабре
🛠 Generative Visual Prompt: Unifying Distributional Control of Pre-Trained Generative Models

⚙️ Github
🗒 Paper
🦾 Dataset

@ai_machinelearning_big_data
🛠 Omni-Dimensional Dynamic Convolution

A novel multi-dimensional attention mechanism with a parallel strategy to learn complementary attentions for convolutional kernels.

⚙️ Github
🗒 Paper
🦾 Dataset

@ai_machinelearning_big_data
👁 Real-time Online Video Detection with Temporal Smoothing Transformers

git clone --recursive git@github.com:zhaoyue-zephyrus/TeSTra.git

⚙️ Github
🗒 Paper
🦾 Dataset

@ai_machinelearning_big_data
This media is not supported in your browser
VIEW IN TELEGRAM
🗒 Text2Light: Zero-Shot Text-Driven HDR Panorama Generation

Text2Light can generate HDR panoramas in 4K+ resolution using free-form texts solely.

conda env create -f environment.yml
conda activate text2light


⚙️ Github
💡 Project
💻 Model
🗒 Paper
🦾 Tutorial

@ai_machinelearning_big_data
🗣 Robust Speech Recognition via Large-Scale Weak Supervision

Whisper is a general-purpose speech recognition model by Open AI.

pip install git+https://github.com/openai/whisper.git

⚙️ Github
💡 Colab
💻 Model
🗒 Paper
🦾 Dataset
✴️ HABR

@ai_machinelearning_big_data
This media is not supported in your browser
VIEW IN TELEGRAM
🔄 VToonify: Controllable High-Resolution Portrait Video Style Transfer


git clone https://github.com/williamyang1991/VToonify.git
cd VToonify


⚙️ Github
💡 Colab
💻 Project
🗒 Paper
🦾 Dataset
🎞 Video

@ai_machinelearning_big_data
🤗 SetFit - Efficient Few-shot Learning with Sentence Transformers

An efficient and prompt-free framework for few-shot fine-tuning of Sentence Transformers (ST).

python -m pip install setfit

⚙️ Github
🗒 Paper
📌 Blog
🦾 Model and Dataset

@ai_machinelearning_big_data
This media is not supported in your browser
VIEW IN TELEGRAM
🔲 TensorStore

Novel open-source C++ / #Python library for storage/manipulation of high-dim data

⚙️ Github
🗒 Tutorial
📌 Google AI
🦾 Docs

@ai_machinelearning_big_data
📎 Dilated Neighborhood Attention Transformer

natural, flexible and efficient extension to NA that can capture more global context and expand receptive fields exponentially at no additional cost.

⚙️ Github
🗒 Model
📋 Paper
📌 Dataset

@ai_machinelearning_big_data