Machinelearning

⭐️

Новый генератор видео Dream Machine от Luma AI.

В отличие от Sora или KLING, он доступен для тестов.

Попробовать можно здесь: https://lumalabs.ai/dream-machine

#нейросеть #генераторвидео

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥61👍20❤7

15.6K viewsedited 17:42

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

PowerInfer-2 — быстрый вывод LLM на смартфоне

Встречайте PowerInfer-2 — высокооптимизированный фреймворк для вывода от LLM, разработанный специально для смартфонов. PowerInfer-2 поддерживает модели до 47B Mixtral MoE, достигая скорости 11,68 токенов в секунду, что в 22 раза быстрее, чем у других современных фреймворков.
При использовании 7B моделей PowerInfer-2 тоже сохраняет высокую скорость

🤗 Hugging Face

🖥

GitHub

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍56🔥10❤6⚡2🌭2

15.8K viewsedited 08:50

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

dstack — open-source cистема оркестрации контейнеров для запуска AI-систем в любом облаке или ЦОДе

— pip install "dstack[all]" -U

dstack поддерживает AWS, GCP, Azure, OCI, Lambda, TensorDock, Vast.ai, RunPod и CUDO.
Также можно без проблем использовать dstack для запуска AI-систем на локальных серверах.

🖥

GitHub

🟡

Доки

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

❤18👍9🔥2🐳2

14.3K views15:03

Machinelearning

⚡️

WebLLM — высокопроизводительный браузерный движок для инференса LLM

— npm install @mlc-ai/web-llm

WebLLM позволяет осуществлять вывод LLM непосредственно в браузере с ускорением WebGPU.

WebLLM имеет полную совместимость с API OpenAI: поддерживаются потоковая передача, JSON-режим и многое другое.

Также WebLLM поддерживает целый ряд моделей, включая Llama 3, Phi 3, Gemma, Mistral, Qwen и многие другие

🖥

GitHub

🟡

Доки

🟡

Чат с WebLLM

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥23👍17❤5🎃1

15.9K views08:25

Machinelearning

⚡️

Semantic Kernel — open-source SDK, который позволяет интегрировать LLM от OpenAI, с Hugging Face и другие, с обычными языками программирования типо C#, Python и Java

— pip install semantic-kernel

Таким образом при помощи Semantic Kernel можно создавать LLM-агентов, которые не просто отвечают на вопросы, а могут взаимодействовать с написанным кодом

🖥

GitHub

🟡

Доки

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍25❤15🥰2🔥1

13.4K views17:04

Machinelearning

⚡️

Nemotron 4 340B!

Nvidia только что выпустила LLM размером 340B , модель близкую к производительности OpenAI GPT-4 🤯 NVIDIA не претендует на право собственности на какие-либо сгенерированные выходные данные. 💚

🧮 340 миллиардов параметров в контекстном окне 4k
🔢 Обучена на 9 триллионах токенов
🌎 Поддерживает более чем 50 языков и более чем 40 языков программирования
🧠 Трубует 16x H100 в bf16 и ~8x H100 в int4
🤗 Модель доступна на huggingface

▪Модель: https://huggingface.co/collections/nvidia/nemotron-4-340b-666b7ebaf1b3867caf2f1911
▪Технический отчет: https://research.nvidia.com/publication/2024-06_nemotron-4-340b

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥65👍19❤6🤔6😨4

17.8K viewsedited 20:45

Machinelearning

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

🌟

MusicGPT — приложение для локального запуска моделей, генерирующих музыку

— brew install gabotechs/taps/musicgpt

MusicGPT позволяет запускать новейшие модели для генерации музыки локально на любой платформе, без установки тяжелых зависимостей, таких как ML-фреймворки.

В данный момент MusicGPT поддерживает только MusicGen от Meta, но в планах — ещё больше различных моделей генерации музыки.

Быстрый старт с помощью Docker:
docker run -it --gpus all -p 8642:8642 -v ~/.musicgpt:/root/.local/share/musicgpt gabotechs/musicgpt --gpu --ui-expose

или, используя cargo:
cargo install musicgpt

🖥

GitHub

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

👍34❤11🔥4

14.2K views09:40

Machinelearning

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

VideoLLaMA 2 — набор open-source Video-LLM, предназначенных для генерации видео

git clone https://github.com/DAMO-NLP-SG/VideoLLaMA2
cd VideoLLaMA2
pip install -r requirements.txt
pip install flash-attn --no-build-isolation

VideoLLaMA 2 — логическое развитие прошлых моделей, включает в себя специализированный компонент пространственно-временной свертки (STC), который эффективно улавливает сложную динамику на видео.

🖥

GitHub
🤗 Демо на HF
🤗 Модель VideoLLaMA 2 на HF

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥32👍12❤7⚡2

14.2K views11:50

Machinelearning

🌟

Hallo: новый подход в анимации портретных изображений на основе аудио

Hallo объединяет генеративные диффузионные модели, денойзер на основе UNet, методы временного согласования отдельных движений и опорную нейросеть, а также даёт возможность контролировать выражение и движения лица.

🖥

GitHub

🟡

Предобученные модели на Hugging Face

🟡

Arxiv

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍28🔥6❤4🥱1😭1

13K views10:07

Machinelearning

🌟

Mamba — семейство SSM-моделей

Селективные модели пространства состояний (SSM), такие как Mamba, не имеют некоторых недостатков трансформеров, таких как квадратичная вычислительная сложность при увеличении длины последовательности и большие требования к памяти. Более того, недавние исследования показали, что SSM могут соответствовать или превосходить возможности трансформеров, что делает их интересной альтернативой.

Однако до сих пор проводились лишь небольшие эксперименты по сравнению SSM с трансформерами.
Это исследование призвано исправить ситуацию, здесь проводится прямое сравнение 8B моделей Mamba, Mamba-2 и трансформера, обученных на одних и тех же наборах данных объемом до 3.5Т лексем. Также эти модели сравниваются с гибридной моделью (Mamba-2-Hybrid), состоящей из 43% слоев Mamba-2, 7% слоев Attention и 50% слоев MLP.

🤗 Mamba-2 и другие модели на Hugging Face

🟡

Arxiv

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥31👍14❤4👏3😭1

13.5K views17:03

Machinelearning

🌟

OpenVLA 7B — OpenVLA — VLA-модель с 7B параметрами

OpenVLA 7B (vision-language-action) — это open-source модель, обученная на 970K эпизодах манипулирования роботами из набора данных Open X-Embodiment. Модель принимает на вход текстовый промпт и изображения с камеры и генерирует действия робота.

OpenVLA 7B из коробки поддерживает управление несколькими роботами и может быть быстро адаптирована к новым областям робототехники с помощью тонкой настройки.

🖥

GitHub

🟡

Модели на Hugging Face

🟡

Страничка OpenVLA

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍39🔥8❤6👀6🙏1

12.7K views10:35

Machinelearning

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Runway AI только что анонсировали Gen-3 Alpha, которая генерирует видео из текста и изображений и будет доступна в ближайшие дни.

Что нас ждет
— Супер высокая детализация;
— Плавные переходы по кадрам;
— Длительность роликов до 10 секунд;
— Продвинутые инструменты контроля над видео;
— Нейронная сеть будет преобразовывать текст в видео, изображение в видео и текст в изображение;
— Возможность обучения на собственных стилях

На видео сравнение недавно-3 Alpha не и открытой Luma. Разница видна невооруженным взгялдом

Для этих генераций были использованы одни и те же промпты.

#генераторвидео

@ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥29👍18❤4

12.6K viewsedited 15:23

Machinelearning

⚡️ DeepSeek-Coder-V2: Первая модель с открытым исходным кодом, превосходящая GPT4-Turbo в кодинге и математике

> > Превосходит GPT4-Turbo, Claude3-Opus, Gemini-1.5Pro, Codestral в задачах написания кода и решении математических задач.
> Поддерживает 338 языков программирования, длина контекста 128 К.
> Полностью открытый исходный код двух размеров: 230B и 16 B

В таблице Arena-Hard-Auto DeepSeek-Coder-V2 превосходит Yi-large, Claude3-Opus, GL M4 и Qwen2-72B.

#DeepSeekCoder

▪HF: https://huggingface.co/deepseek-ai/DeepSeek-Coder-V2-Instruct
▪Github: https://github.com/deepseek-ai/DeepSeek-Coder-V2/blob/main/paper.pdf
▪Попробовать: https://chat.deepseek.com/sign_in?from=coder

@ai_machinelearning_big_data

🔥63👍19❤8🙈2

14.3K views17:33

Machinelearning

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

🎙️StreamSpeech: Мощная модель синхронного перевода речи.

StreamSpeech - это бесшовная модель “Все в одном” для автономного и синхронного распознавания речи, перевода речи и синтеза речи.

💡 StreamSpeech достигает производительности SOTA как при работе офлайн, так и при синхронном переводе речи в речь.

▪page: https://ictnlp.github.io/StreamSpeech-site/
▪paper: https://arxiv.org/abs/2406.03049
▪code: https://github.com/ictnlp/streamspeech

@ai_machinelearning_big_data

🔥47👍7❤4

13.1K views08:57

About

Blog

Apps

Platform