Машинное обучение RU

⚡️ Похоже, это самая большая в мире открытая коллекция лор

Более 500 лор.

@machinelearning_ru

❤7👍2🔥1

1.91K views12:26

⚡️

Vikhr: новые модели на 12B и 8B для русского языка с уникальным методом выравнивания.

Vikhr Team — сообщество энтузиастов, занимающихся созданием и развитием русифицированных LLM, выпустили две новые модели, оптимизированные для русского языка в задачах генерации кода, решения математических задач, обобщения, ответов на вопросы и построения логических выводов. Обе модели адаптированы для RAG и могут выступать реранкером на уровне LLM.

▶️

Vikhr-Nemo-12B-Instruct-R-21-09-24 — инструктивная модель на базе Mistral-Nemo-Instruct-2407 с 12 млрд. параметров и контекстным окном в 128К токенов.
В бенчмарке Ru-Arena General, Vikhr-Nemo-12B-Instruct-R-21-09-24 достигла результата в 79.8, уступая только двум моделям семейства GPT-4 .

🟢Версии квантования Vikhr-Nemo-12B-Instruct-R-21-09-24 в разрядности от 3-bit (6.08 Gb) до 16-bit (24.5 GB) в GGUF формате.

▶️

Vikhr-Llama3.1-8B-Instruct-R-21-09-24 — инструктивная модель на базе Meta-Llama-3.1-8B-Instruct с 8 млрд. параметров, контекстным окном в 128К токенов. В Ru-Arena General она показала значение winrate 63.4. По словам Vikhr Team — это лучший результат среди 8B моделей с поддержкой русского языка.

🟠Версии квантования Vikhr-Llama3.1-8B-Instruct-R-21-09-24 в разрядности от 3-bit (4.02 Gb) до 16-bit (16.1 GB) в GGUF формате.

Для файнтюна базовых моделей Mistral-Nemo-12B и Llama-3.1-8B, Vikhr Team разработали уникальный метод выравнивания — Simple Margin Preference Optimization (SMPO).

Он представляет собой микс из техник, заимствованных из CRLFT, IPO и SimPO, с добавлением своей функции потерь. Метод опубликован в репозитории на GitHub в комплекте тулкита скриптов и конфигураций, использовавшихся для обучения представленных моделей.

В процессе обучения моделей использовался кастомный SFT-датасет GrandMaster-PRO-MAX, собранный Vikhr Team самостоятельно, для следования самым разным наборам инструкций на разных языках (в основном на русском) и отвечать также - на русском языке. В него была включена CoT-способность.

📌Лицензирование : Apache 2.0 License.

🟡

Модель Vikhr-Nemo-12B-Instruct

🟡

Модель Vikhr-Llama3.1-8B-Instruct

🟡

GGUF Vikhr-Nemo-12B-Instruct

🟡

GGUF Vikhr-Llama3.1-8B-Instruct

🟡

Датасет

🟡

Demo Vikhr-Nemo-12B-Instruct

🖥

Github

@ai_machinelearning_big_data

#AI #ML #LLM #Vikhr

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8🔥3👍2

1.89K views15:01

Машинное обучение RU

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

🎶 OpenMusic

Приложение, воспроизводящее музыку 🎧 🎹

▪github: https://github.com/ivcylc/qa-mdt
▪демо: https://huggingface.co/spaces/jadechoghari/OpenMusic
▪модель: https://huggingface.co/jadechoghari/openmusic

@machinelearning_ru

❤1👍1🔥1

2.09K views17:40

Машинное обучение RU

⚡️Converting a From-Scratch GPT Architecture to Llama 2

Хотите посмотреть сравнение GPT и Llama под капотом?

Здесь пошаговый учебник-гайд с кодом, где разобраны ключевые различия:

Github

@machinelearning_ru

👍6❤2🔥2

2.37K viewsedited 11:10

Машинное обучение RU

📌 Mini-Omni: Языковые модели, которые могут слышать и говорить, одновременно думая в онлайн режиме

https://huggingface.co/spaces/gradio/omni-mini

@machinelearning_ru

❤7🔥1

2.46K views14:00

Машинное обучение RU

Forwarded from Machinelearning

🌟 Параллельные стратегии с Jax: обучающий туториал.

Обучение LLM требует огромных вычислительных ресурсов. Поскольку размеры моделей исчисляются миллиардами параметров, специализированные методы распараллеливания необходимы для того, чтобы сделать обучение выполнимым.

В статье "Исследование параллельных стратегий с Jax" подробно рассматривается реализация некоторых стратегий масштабирования в Jax - фреймворке Python, предназначенном для высокопроизводительных численных вычислений с поддержкой ускорителей GPU и TPU.

Стратегии, описанные в туториале с примерами кода и иллюстрациями:

🟢

Data Parallelism - распределение данных между несколькими устройствами, которые одновременно обучают модель;

🟢

Tensor Parallelism - распределение весов модели между устройствами, позволяет каждому устройству обрабатывать свою часть тензора параллельно;

🟢

Pipeline Parallelism разделяет модель на этапы, которые выполняются последовательно на разных устройствах;

🟢

Mixture-of-Experts использует множество специализированных экспертов для обработки различных частей входных данных, что позволяет масштабировать модель до огромных размеров.

▶️ Автор статьи - Александр Самарин, Lead ML Engineer в Huawei c 5-ти летнем опытом в глубоком обучении.

@ai_machinelearning_big_data

#AI #ML #LLM #JAX #Tutorial

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5🔥2

1.91K views19:01

Машинное обучение RU

🖥

CUDA Programming Course – High-Performance Computing with GPUs

Свежий Бесплатный курс от freeCodeCamp по программированию CUDA.

Этот 12 -ти часовой бесплатный курс научит вас программировать с помощью Nvidia CUDA и использовать графические процессоры для высокопроизводительных вычислений и Deep learning.

Содержание:

🔜

(0:00:00) Вступление

🔜

(0:16:52) Глава 1 (Экосистема глубокого обучения)

🔜

(0:37:43) Глава 2 (Настройка CUDA)

🔜

(0:47:03) Глава 3 (Обзор C/C++)

🔜

(1:35:47) Глава 4 (Введение в графические процессоры)

🔜

(1:51:40) Глава 5 (Написание ваших первых ядер)

🔜

(3:55:26) Глава 6 (CUDA API)

🔜

(5:35:22) Глава 7 (Быстрое умножение матриц)

🔜

(8:22:36) Глава 8 (Triton)

🔜

(9:04:43) Глава 9 (Расширения PyTorch)

🔜

(9:18:10) Глава 10 (Многослойный персептрон MNIST)

🔜

(11:41:13) Глава 11 (Что изучать дальше?)

🔜

(11:54:38) Заключение

▪Video: https://www.youtube.com/watch?v=86FAWCzIe_4
▪Code: https://github.com/Infatoshi/cuda-course
▪Github https://github.com/Infatoshi/mnist-cuda

#cuda #deeplearning #cpp #c #bigdata #courses #бесплатныйкурс

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥13👍5❤3🎉2🤩2👏1

2.69K viewsedited 07:46

Машинное обучение RU

⚡️ Команда Яндекса рассказала, как генерировать GPT-нейросетями миллиарды объявлений на малом количестве GPU

От генерации шаблонами с ранжированием по длине до использования тяжелых BERT. Руководитель группы автоматической генерации рекламы рассказала о соединении тяжёлых процессингов и GPU‑вычислений и решении сопутствующих сложностей.

🔗 Ссылка

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥6👍4❤3

2.39K views11:42

Машинное обучение RU

🖥 Довольно интересная статья, в которой авторы сравнивают по различным критериям 59 малых языковых моделей с открытым исходным кодом. Анализируют такие возможности, как рассуждение, возможность к обучению, математика и кодинг, а также затраты на запуск, задержку ответов и многое другое.

🔗 Ссылка: *клик*

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤6👏2

2.67K views14:01

Машинное обучение RU

Forwarded from Machinelearning

3:22

This media is not supported in your browser

VIEW IN TELEGRAM

🌟 vGPU NVIDIA на базе драйвера Nouveau для Linux.

NVIDIA представила набор патчей для ядра Linux с технологией vGPU для использования виртуальных графических процессоров в системах виртуализации. vGPU разделяет ресурсы физического графического процессора NVIDIA, привязывая каждый виртуальный GPU к виртуальной функции PCI Express.

Драйвер vGPU работает с видеокартами NVIDIA на архитектуре Ada Lovelace, создавая от одного до нескольких виртуальных GPU в зависимости от модели карты. В хост-системе создание и сопряжение виртуальных GPU с гостевыми системами выполняются изменённым драйвером Nouveau. В гостевых системах используются штатные драйверы NVIDIA, как для обычного графического процессора.

Каждый vGPU получает часть памяти из фреймбуфера физического GPU, различаясь типами, назначением, размером видеопамяти, количеством дисплеев и максимальным разрешением экрана.

Реализация технологии vGPU включает базовый драйвер nvkm на основе Nouveau и менеджер vgpu_mgr, реализованный как модуль VFIO. Менеджер создает и удаляет виртуальные GPU, выбирает тип, управляет ресурсами и предоставляет API для управления. Он взаимодействует с базовым драйвером GPU для загрузки прошивки GSP, управления ресурсами, обработки исключений, конфигурации и системных событий.

Также в Mesa Vulkan-драйвер добавлен gfxstream (Graphics Streaming Kit) для доступа к API Vulkan из гостевых систем Linux, Android и Fuchsia. Драйвер, разработанный Google, перенаправляет обращения к графическим API при виртуализации API Vulkan. Он используется в эмуляторе Android, виртуальном устройстве Cuttlefish, сервисе Google Play Games и операционной системе Fuchsia. Gfxstream включен в QEMU и crosvm и поддерживается совместно с устройствами virtio-gpu и goldish.

🟡

Страница релиза

🟡

Документация

🟡

Host Kernel

🟡

Guest driver package

@ai_machinelearning_big_data

#AI #ML #vGPU #Linux #NVIDIA

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥2

2.24K views14:58

Машинное обучение RU

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ Редактирование выражений лица в режиме реального времени

Grog преобразовывает изображение Cog в Gradio, используя серверную часть ComfyUI - магия открытого исходного кода 🤝

▶️Модель: https://huggingface.co/spaces/fffiloni/expression-editor

@machinelearning_ru

👍10❤1🔥1

2.42K viewsedited 12:36

Машинное обучение RU

🖥

Qocker — это удобное приложение с графическим интерфейсом для управления контейнерами Docker

🔍 Функции:
🌟 Обзор контейнеров: просматривайте все свои контейнеры Docker в древовидной структуре.
🌟 Быстрый доступ к терминалу: откройте терминал для любого контейнера двойным щелчком мыши.
🌟 Управление контейнерами: запуск, остановка и удаление контейнеров непосредственно из графического интерфейса.
🌟 Обновления в режиме реального времени: статусы контейнеров обновляются в режиме реального времени.
🌟 Кроссплатформенность: работает на Windows, macOS и Linux.

💡 Установка:

🌟 Клонируйте этот репозиторий:


git clone https://github.com/xlmnxp/qocker.git

🌟 Перейдите в каталог проекта:


cd qocker

🌟 Установите необходимые зависимости:


pip install -r requirements.txt

💡 Использование:


python3 main.py

🔐 Лицензия: GNU

▪️Github

@machinelearning_ru

Please open Telegram to view this post

VIEW IN TELEGRAM

😁8❤4👍4👎2🔥2

2.59K views13:00

Машинное обучение RU

💡 AMD выпустила модель размером 135M, натренированную на 690 млрд токенов

Модель слабая, единственная ее фича - тренировка на амд.

https://huggingface.co/amd/AMD-Llama-135m

@machinelearning_ru

huggingface.co

amd/AMD-Llama-135m · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

😁5👍3🔥2🤔2❤1

2.57K viewsedited 20:59

About

Blog

Apps

Platform