Машинное обучение RU
17.6K subscribers
1.43K photos
177 videos
11 files
1.89K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ StableV2V - это новая опенсорс модель с открытым исходным кодом, которая может для редактирования генерации видео

Вы можете использовать текстовые проптмы или изображения для редактирования видеоклипов.

И да, код и модель уже доступны.

Проект: https://alonzoleeeooo.github.io/StableV2V
Код: https://github.com/AlonzoLeeeooo/StableV2V
Модель: https://huggingface.co/AlonzoLeeeooo/StableV2V
👍21👎1🔥1🤬1
👩‍💻 nilearn — это библиотека на Python, ориентированная на нейровизуализацию и анализ данных с использованием машинного обучения!

🌟 Nilearn предоставляет инструменты для работы с данными функциональной и структурной МРТ, а также упрощает загрузку, визуализацию и анализ нейровизуальных данных. Основные функции библиотеки включают предобработку данных, извлечение временных рядов и обучение моделям машинного обучения для нейронаучных исследований.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥1🤔1
📝 PDF-Extract-Kit — библиотека для извлечения данных из PDF-файлов с поддержкой сложных документов с помощью моделей компьютерного зрения!

🔍 Основные особенности:

🌟 Точное извлечение текста и таблиц из структурированных и неструктурированных PDF, включая многостраничные таблицы и иерархические блоки!

🌟 OCR-интеграция, позволяющая обрабатывать PDF-документы с отсканированными изображениями!

🌟 Гибкий API на Python, что делает его удобным для анализа и интеграции в приложения!

🔐 Лицензия: AGPL-3.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
7🔥4👍3🥰1🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Material Anything

Новая модель диффузии , которая может генерировать фотореалистичные PBR-материалы для любых 3D-сеток (сгенерированный или реальных).
Проект: https://xhuangcv.github.io/MaterialAnything/
Обсуждение: https://huggingface.co/papers/2411.15138

@machinelearning_ru
👎2
🔥 codecompanion.nvim — это плагин для Neovim, предназначенный для интеграции с LLM!

🌟 Он предоставляет возможности взаимодействия с LLM прямо из редактора, позволяя выполнять различные задачи, такие как автодополнение кода, рефакторинг, генерация документации и многое другое.

🔍 Ключевые возможности плагина:

🌟 Использование интерфейса чата для взаимодействия с языковой моделью.

🌟 Выполнение задач через специальные инструменты (Tools), которые могут работать либо как команды, исполняющиеся в фоновом режиме, либо как функции, запускаемые прямо в процессе Neovim.

🌟 Настраиваемые подсказки и сценарии, упрощающие разработку, тестирование и управление кодом.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🤯2🔥1
⚡️ Эндрю Нг, основатель DeepLearningAI и Coursera только что выпустил новый пакет Python с открытым исходным кодом.

Быстрая смена моделей через простой строковый идентификатор. Гибкая и простая в использовании и библиотека.

Одна строка для переключения между любыми LLM:
OpenAI ➝ "openai:gpt-4o"
Claude ➝ "антропный:claude-3-5-sonnet"
Лама ➝ "оллама:ллама3"

pip install aisuite

GitHub: https://github.com/andrewyng/aisuite
🔥11👍42👎2😁2🤬1
Как сэкономить до 44% на профессиональных GPU? 💰

Профессиональные GPU стоят дорого и покупать их не всегда выгодно. Например, если вам нужно протестировать сервис или выполнить краткосрочную задачу.

Оптимальное решение — арендовать видеокарту в облаке. Тем более сейчас в Selectel вы можете сделать это с большой выгодой. Скидка на аренду GPU NVIDIA A100 (40 ГБ) — 29%, а на NVIDIA A30 (24 ГБ) доходит до 44%.

Кроме скидки, при аренде GPU в облаке Selectel вы получаете:

🔹Отсутствие переплат и тарификацию только за используемые ресурсы
🔹Экономию на инфраструктуре благодаря прерываемым облачным серверам и возможности заморозки ресурсов
🔹Широкий выбор готовых конфигураций серверов под любые задачи и возможность индивидуальной настройки

Арендуйте GPU со скидкой до 44% в облаке Selectel: https://slc.tl/k7249

Реклама, АО «Селектел», ИНН: 7810962785, ERID: 2VtzqwNnQBh
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🔥 Arch — это интеллектуальный распределенный прокси-сервер уровня 7 , предназначенный для защиты, наблюдения и персонализации ваших ИИ агентов!

🌟 Созданный с использованием специально разработанных LLM, Arch решает критически важные, но недифференцированные задачи, связанные с обработкой и запросами, включая обнаружение и отклонение попыток взлома, интеллектуальный вызов «бэкэнда» API для выполнения запроса пользователя, представленного в запросе, маршрутизацию к вышестоящим LLM и предложение аварийного восстановления между ними, а также централизованное управление наблюдаемостью запросов и взаимодействиями LLM.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1
🔥 nano-graphrag — библиотека для работы с Retrieval-Augmented Generation (RAG), упрощающая интеграцию графовых баз данных, таких как Neo4j, для поиска и обработки контекстных данных!

🌟 Она используется для построения эффективных систем поиска и извлечения информации с помощью графов, что актуально в задачах, связанных с естественным языком и большими языковыми моделями.

🌟 Библиотека позволяет загружать данные в графовые базы, выполнять разбиение текста на фрагменты, а также поддерживает модули для обработки запросов и работы с графами. Она интегрируется с Neo4j, используя их Graph Data Science (GDS) плагины для вычислений, что делает её подходящей для анализа сложных сетевых структур.

🔐 Лицензия: MIT

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥2👍1
👀 Я просто оставлю этот вывод Copilot здесь...

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
😁18👍21🥰1😱1🤩1
🔍 veRL — это гибкая, эффективная и промышленная среда обучения с подкреплением (RL), разработанная для больших языковых моделей (LLM)!

💡 Обучение с подкреплением — это тип машинного обучения, в котором агент обучается принимать решения, взаимодействуя с окружающей средой, чтобы максимизировать награду. Агент выбирает действия, исходя из текущего состояния среды, и получает обратную связь в виде награды или штрафа. Основной задачей является улучшение стратегии (политики), чтобы в будущем принимать более эффективные решения. Это используется в таких областях, как игры (например, AlphaGo), робототехника, автономные системы и оптимизация процессов.

🔐 Лицензия: Apache-2.0

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥1
📖 Человек и LLM: как построить метрики для оценки моделей

💡 Оценка качества ответов языковой модели требует сложного комплексного подхода и является такой же сложной задачей, как и разработка LLM. Авторы статьи объясняют ограничения академических бенчмарков, включая проблему протечек данных и ограниченность их проверки, а также рассказывают про систему AI-тренеров в Яндексе — специально отобранных экспертов для глубокой оценки ответов модели.

🌟 Как оказалось, универсального решения для оценки LLM нет, необходимо постоянно комбинировать различные методы и регулярно проверять, насколько модель действительно полезна в реальных сценариях использования. В статье подробнее раскрывается, как это делают в Яндексе.

📖 Читать: *клик*

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥4
🖥 01-preview достигла точности более 95% на тестах безопасности CompTIA!

🌟 Очень тесная кластеризация показателей среди ведущих моделей (95,72% против 92,40 %) предполагает снижение доходности после определенных размеров моделей.

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6🥰3👍2🎉1
Forwarded from Machinelearning
🌟 SmolVLM: набор компактных VLM от HuggingFace - Base, Synthetic и Instruct.

SmolVLM - серия компактных VLM с 2 млрд. параметров, отличающихся высокой эффективностью использования памяти и могут быть развернуты на локальных устройствах с ограниченными ресурсами.

Архитектура SmolVLM основана на Idefics3, с несколькими отличиями:

🟢В качестве языковой основы используется SmolLM2 1.7B вместо Llama 3.1 8B;

🟢Визуальная информация сжимается в 9 раз с помощью стратегии pixel shuffle, по сравнению с 4-кратным сжатием в Idefics3;

🟢Используются патчи размером 384x384 пикселей, а не 364x364;

🟢Визуальная основа модели изменена на shape-optimized SigLIP с патчами 384x384 пикселей и внутренними патчами 14x14;

🟢Контекстное окно SmolLM2 было расширено до 16 тыс. токенов для поддержки работы с несколькими изображениями.

Модель кодирует каждый патч изображения 384x384 в 81 токен, что позволяет ей обрабатывать тестовые запросы и изображения с использованием всего 1.2 тыс. токенов, в то время как Qwen2-VL использует 16 тыс. токенов. Это преимущество приводит к значительно более высокой скорости предварительной обработки (в 3,3-4,5 раза) и генерации (в 7,5-16 раз) по сравнению с Qwen2-VL.

Для самостоятельной тонкой настройки SmolVLM можно использовать transformers и TRL. Разработчиками представлен блокнот для файнтюна на VQAv2 с использованием LoRA, QLoRA или полной тонкой настройки. SmolVLM интегрирован с TRL для DPO через CLI.

⚠️ При batch sizes=4 и 8-битной загрузке QLoRA файнтюн потребляет около ~16 GB VRAM


📌Лицензирование:  Apache 2.0


🟡Статья на HF
🟡Набор моделей
🟡Demo


@ai_machinelearning_big_data

#AI #ML #SmallVLM #Huggingface
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍1🔥1
📖 Руководство: Как установить NVIDIA CUDA Toolkit в Ubuntu!

💡 Набор инструментов NVIDIA Compute Unified Device Architecture (CUDA) — это программная платформа, которая позволяет разработчикам использовать вычислительную мощность обработки NVIDIA и приложений с ускорением на GPU.

🌟 Используя CUDA Toolkit, вы можете улучшить производительность, масштабируемость и эффективность в ряде приложений. К ним относятся вычисления, глубокое обучение, компьютерное зрение, игры и многое другое.

🔗 Ссылка: *клик*

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2😁2🥰1
🔍 Qwen-Agent — инструмент для построения retrieval-augmented generation (RAG) систем и работы с большими языковыми моделями (LLM)!

🌟 Он разработан для выполнения сложных задач, таких как извлечение релевантной информации из больших объемов текста, многозадачное рассуждение и пошаговая дедукция.

🌟 Qwen-Agent применяется в системах, где важно объединить модель с механизмами поиска, чтобы обрабатывать длинные контексты и решать задачи, требующие комбинированного анализа данных. Среди особенностей: обработка запросов с использованием методов BM25, векторного поиска, и распределение задач на несколько уровней агентов, каждый из которых специализируется на своих задачах. Это делает Qwen-Agent полезным для обработки длинных текстов, таких как документы, требующих понимания контекста и взаимосвязей между частями текста.

🖥 Github

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍3🔥2
💡 Интересный тред том, как компании на самом деле внедряют LLM в продакшен (более 300 технических примеров, включая локальные

https://www.reddit.com/r/LocalLLaMA/comments/1h4u7au/a_nobs_database_of_how_companies_actually_deploy/

@machinelearning_ru
🔥9👍42👎1🤬1