🔥 Полезные библиотеки Python
DeepFaceLive - Python утилита для создания дипфейков в режиме реального времени для потоковой передачи и видеозвонков.
⚙️ GitHub/Инструкция
#python #soft #github
DeepFaceLive - Python утилита для создания дипфейков в режиме реального времени для потоковой передачи и видеозвонков.
⚙️ GitHub/Инструкция
#python #soft #github
👍10
DALLE-Mini – модель искусственного интеллекта, которая генерирует изображения по любому вашему запросу
⤷ Демо в режиме реального времени
| #Python #AI #Interesting
@machinelearning_ru
⤷ Демо в режиме реального времени
| #Python #AI #Interesting
@machinelearning_ru
👍4🔥1👏1🎉1
PngBin – Инструмент преобразование любых двоичных данных в файл изображения PNG и наоборот
Изображение, созданное PngBin, будет иметь все свойства, как и обычное изображение PNG, за исключением того, что при просмотре оно будет выглядеть сломанным и «зашумленным»
@machinelearning_ru | #Python #Photo #Interesting #Security
Изображение, созданное PngBin, будет иметь все свойства, как и обычное изображение PNG, за исключением того, что при просмотре оно будет выглядеть сломанным и «зашумленным»
@machinelearning_ru | #Python #Photo #Interesting #Security
🔥6
Real-Time-Voice-Cloning – Инструмент для клонирования голоса в режиме реального времени
Этот репозиторий представляет собой реализацию Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS) с вокодером, который работает в режиме реального времени.
SV2TTS - это трехступенчатая структура глубокого обучения, которая позволяет создавать численное представление голоса из нескольких секунд аудио и использовать его для подготовки модели преобразования текста в речь, обученной на воспроизведение голоса.
#GitHub | #Python #Voice
@machinelearning_ru
Этот репозиторий представляет собой реализацию Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis (SV2TTS) с вокодером, который работает в режиме реального времени.
SV2TTS - это трехступенчатая структура глубокого обучения, которая позволяет создавать численное представление голоса из нескольких секунд аудио и использовать его для подготовки модели преобразования текста в речь, обученной на воспроизведение голоса.
#GitHub | #Python #Voice
@machinelearning_ru
GitHub
GitHub - CorentinJ/Real-Time-Voice-Cloning: Clone a voice in 5 seconds to generate arbitrary speech in real-time
Clone a voice in 5 seconds to generate arbitrary speech in real-time - CorentinJ/Real-Time-Voice-Cloning
👍7😁1
DeepFaceDrawing — нейросеть, которая позволяет создавать реалистичные изображения лиц из набросков от руки
Метод отрисовки по существу использует входные эскизы в качестве «мягких» ограничений и, таким образом, способен создавать высококачественные изображения лиц даже из грубых и/или неполных эскизов. Данный инструмент прост в использовании даже для тех кто не рисует, сохраняя при этом тонкое управление деталями формы
#GitHub | #Python #Interesting
@machinelearning_ru
Метод отрисовки по существу использует входные эскизы в качестве «мягких» ограничений и, таким образом, способен создавать высококачественные изображения лиц даже из грубых и/или неполных эскизов. Данный инструмент прост в использовании даже для тех кто не рисует, сохраняя при этом тонкое управление деталями формы
#GitHub | #Python #Interesting
@machinelearning_ru
🔥13👍2
Машинное обучение RU
🔥 NVIDIA’s AI: Amazing DeepFakes And Virtual Avatars! 🎞Разбор статьи 🗒 Статья ⚙️ Демо @machinelearning_ru
This media is not supported in your browser
VIEW IN TELEGRAM
#️⃣ BlendGAN
интересная нейронка позволяющая смешивать лица и преобразовывать их в портреты.
⚙️ GitHub
🔋 Demo
#python #github #soft
@machinelearning_ru
интересная нейронка позволяющая смешивать лица и преобразовывать их в портреты.
⚙️ GitHub
🔋 Demo
#python #github #soft
@machinelearning_ru
👍6❤2😁2🔥1
Понадобится, если вы не слишком часто программируете на Python, хотите научиться в довольно короткий срок или хотите быстро вникнуть в синтаксис, функции и методы языка.
На страничке также есть описания некоторых библиотек для скрапинга, затронуто метапрограммирование и асинхронность.
#python #cheatsheet
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤1🥰1
Раскрашивание изображений с использованием нейронных сетей
С помощью DeOldify можно преобразовать старые черно-белые фотографии, добавив к ним цвет. Для работы с моделью автор использовал python 3.10, но вы можете поэкспериментировать со своими фотографиями на любом другом языке программирования.
Репозиторий: https://github.com/jantic/DeOldify
Руководство: https://habr.com/ru/post/681928/
#python
С помощью DeOldify можно преобразовать старые черно-белые фотографии, добавив к ним цвет. Для работы с моделью автор использовал python 3.10, но вы можете поэкспериментировать со своими фотографиями на любом другом языке программирования.
Репозиторий: https://github.com/jantic/DeOldify
Руководство: https://habr.com/ru/post/681928/
#python
❤5🔥2🥰1
Полезно, если вам нужно получить верхние / нижние N элементов.
@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥2❤1😁1
🦎Armadillo - библиотека ML на С++
Armadillo — это библиотека линейной алгебры на C++, разработанная НИЦТА и независимыми участниками, применяемая для научных вычислений в машинном обучении и других областях, таких как биоинформатика и компьютерное зрение. Библиотека оптимизирует вычисления благодаря многопоточности OpenMP и предоставляет интерфейс, похожий на MATLAB. Подходит для быстрой реализации научных исследований в продуктивные среды.
#machinelearning #DataScience #python #AI #DeepLearning #cplusplus #mlalgorithms #DataVisualization #jobs
📎 Описание либы
@machinelearning_ru
Armadillo — это библиотека линейной алгебры на C++, разработанная НИЦТА и независимыми участниками, применяемая для научных вычислений в машинном обучении и других областях, таких как биоинформатика и компьютерное зрение. Библиотека оптимизирует вычисления благодаря многопоточности OpenMP и предоставляет интерфейс, похожий на MATLAB. Подходит для быстрой реализации научных исследований в продуктивные среды.
#machinelearning #DataScience #python #AI #DeepLearning #cplusplus #mlalgorithms #DataVisualization #jobs
📎 Описание либы
@machinelearning_ru
❤4👍4🔥2
Forwarded from Machinelearning
Этот проект был создан, с целью изучения понимания внутренней работы PyTorch и других популярных фреймворков глубокого обучения.
Главная цель проекта - создание с нуля минималистичного, но при этом мощного фреймворк глубокого обучения, который можно использовать как для исследований, так и для продакшена.
Фреймворк написан на C и Python и спроектирован так, чтобы его было легко понять и модифицировать.
Знаменитая цитат Ричарда Фейнмена - То, что я не могу создать, я не понимаю.
Создание собственного языка программирования, игрового движка и конечно фреймворка машинного обучения позволит понять, как работает современное программное обеспечение, до мельчайших деталей.
◾️GitHub
◾️Demo
◾️Docs
@ai_machinelearning_big_data
#c99 #python #framework
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥4❤1
🧠 ThinkMesh: Параллельное мышление для LLM
ThinkMesh — это библиотека на Python, позволяющая запускать различные пути рассуждений параллельно, используя внутренние сигналы уверенности для перераспределения вычислительных ресурсов. Она поддерживает оффлайн-работу с Hugging Face Transformers и API.
🚀 Основные моменты:
- Параллельное рассуждение с динамическим перераспределением бюджета
- Оффлайн-работа с Transformers и интеграция с OpenAI
- Асинхронное выполнение с динамическими микро-пакетами
- Поддержка пользовательских верификаторов и редукций
- Кэширование и метрики для отслеживания производительности
📌 GitHub: https://github.com/martianlantern/ThinkMesh
#python
ThinkMesh — это библиотека на Python, позволяющая запускать различные пути рассуждений параллельно, используя внутренние сигналы уверенности для перераспределения вычислительных ресурсов. Она поддерживает оффлайн-работу с Hugging Face Transformers и API.
🚀 Основные моменты:
- Параллельное рассуждение с динамическим перераспределением бюджета
- Оффлайн-работа с Transformers и интеграция с OpenAI
- Асинхронное выполнение с динамическими микро-пакетами
- Поддержка пользовательских верификаторов и редукций
- Кэширование и метрики для отслеживания производительности
📌 GitHub: https://github.com/martianlantern/ThinkMesh
#python
GitHub
GitHub - martianlantern/ThinkMesh: Parallel thinking for LLMs. Confidence‑gated, strategy‑driven, offline‑friendly
Parallel thinking for LLMs. Confidence‑gated, strategy‑driven, offline‑friendly - martianlantern/ThinkMesh
🔥8❤3👍2
🚀 Обучение LLM-агентов для многоповоротного принятия решений
AgentGym-RL — это фреймворк для тренировки LLM-агентов, способных принимать решения в сложных многоповоротных сценариях с использованием методов усиленного обучения. Он предлагает разнообразные реальные сценарии и поддерживает популярные алгоритмы RL, улучшая производительность моделей до уровня коммерческих решений.
🚀 Основные моменты:
- Модульная система для гибкости и расширяемости.
- Поддержка различных реальных сред, включая веб-навигацию и глубокий поиск.
- Метод ScalingInter-RL для стабильного обучения агентов.
- Интерактивный интерфейс для визуализации взаимодействий.
📌 GitHub: https://github.com/WooooDyy/AgentGym-RL
#python
AgentGym-RL — это фреймворк для тренировки LLM-агентов, способных принимать решения в сложных многоповоротных сценариях с использованием методов усиленного обучения. Он предлагает разнообразные реальные сценарии и поддерживает популярные алгоритмы RL, улучшая производительность моделей до уровня коммерческих решений.
🚀 Основные моменты:
- Модульная система для гибкости и расширяемости.
- Поддержка различных реальных сред, включая веб-навигацию и глубокий поиск.
- Метод ScalingInter-RL для стабильного обучения агентов.
- Интерактивный интерфейс для визуализации взаимодействий.
📌 GitHub: https://github.com/WooooDyy/AgentGym-RL
#python
❤5👍2🔥1
🎙️ VibeVoice: Инновационная модель TTS для длинных разговоров
VibeVoice — это передовая система синтеза речи, способная генерировать выразительное аудио для длительных разговоров, включая подкасты. Она решает проблемы традиционных TTS-систем, обеспечивая высокую согласованность голосов и естественное взаимодействие между несколькими спикерами.
🚀 Основные моменты:
- Синтезирует речь до 90 минут с 4 различными спикерами.
- Использует токенизаторы непрерывной речи для повышения эффективности.
- Поддерживает высокое качество звука при низкой частоте кадров.
- Применяет диффузионные модели для понимания контекста и потока диалога.
📌 GitHub: https://github.com/microsoft/VibeVoice
#python
VibeVoice — это передовая система синтеза речи, способная генерировать выразительное аудио для длительных разговоров, включая подкасты. Она решает проблемы традиционных TTS-систем, обеспечивая высокую согласованность голосов и естественное взаимодействие между несколькими спикерами.
🚀 Основные моменты:
- Синтезирует речь до 90 минут с 4 различными спикерами.
- Использует токенизаторы непрерывной речи для повышения эффективности.
- Поддерживает высокое качество звука при низкой частоте кадров.
- Применяет диффузионные модели для понимания контекста и потока диалога.
📌 GitHub: https://github.com/microsoft/VibeVoice
#python
❤5👍1🔥1
⚡ FlashVSR: Реальное время для видео-суперразрешения
FlashVSR — это инновационная система, использующая диффузионные модели для достижения суперразрешения видео в реальном времени. Она обеспечивает высокую эффективность и масштабируемость, работая на скорости около 17 FPS для видео 768 × 1408 на одном GPU A100. Проект включает новый набор данных VSR-120K для обучения и демонстрирует выдающиеся результаты, значительно опережая предыдущие модели.
🚀Основные моменты:
- Первая диффузионная модель для потокового видео-суперразрешения.
- Эффективная трехступенчатая дистилляция для быстрого обучения.
- Локально-ограниченное разреженное внимание для снижения вычислительных затрат.
- Поддержка ультра-высоких разрешений с до 12-кратным ускорением.
📌 GitHub: https://github.com/OpenImagingLab/FlashVSR
#python
FlashVSR — это инновационная система, использующая диффузионные модели для достижения суперразрешения видео в реальном времени. Она обеспечивает высокую эффективность и масштабируемость, работая на скорости около 17 FPS для видео 768 × 1408 на одном GPU A100. Проект включает новый набор данных VSR-120K для обучения и демонстрирует выдающиеся результаты, значительно опережая предыдущие модели.
🚀Основные моменты:
- Первая диффузионная модель для потокового видео-суперразрешения.
- Эффективная трехступенчатая дистилляция для быстрого обучения.
- Локально-ограниченное разреженное внимание для снижения вычислительных затрат.
- Поддержка ультра-высоких разрешений с до 12-кратным ускорением.
📌 GitHub: https://github.com/OpenImagingLab/FlashVSR
#python
GitHub
GitHub - OpenImagingLab/FlashVSR: Towards Real-Time Diffusion-Based Streaming Video Super-Resolution — An efficient one-step diffusion…
Towards Real-Time Diffusion-Based Streaming Video Super-Resolution — An efficient one-step diffusion framework for streaming VSR with locality-constrained sparse attention and a tiny conditional de...
🔬 Генерация белков с BoltzGen
BoltzGen — это инструмент для генерации и оптимизации дизайна белков, использующий передовые методы машинного обучения. Он позволяет создавать наборы ранжированных дизайнов на основе спецификаций в формате YAML, обеспечивая гибкость и высокую производительность.
🚀 Основные моменты:
- Генерация белков с использованием спецификаций YAML.
- Поддержка GPU для ускорения вычислений.
- Выходные данные включают промежуточные и финальные дизайны.
- Возможность анализа и фильтрации результатов.
📌 GitHub: https://github.com/HannesStark/boltzgen
#python
BoltzGen — это инструмент для генерации и оптимизации дизайна белков, использующий передовые методы машинного обучения. Он позволяет создавать наборы ранжированных дизайнов на основе спецификаций в формате YAML, обеспечивая гибкость и высокую производительность.
🚀 Основные моменты:
- Генерация белков с использованием спецификаций YAML.
- Поддержка GPU для ускорения вычислений.
- Выходные данные включают промежуточные и финальные дизайны.
- Возможность анализа и фильтрации результатов.
📌 GitHub: https://github.com/HannesStark/boltzgen
#python
❤2👍1
📚 Читаем EPUB с LLM 🚀
Легкий самодостаточный EPUB-ридер, позволяющий читать книги по главам и легко копировать текст для работы с LLM. Проект создан для вдохновения и не требует поддержки. Просто загружайте EPUB и читайте вместе с ИИ.
🚀 Основные моменты:
- Чтение EPUB-файлов по главам
- Удобный интерфейс для работы с LLM
- Легкая настройка и использование
- Проект для вдохновения, без поддержки
📌 GitHub: https://github.com/karpathy/reader3
#python
Легкий самодостаточный EPUB-ридер, позволяющий читать книги по главам и легко копировать текст для работы с LLM. Проект создан для вдохновения и не требует поддержки. Просто загружайте EPUB и читайте вместе с ИИ.
🚀 Основные моменты:
- Чтение EPUB-файлов по главам
- Удобный интерфейс для работы с LLM
- Легкая настройка и использование
- Проект для вдохновения, без поддержки
📌 GitHub: https://github.com/karpathy/reader3
#python
❤3👍2🤔2
🎤 Быстрый текст-в-речь с Supertonic
Supertonic — это высокопроизводительная система текст-в-речь, работающая на вашем устройстве. Она обеспечивает молниеносное создание речи с минимальными затратами ресурсов и полным соблюдением конфиденциальности. Никаких облачных решений — всё происходит локально.
🚀Основные моменты:
- ⚡ Генерация речи до 167× быстрее реального времени
- 🪶 Легковесная архитектура с 66M параметрами
- 📱 Полная обработка на устройстве без задержек
- 🎨 Обработка сложных текстов без предварительной подготовки
- ⚙️ Гибкая настройка параметров и развертывания
📌 GitHub: https://github.com/supertone-inc/supertonic
#python
Supertonic — это высокопроизводительная система текст-в-речь, работающая на вашем устройстве. Она обеспечивает молниеносное создание речи с минимальными затратами ресурсов и полным соблюдением конфиденциальности. Никаких облачных решений — всё происходит локально.
🚀Основные моменты:
- ⚡ Генерация речи до 167× быстрее реального времени
- 🪶 Легковесная архитектура с 66M параметрами
- 📱 Полная обработка на устройстве без задержек
- 🎨 Обработка сложных текстов без предварительной подготовки
- ⚙️ Гибкая настройка параметров и развертывания
📌 GitHub: https://github.com/supertone-inc/supertonic
#python
GitHub
GitHub - supertone-inc/supertonic: Lightning-Fast, On-Device TTS — running natively via ONNX.
Lightning-Fast, On-Device TTS — running natively via ONNX. - supertone-inc/supertonic
❤4🤔1
🖼️ Удаление водяных знаков с Sora2
Этот проект предлагает эффективный инструмент для удаления водяных знаков из изображений, используя алгоритмы глубокого обучения. Он предназначен для улучшения качества изображений, сохраняя при этом их оригинальные детали.
🚀Основные моменты:
- Использует современные методы машинного обучения.
- Поддерживает различные форматы изображений.
- Легко интегрируется в существующие рабочие процессы.
- Открытый исходный код для гибкости и модификации.
📌 GitHub: https://github.com/dachensky/sora2-watermark-remover
#python
Этот проект предлагает эффективный инструмент для удаления водяных знаков из изображений, используя алгоритмы глубокого обучения. Он предназначен для улучшения качества изображений, сохраняя при этом их оригинальные детали.
🚀Основные моменты:
- Использует современные методы машинного обучения.
- Поддерживает различные форматы изображений.
- Легко интегрируется в существующие рабочие процессы.
- Открытый исходный код для гибкости и модификации.
📌 GitHub: https://github.com/dachensky/sora2-watermark-remover
#python
GitHub
dachensky/sora2-watermark-remover
Sora 2 AI generated videos gentle watermark remover - dachensky/sora2-watermark-remover
😢1
🧠 AgentEvolver: Эффективная система саморазвивающихся агентов
AgentEvolver — это комплексная платформа для самообучения агентов, объединяющая механизмы самовопроса, самонавигации и самоатрибуции. Она позволяет агентам автономно улучшать свои способности, обеспечивая эффективное и непрерывное развитие.
🚀Основные моменты:
- Автоматическая генерация задач для уменьшения затрат на создание данных.
- Оптимизация исследований через опыт, полученный от предыдущих задач.
- Тонкая настройка политики на основе атрибуции промежуточных шагов.
- Модульная архитектура для легкой настройки и расширения.
- Высокая производительность с меньшим количеством параметров по сравнению с аналогами.
📌 GitHub: https://github.com/modelscope/AgentEvolver
#python
AgentEvolver — это комплексная платформа для самообучения агентов, объединяющая механизмы самовопроса, самонавигации и самоатрибуции. Она позволяет агентам автономно улучшать свои способности, обеспечивая эффективное и непрерывное развитие.
🚀Основные моменты:
- Автоматическая генерация задач для уменьшения затрат на создание данных.
- Оптимизация исследований через опыт, полученный от предыдущих задач.
- Тонкая настройка политики на основе атрибуции промежуточных шагов.
- Модульная архитектура для легкой настройки и расширения.
- Высокая производительность с меньшим количеством параметров по сравнению с аналогами.
📌 GitHub: https://github.com/modelscope/AgentEvolver
#python
❤1👍1