Справочник Программиста
6.2K subscribers
1.45K photos
390 videos
64 files
1.82K links
По рекламе - @it_start_programmer
Мои курсы - @courses_from_it_start_bot
Сайт - https://it-start.online/
YouTube - https://www.youtube.com/@it_start
Реклама на бирже - https://telega.in/c/programmersGuide_1

Предложить идею: @it_start_suggestion_bot
Download Telegram
🔈 MiMo-Audio — это проект по созданию аудиоязыковых моделей, способных к обучению с небольшим количеством примеров. Масштабирует подход GPT-3 из текстовой области на аудио, позволяя моделям обобщать на новые аудиозадачи без специализированного дообучения.

Демонстрирует высокую точность на задачах понимания речи, аудиоанализе и генерации речи, включая голосовое редактирование, конверсию голоса и продолжение диалогов.

📌 Основные особенности:
🔵Обучение с малым количеством примеров (Few-shot) на аудио без специализированного дообучения.
🔵Поддержка задач понимания речи и генерации аудио (TTS, диалоги, стиль речи).
🔵Возможности голосового редактирования, конверсии и стилизации.
🔵Архитектура с токенизатором, кодировщиком и LLM для эффективной обработки длинных аудиопоследовательностей.


📱 Репозиторий
💬 Демо

➡️Справочник Программиста. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤‍🔥1👍1
Please open Telegram to view this post
VIEW IN TELEGRAM
🖼 SRPO — это проект, реализующий метод «Semantic Relative Preference Optimization» для дообучения текст-в-изображение моделей, направленный на то, чтобы результаты генерации лучше соответствовали человеческим эстетическим предпочтениям.

📌 Основные особенности:
🔵Улучшает качество генерации изображений за счёт согласования с человеческими эстетическими предпочтениями.
🔵Использует метод Semantic Relative Preference Optimization для обучения моделей.
🔵Работает быстрее многих аналогичных подходов и требует меньше данных.
🔵Устраняет визуальные артефакты и повышает реализм изображений.
🔵Поддерживает дообучение популярных моделей, включая FLUX.
🔵Снижает риск «reward hacking» и переусиления отдельных визуальных признаков.
🔵Позволяет менять стиль генерации через промпты.


📱 Репозиторий

➡️Справочник Программиста. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2❤‍🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
💻 tkforge — это инструмент для создания базовых графических интерфейсов на Python с помощью библиотеки tkinter.

Предназначен для быстрого прототипирования и упрощает процесс создания окон и виджетов.

📌 Основные особенности:
🔵Автоматизация создания GUI
🔵Быстрое прототипирование интерфейсов
🔵Упрощённое добавление виджетов
🔵Минималистичный синтаксис
🔵Создание окон и элементов управления
🔵Управление компоновкой элементов
🔵Обработка событий и callback-функции
🔵Поддержка различных типов виджетов (кнопки, поля ввода, метки и др.)


📱 Репозиторий

➡️Справочник Программиста. Подписаться
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥2🔥2👍1