Машинное обучение RU
17.7K subscribers
1.57K photos
207 videos
11 files
2.04K links
Все о машинном обучении

админ - @workakkk

@data_analysis_ml - анализ даннных

@ai_machinelearning_big_data - Machine learning

@itchannels_telegram -лучшие ит-каналы

@pythonl - Python

@pythonlbooks- python 📚

@datascienceiot - 📚

РКН: clck.ru/3FmrUw
Download Telegram
🔥 Scaling the Codebook Size of VQGAN to 100,000 with a Utilization Rate of 99%

Модель демонстрирует превосходную производительность в различных задачах, включая реконструкцию, классификацию и генерацию.

github: https://github.com/zh460045050/VQGAN-LC
abs: https://arxiv.org/abs/2406.11837

@machinelearning_ru
🔥5👍31
This media is not supported in your browser
VIEW IN TELEGRAM
🍏 На iOS 18 WhisperKit работает на 40% быстрее

Количество токенов на whisper-base увеличено с 165 до 237.

Репозиторий: https://github.com/argmaxinc/WhisperKit
Тест https://testflight.apple.com/join/LPVOyJZW

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍52🔥2
⚡️ ChatGLM: Семейство больших языковых моделей от GLM-130B до GLM4 Со всеми инструментами

GLM-4:
- практически не уступает GPT-4 в области MMLU, математики, GPQA и т.д
- приближается к GPT-4 при выполнениии задач с длинным контекстом

hf: https://huggingface.co/THUDM
repo: https://github.com/THUDM
abs: https://arxiv.org/abs/2406.12793

@machinelearning_ru
👍63🔥2
BigCodeBench, новый бенчмарк для оценки LLM по сложным задачам программирования, ориентированный на реалистичные задачи функционального уровня, требующие использования разнообразных библиотек и сложных рассуждений! 👀

🧩 Содержит 1140 заданий по 5,6 тестовых примеров в каждом, охватывающих 139 библиотек на Python.

Лучшая модель - GPT-4 с 61,1%, за ней следует DeepSeek-Coder-V2.

Лучшая открытая модель - DeepSeek-Coder-V2 с 59,7%, что лучше, чем у Claude 3 Opus или Gemini.

👥 Задачи создаются в три этапа, включая генерацию синтетических данных и перекрестную проверку людьми.

Блог: https://hf.co/blog/leaderboard-bigcodebench
Таблица лидеров: https://huggingface.co/spaces/bigcode/bigcodebench-leaderboard
Код: https://github.com/bigcode-project/bigcodebench

@machinelearning_ru
👍82🔥2
🔥 Mixture of Agents + конвейер FT: превосходят GPT-4, и в 25 раз меньше затрат!

Новая SOTA на - Arena-Hard (84.8) и Alpaca Eval (LC 68.4)

https://docs.openpipe.ai/features/mixture-of-agents

@machinelearning_ru
👍42🔥2
🌟 4K4DGen — панорамная 4D-генерация в разрешении 4K

4K4DGen демонстрирует возможность создания динамических сцен с 360-градусным обзором в разрешении 4K, обеспечивая полное погружение в VR.
Этот метод облегчает анимацию сцены и оптимизирует набор 4D-гауссианов с помощью эффективных техник сплэтчинга.

🟡 Страничка 4K4DGen
🟡 Arxiv

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍54🔥2
⚡️Лучший способ получать свежие обновлении и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

C#: t.me/csharp_ci
Машинное обучение: t.me/ai_machinelearning_big_data
АНАЛИЗ Данных: t.me/data_analysis_ml
Хакинг: t.me/linuxkalii
Linux: t.me/linuxacademiya
Базы данных: t.me/sqlhub
C++ t.me/cpluspluc
Golang: t.me/Golang_google
Java: t.me/javatg
React: t.me/react_tg
Javascript: t.me/javascriptv
Мобильная разработка: t.me/mobdevelop
Docker: t.me/+0WdB4uvOwCY0Mjdi
Python: t.me/pythonl
Rust: t.me/rust_code
PHP: t.me/phpshka
Android: t.me/android_its
Big Data: t.me/bigdatai
Devops: t.me/devOPSitsec
Собеседования МЛ: t.me/machinelearning_interview
Python подготовка с собесу: t.me/python_job_interview
МАТЕМАТИКА: t.me/data_math

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
C++ папка: https://t.me/addlist/CdBs5DLepLJmZjY6
C# папка: https://t.me/addlist/u15AMycxRMowZmRi
Java папка: https://t.me/addlist/ZM3J6oFNAnRlNWU6
FRONTEND папка: https://t.me/addlist/mzMMG3RPZhY2M2Iy
Linux папка: https://t.me/addlist/w4Doot-XBG4xNzYy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy
🔥4👍1🥰1
⚡️ 100 вопросов c собесов в Data Science и ML

Представляю вашему вниманию чек-лист из 100 вопросов по Data Science. Вопросы покрывают 5 областей: SQL, Python, Machine Learning, статистику и собственно саму DS.

Кому это вообще может быть полезно:

- желающему получить оффер в сфере DS
- тому, кто уже давно дата-сайнтист, но хочется освежить какие-то алгоритмы/темы
- кто хочет поменять стек на что-то в области анализа и - присматривается к DS

Читать
Видео

@machinelearning_ru
👍10🔥42
🔥 Руководство по разработке модели Responsible Foundation: обзор инструментов и ресурсов

Представляет собой постоянно растущую коллекцию из более чем 250 инструментов и ресурсов, охватывающих текстовые, визуальные и речевые аспекты

проект: https://fmcheatsheet.org
abs: https://arxiv.org/abs/2406.16746

@machinelearning_ru
👍32🔥1
⚡️ Почитать о том, как файн-тюниный Mistral-7B + RAG может превзойти Claude 3 Opus и GPT-4o в некоторых популярных бенчмарках для генерации кода!

Повышение точности до 19%, увелеченеи скоросиь в 3,7 раза и снижаем затраты в 150 раз.

https://together.ai/blog/rag-fine-tuning

@machinelearning_ru
👍92👎1🔥1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Nvidia представляет L4 GM!

Масштабную 4D-модель реконструкции, которая может превратить видео с одного просмотра в анимированный 3D-объект.

https://research.nvidia.com/labs/toronto-ai/l4gm

@machinelearning_ru
👍102🔥2😁1
⚡️ Как переводить экран любого приложения на русский двойным тапом

Читаем короткую статью на Хабре и настраиваем перевод.

▪️ Читать

@machinelearning_ru
👍63
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 AuraSR- это модлеь с открытым исходным
кодом для апскейлинга, с помощью GigaGAN от Adobe.

🤏 Параметры 600 М
⭐️ Отлично подходит для придания резкости и мелких деталей изображениям

▶️ https://huggingface.co/spaces/gokaygokay/AuraSR

@machinelearning_ru
👍10👎21🔥1
⚡️ Nvidia учит модели diffusion считать!

Count Gen может генерировать правильное количество объектов, указанное в подсказке ввода, сохраaняя при этом естественный формат, соответствующий подсказке.

GIthub: https://github.com/Litalby1/make-it-count
Project: https://make-it-count-paper.github.io/

@machinelearning_ru
6🔥3👍2
⚡️ Гайд в которой показано, как создать чат-бота с помощью Gemma 2 9B

Здесь используется Keras 3, работает на любом сервере - JAX, PyTorch, TensorFlow. Лично рекомендую JAX для обеспечения лучшей производительности.

https://colab.research.google.com/github/google-gemini/gemma-cookbook/blob/main/Gemma/Keras_Gemma_2_Quickstart_Chat.ipynb

@machinelearning_ru
👍82🔥2
⚡️ LLaRA: Увеличение объема данных для обучения роботов

Эффективность SotA в задачах манипулирования роботами превосходит подход, аналогичный RT-2

репозиторий: https://github.com/LostXine/LLaRA
abs: https://arxiv.org/abs/2406.20095

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 local-gemma — простая библиотека и CLI для запуска Gemma-2 локально; можно использовать CUDA, MPS или CPU

pip install local-gemma"[cpu]"

local-gemma предоставляет простой и быстрый способ локального запуска Gemma-2 прямо из терминала (или можно использовать в коде как обычную библиотеку).
local-gemma построена на основе библиотек Transformers и bitsandbytes.

🖥 GitHub

@machinelearning_ru
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5👍1🥰1🤔1
erid: LjN8KWxB8

Проверь свой модный уровень! Разгадай все фэшн-термины и получи подарок 🎁

Кофта с капюшоном или худи? Ботинки с дырками или броги? Если вы ищете вещи на Lamoda, необязательно знать все модные названия. Нейропоиск на платформе сделает все за вас: поймет контекст и предложит максимальное число вариантов. Даже если бренды называют вещь не так, как вы привыкли.

Но задумывались ли вы над тем, как правильно называются вещи на фэшн-языке?

Предлагаем проверить знания и выяснить, получится ли из вас модный инфлюенсер! Пройдите тест и угадайте все названия. А после участвуйте в розыгрыше сертификата от Lamoda Tech.

Для этого нужно подписаться на наш канал и поделиться результатом теста под постом с розыгрышем.

8 июля мы рандомно выберем трех счастливчиков и подарим им по сертификату на 10 000 рублей, чтобы лето стало еще более стильным 💃

➡️ Вперед за подарком!
👍4👎1
Storm-7B🌪️

Эта модель обеспечивает выигрыш в 50,5% по сравнению с GPT-4 Preview, что делает ее первой моделью с открытым исходным кодом, которая соответствует GPT-4 Preview в AlpacaEval 2.0.

📄https://arxiv.org/pdf/2406.11817
🤗https://huggingface.co/jieliu/Storm-7B

@machinelearning_ru
👍53🔥1