Машинное обучение RU

VINS-120K - полезный датасет для следующего этапа image editing моделей: редактирование изображений в 4K+ без развала мелких деталей.

Сейчас многие модели неплохо правят обычные картинки, но на сверхвысоком разрешении быстро всплывают проблемы: текстуры мажутся, локальные правки портят соседние области, а результат выглядит хорошо только после уменьшения. Для реального продакшена этого мало.

VINS-120K закрывает именно этот разрыв. В датасете 120 тысяч троек: инструкция, исходное изображение и отредактированная версия. Все изображения выше 4K, данные собраны из реальных видео высокого разрешения и качественных открытых источников, затем отфильтрованы по визуальному качеству, соответствию инструкции и эстетике.

Покрытие тоже широкое: 13 типов редактирования в 4 категориях - локальные правки, глобальные изменения, движение камеры и персонализированная генерация.

Paper: https://modelscope.ai/papers/2605.23518
Dataset: https://modelscope.cn/datasets/vivo/VINS-120K

❤2👍2

1.6K views11:00

Forwarded from Machinelearning

⚡️

Сэм Альтман подтвердил возвращение OpenAI к разработке воплощенного ИИ

Проект вырос из исследований по симуляции физического мира, к которым присоединилась команда видеогенератора Sora.

На начальном этапе компания сосредоточится на разработке специализированных машин для помощи в строительстве инфраструктуры.

Конечная цель проекта - обеспечить каждого человека персональным роботом, способным выполнять любые бытовые и рабочие поручения.

В 2020 году компания закрыла предыдущие проекты в робототехнике из-за дефицита обучающих данных.

Для перезапуска направления OpenAI открыла наем инженеров по аппаратному обеспечению, системной интеграции и ML.

Возвращение связано с развитием воплощенного ИИ: взаимодействие алгоритмов с физической средой позволит собрать массивы данных, необходимых для обучения AGI.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥3❤1👎1🎉1

1.47K views12:55

Машинное обучение RU

🚀 Упрощение разработки с GSD Redux

GSD Redux — это легковесная система для метапромптинга и управления контекстом, помогающая разработчикам эффективно работать с AI. Она решает проблему деградации качества контекста, позволяя создавать четкие спецификации и контролировать процесс разработки.

🚀 Основные моменты:
- Легкая интеграция с различными AI-платформами.
- Поддержка автоматизации разработки и управления проектами.
- Обеспечивает безопасность и прозрачность через аудит.
- Подходит для индивидуальных разработчиков и небольших команд.

📌 GitHub: https://github.com/open-gsd/get-shit-done-redux

#javascript

1.71K views14:04

Машинное обучение RU

🚀 GPU-библиотека для классического машинного обучения

FlashLib предлагает высокопроизводительные реализации операторов машинного обучения, таких как kmeans, PCA и DBSCAN, с использованием Triton и CuteDSL. Библиотека позволяет эффективно обрабатывать данные на GPU, обеспечивая простоту использования и высокую скорость выполнения.

🚀Основные моменты:
- Поддержка 15 высокоуровневых примитивов для машинного обучения.
- Информативный API для оценки производительности операций.
- Оптимизированные реализации для кластеризации, регрессии и декомпозиции.
- Легкая интеграция с PyTorch и sklearn.

📌 GitHub: https://github.com/FlashML-org/flashlib

#python

👍6

1.58K views13:10

Машинное обучение RU

Liquid AI выпустили две компактные модели под японский язык: речевую LFM2.5-Audio-1.5B-JP и языковую LFM2.5-1.2B-JP-202606.

Самое интересное здесь - речевая модель. LFM2.5-Audio-1.5B-JP умеет принимать японскую речь и отвечать японской речью напрямую. Это не связка из ASR + LLM + TTS, а единая end-to-end модель для полного речевого цикла.

Что заявляют по LFM2.5-Audio-1.5B-JP:

- 1.5B параметров
- первая японская speech-to-speech модель Liquid AI
- превосходит J-Moshi примерно на 77B параметров
- показывает уровень, близкий к Qwen2.5-Omni-3B
- подходит как базовая модель для дальнейшего дообучения

Вторая модель - LFM2.5-1.2B-JP-202606, обновлённая японская LLM на 1.2B параметров. Предыдущая версия уже обходила Qwen3-1.7B и Llama 3.2 1B на JMMLU, M-IFEval и GSM8K. В новой версии улучшили смесь японских данных, промежуточное обучение и пост-тренинг.

https://huggingface.co/LiquidAI/LFM2.5-Audio-1.5B-JP

https://huggingface.co/LiquidAI/LFM2.5-1.2B-JP-202606

❤7👍4

1.41K views13:05

Машинное обучение RU

Rust теперь можно компилировать в JVM bytecode.

rustc_codegen_jvm - экспериментальный backend для компилятора Rust, который берёт Rust MIR и превращает его в .class файлы, а затем собирает runnable .jar под JVM 8+.

Что уже заявлено:

- генерация исполняемого .jar
- поддержка базового core
- if/else, match, for, while, loop
- structs, tuples, arrays, slices, enums
- traits, closures, dynamic dispatch
- function pointers, recursion, generics
- часть unsafe, включая unions
- оптимизации вроде constant folding, propagation и dead code elimination

Пайплайн выглядит так:

Rust frontend → MIR → OOMIR → JVM classfile → R8 → .jar

https://github.com/IntegralPilot/rustc_codegen_jvm

❤2👍1

1.39K views14:41

Машинное обучение RU

Forwarded from Machinelearning

3:21

Media is too big

VIEW IN TELEGRAM

✔️

OpenAI переделает ChatGPT в суперприложение

В ближайшие недели компания проведёт первый крупный редизайн ChatGPT с 2022 года. Сервис трансформируется из диалогового чат-бота в платформу автономных агентов.

Обновлённый интерфейс интегрирует партнёрские сервисы для самостоятельного выполнения многошаговых задач без дополнительных промптов и переключения между приложениями.

Смена курса обусловлена низкой рентабельностью чат-бота. Перед IPO OpenAI смещает фокус на B2B-сегмент и реструктуризирует продуктовые команды. Бизнес-модель переориентируется на корпоративных клиентов со стабильной монетизацией по аналогии со стратегией Anthropic.
ft.com

✔️

Инженер из аппаратного подразделения OpenAI перешёл в Anthropic

Anthropic наняла бывшего инженера OpenAI Клайва Чана для разработки собственных ИИ-чипов. До этого у компании не было профильного аппаратного подразделения.

В OpenAI Чан проектировал кастомный кремний и участвовал в партнёрстве с Broadcom. До этого он разрабатывал чипы для обучения ML-моделей в Tesla Autopilot, где отвечал за архитектуру дата-центров и энергоэффективные вычисления.

Найм Чана должен помочь Anthropic сформировать команду аппаратных инженеров. Переход на собственное железо планируется для снижения себестоимости вычислений и повышения маржинальности.
Clive Chan в сети Х

✔️

TSMC испытывает дефицит производственных мощностей

Google заказала у Intel производство более 3 млн TPU на 2028 год. Nvidia пока не заключила контракт, но тестирует техпроцессы Intel для будущей GPU-архитектуры Feynman. Причина переноса заказов - из-за нехватки производственных линий у TSMC.

Глава TSMC подтвердил, что индустрия не сможет покрыть спрос на ИИ-чипы в ближайшие несколько лет. Дефицит позволил Intel привлечь новых клиентов на фоне прошлых финансовых убытков и срывов дедлайнов.

Параллельно SK Hynix проверяет совместимость своей памяти с новыми технологиями упаковки Intel.
theinformation.com

✔️

Sakana AI займётся алгоритмической эволюцией ИИ

Японский стартап открыл исследовательскую лабораторию рекурсивного самосовершенствования (RSI). Цель - создание сетей, которые итеративно переписывают, тестируют и оптимизируют собственный код.

Компания рассчитывает, что алгоритмическая эволюция позволит отказаться от парадигмы масштабирования вычислений.

В портфеле стартапа уже есть система LLM-Squared, где одни LLM создают алгоритмы обучения для других, и платформа AI Scientist, автоматизирующая научные исследования.

Следующий этап дорожной карты Sakana AI - разработка автономных агентов, способных улучшать свою архитектуру без участия человека.
sakana.ai

✔️

Динамический биллинг лишил 74% бизнеса контроля над ИИ-бюджетами

По данным неопубликованного отчета KPMG, только 26% компаний полностью контролируют свои расходы на ИИ. 50% ведут ограниченный мониторинг, а 22% узнают о затратах постфактум из выставленных счетов. Причина - неготовность финансовых отделов к токенизированному биллингу и динамическому ценообразованию.

Из-за непрогнозируемой нагрузки потребление ресурсов в отдельных проектах возрастает до 6 раз. Это приводит к исчерпанию годовых бюджетов на облачные вычисления и API за несколько месяцев. По итогам текущего квартала ожидается пересмотр расходов после получения бизнесом реальных счетов от ИИ-провайдеров.

Текущую ситуацию сравнивают с закупками облачных мощностей во время пандемии, за которыми последовало сокращение инфраструктурных бюджетов.
wsj.com

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2

571 views15:42

Машинное обучение RU

WSJ пишет, что OpenAI сделала первый официальный шаг к IPO.

Компания конфиденциально подала черновые документы для выхода на биржу.

Конфиденциальная форма S-1 позволяет OpenAI начать проверку в SEC, не раскрывая сразу выручку, убытки, структуру клиентов, расходы на вычисления и зарплаты руководителей. Так компания может готовиться к листингу, сохраняя чувствительные цифры закрытыми.

На прошлой неделе Anthropic уже подала свои конфиденциальные документы для IPO. Поэтому это больше не только гонка моделей, а ещё и гонка капитала между лабораториями, которым нужно финансировать следующее поколение ИИ-инфраструктуры.

wsj.com/tech/ai/openai-kicks-off-ipo-process-in-test-of-investor-appetite-for-top-ai-labs-eb7bebe1

👍1

817 views16:02

Машинное обучение RU

20 июня – Летняя школа ШЕН Центрального университета

Хочешь узнать, как применять математику, код и машинное обучение в биологии и медицине, но не понимаешь, с чего начать?

Приглашаем на Летнюю школу программы «ИИ в биотехе» Школы естественных наук Центрального университета!

Программа реализуется совместно с инженерной школой и факультетом биоинженерии и биоинформатики МГУ, а также индустриальными партнёрами: Genotek и BIOCAD.

Что будет на Летней школе:
— Узнаешь, как ИИ меняет биотех: от анализа геномов до дизайна лекарств с помощью нейросетей;
— Послушаешь лекции от ведущих экспертов: Дмитрия Пензара, Александра Ракитько, Александра Надолинского и победителя конкурса «Биомолекула» Андрея Кузнецова;
— Познакомишься с магистерской программой «ИИ в биотехе»: направления подготовки, курсы, преподаватели, карьерные перспективы;
— Примешь участие в квестах и получишь шанс выиграть фаст-трек на грант до 75% от стоимости обучения.

Фаст-трек – это возможность поступить в магистратуру, минуя онлайн-контест: достаточно пройти собеседование и ревью анкеты.

Как попасть на Летнюю школу?
Регистрация по ссылке.
Отбор участников – до 15 июня. Результаты пришлём на почту.

Место проведения: кампус Центрального университета, м. Маяковская, ул. Гашека, 7

Ждём тебя на Летней школе «ИИ в биотехе»!

931 views16:10

Машинное обучение RU

Forwarded from Анализ данных (Data analysis)

Claude 5 Fable - кратко:

- почти на всех проверенных бенчмарках модель показывает уровень SOTA
- особенно сильна в разработке, работе со знаниями, vision-задачах и научных исследованиях
- чем длиннее и сложнее задача, тем сильнее Fable 5 отрывается от других моделей Claude
- модель эффективнее расходует токены, чем прошлые версии Claude
- Fable 5 удерживает фокус на задачах длиной в миллионы токенов и улучшает результат, используя собственные заметки

Fable 5 - это не просто «лучше бенчмарки». Она эффективнее, дольше работает без потери контекста, лучше управляет длинными задачами и даёт больше возможностей для сложных агентных сценариев.

GPT-5.6 уже близко.

Интересно, выпустит ли OpenAI свой аналог Mythos.

Во время раннего тестирования Stripe заявила, что Fable 5 сжала месяцы инженерной работы до нескольких дней. В Ruby-кодовой базе на 50 млн строк модель за один день провела миграцию по всему репозиторию - работу, которая вручную заняла бы у целой команды больше двух месяцев.

https://www.anthropic.com/news/claude-fable-5-mythos-5

❤5🔥2🥰1🤔1

869 views18:58

Машинное обучение RU

⚡️

Wasserstein Learning Theory: когда ИИ учится сравнивать не точки, а целые распределения

В машинном обучении всё чаще важен не один конкретный пример, а то, как устроены данные целиком.

Например, модель обучали на одном распределении картинок, текстов или действий, а в реальности она получает немного другие данные. Обычная метрика может сказать: “распределения отличаются”. Wasserstein-подход показывает глубже: насколько далеко одно распределение нужно “перенести”, чтобы оно стало похоже на другое.

Идея пришла из оптимального транспорта. Представьте две кучи песка: одна форма - это первое распределение, другая второе. Расстояние Вассерштейна считает минимальную работу, которую нужно сделать, чтобы переложить песок из первой формы во вторую.

Почему это важно для ML:

* помогает анализировать сдвиг данных
* полезно для domain adaptation
* даёт инструменты для устойчивого обучения
* применяется в генеративных моделях
* помогает изучать обобщение нейросетей
* используется в reinforcement learning

В отличие от KL-дивергенции, Wasserstein distance учитывает геометрию пространства. Поэтому два распределения могут отличаться не просто “сильно” или “слабо”, а с учётом того, где именно находятся эти различия.

На практике это важно там, где модель должна быть устойчивой: новые домены, шумные данные, генерация, перенос знаний, обучение агентов.

Wasserstein Learning Theory даёт более точный язык для современной ML-задачи: не просто подогнать модель под датасет, а понять, как она ведёт себя при изменении распределения данных.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2🔥1

538 views14:24

Машинное обучение RU

ИИ-блогеры после выхода Claude Fable 5

👍5😁5❤3

365 views15:35

About

Blog

Apps

Platform