Machinelearning

🌟

Jina-embeddings-v5-omni: новое семейство универсальных эмбеддингов

Jina AI представила новое поколение эмбеддинг-моделей. Фишка релиза - в полной мультимодальности: архитектура способна кодировать текстовую, визуальную, звуковую и видеоинформацию в единое векторное пространство.

В отличие от разрозненных решений для каждого формата данных, унифицированный подход v5-omni сильно упрощает создание сложных систем поиска и RAG-приложений.

Новинка позволяет извлекать прямые смысловые связи между аудиовизуальным контентом и текстовыми запросами из коробки, не прибегая к дополнительным процессам промежуточного распознавания или транскрибации.

Линейка представлена в 2-мя вариантами: Small на 2 млрд параметров и Nano на 0,9 млрд.

Обе версии выложены на HuggingFace и доступны через облачный API компании.

Модель также интегрирована в среду Elasticsearch, её можно быстро и удобно развернуть с помощью встроенного сервиса Elastic Inference Service.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍107🤩95🎉34❤21🔥4💯1

18.3K views11:15

Machinelearning

Увидимся на Дне открытых дверей магистерской программы «Исследования и предпринимательство в ИИ» ФКН НИУ ВШЭ и МТС? 👀

22 мая расскажут, как учат создавать и внедрять инновационные продукты, используя передовые методы: от больших языковых моделей и генеративных нейросетей до инструментов компьютерного зрения и NLP. Будет актуально для тех, кто задумывается о поступлении в магистратуру в 2026

Самое важное:
✅ 100% стоимости обучения (30 мест) финансирует МТС
✅ проекты реализуются на виртуальной инфраструктуре компании
✅ преподаватели — команда преподавателей ФКН НИУ ВШЭ и действующие эксперты из МТС и MWS AI
✅ карьера после выпуска? Роль ML/AI-разработчика или специалиста по Data Science, собственный стартап в сфере ИИ или исследования в R&D-центрах коммерческих компаний

На встрече команда магистратуры:
— поделится деталями о программе, учебном плане и фокусах развития: исследовательском и предпринимательском
— обсудит особенности поступления в 2026 году и формат отбора
— расскажет о процессе обучения и результатах — в этом помогут сами студенты и выпускники

📍 Когда: 22 мая, 18:30
📍 Формат: онлайн
📍 Запись встречи: разместят в канале магистратуры

Чтобы не пропустить трансляцию и задать все вопросы, зарегистрируйтесь на сайте!

👍33👏7🤩7❤4😁3🔥2

17K views15:04

Machinelearning

Qwen3.7 уже залетел на Arena😻

Версии
• Qwen3.7-Max-Preview
• Qwen3.7-Plus-Preview

Это пока preview-версии, вот их результаты:

- #6 на Text
- #5 в Vision

Ждём полноценный релиз.

Изначально ожидалось, что её анонсируют и запустят на Alibaba Cloud Summit 20 мая, но, похоже, команда Alibaba Qwen просто не смогла ждать ивент!

chat.qwen.ai

@ai_machinelearning_big_data

🎉126👍94❤44🤩18🔥16👏15😁6🥱2🥰1👌1💘1

20.3K views16:02

Machinelearning

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

Доигрался

😁97❤19🔥11👍6💯1🤗1

17.3K viewsedited 18:05

Machinelearning

⚡️

Cursor выпустил Composer 2.5 - свою самую мощную модель.

Главное:
- умнее в рассуждениях и работе с кодом
- заметно выносливее на длинных задачах: рефакторинги, миграции, многочасовые агентские прогоны больше не разваливаются на полпути
- строже следует сложным инструкциям - держит рамки, ограничения и стиль проекта.

Cursor сообщает, что вместе с SpaceXAI обучает с нуля гораздо более крупную модель - задействовано в 10 раз больше совокупных вычислительных мощностей и миллион эквивалентов H100 из кластера Colossus 2.

Бонус: всю неделю включённые лимиты модели удвоены - самое время обкатать на своих задачах.

https://cursor.com/blog/composer-2-5

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥100❤20👍19🎉16🤣11👏6👌2

18.5K views18:16

✔️

OpenAI и Dell стали партнерами

Компании будут совместно адаптировать Codex для работы в гибридных и on-premise инфраструктурах. Модели OpenAI интегрируют напрямую с платформами Dell AI Data Platform и Dell AI Factory.

Решение позволяет корпоративным клиентам развертывать ИИ в локальном контуре с базами данных, закрытыми репозиториями и внутренней документацией без необходимости передачи конфиденциальной информации на сторонние серверы.

Целевой сценарий интеграции - разработка автономных ИИ-агентов. Локальный запуск даст агентам прямой доступ к корпоративному контексту для автоматизации бизнес-процессов, работы с системами учета и генерации отчетов.
openai.com

✔️

Илон Маск проиграл суд против Сэма Альтмана и OpenAI

Суд присяжных в Калифорнии отклонил иск Илона Маска к OpenAI, Сэму Альтману, Грегу Брокману и Microsoft. Причиной стало истечение сроков давности.

Маск обвинял бывших коллег в мошенничестве и отказе от изначальной некоммерческой миссии. По его версии, руководство незаконно перевело OpenAI в статус коммерческого предприятия, использовав его стартовые пожертвования в размере $38 млн.

Защита OpenAI настаивала, что процесс инициирован для замедления конкурента на фоне развития проекта Маска xAI. Юристы компании заявили, что истец изначально осознавал необходимость привлечения капитала и партнерств уровня Microsoft для масштабирования архитектуры и закупки вычислительных мощностей.
businessinsider.com

✔️

Anthropic покупает стартап Stainless

Anthropic приобрела стартап Stainless, автоматизирующий генерацию SDK. Цель сделки - упростить разработку коннекторов и серверов MCP для интеграции Claude с корпоративным инструментарием.

Компании сотрудничают с 2022 года: инфраструктура Stainless применялась для сборки официальных SDK API Claude. Платформа стартапа конвертирует спецификации API в готовые библиотеки и CLI-утилиты для TypeScript, Python, Go, Java и Kotlin.

Технологии стартапа позволят сторонним разработчикам автоматизировать создание MCP-серверов для подключения ИИ-моделей к внутренним базам данных и запуска автономных агентов. Команда Stainless перейдет в Anthropic.
anthropic.com

✔️

GitHub выпустил десктопное приложение Copilot

Решение работает отдельно от IDE и переводит взаимодействие с ИИ из диалогового окна в параллельные рабочие процессы. В интерфейсе можно запускать несколько агентов одновременно.

Для каждой задачи Copilot автоматически разворачивает изолированные Git-worktrees и ветки. Разработчик может поручить одному агенту фоновое исправление CI, а другому написание фичи, не прерывая работу в локальном репозитории.

Для работы с PR добавлен механизм Agent Merge. Агенты самостоятельно обрабатывают комментарии после код-ревью, исправляют упавшие тесты и сливают ветки при выполнении заданных условий. Также приложение получило поддержку стандарта MCP.

Десктопный Copilot доступен по списку ожидания. На тарифах Business и Enterprise новинка доступна после корпоративной авторизации.
github.com

✔️

Из FAIR ушёл ключевой сотрудник по видеогенерации

Исследователь подразделения FAIR Эндрю Браун перешел в стартап AMI Labs для разработки моделей мира - систем, обучающихся законам физики и причинно-следственным связям реального мира. У Цукерберга Браун провел 3 года. Он занимался моделями генерации видео, выступил соавтором архитектуры Emu Video и контрибьютором комплекса Movie Gen.

Фаундеры AMI Labs - суперзвезды ИИ-сцены Ян Лекун и Се Сайнин (самый цитируемый учёный в области генеративного ИИ и CV, соавтор архитектуры Diffusion Transformers).
Andrew Brown в сети Х

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤24🔥24👏11👍4🤔1

14.2K views06:51

Machinelearning

Приглашаем на GenAI MeetUp — hh.ru х Lamoda Tech

Если вы LLM-инженер или ML-специалист, работаете с генеративным AI, приходите обсудить разработку агентов, применение моделей и оценку их качества.

🧬 В программе разбор кейсов, интерактивы с призами, нетворкинг и угощения.

Спикеры и доклады:

▪️ Коля Безносов, Руководитель направления AI Lab, hh.ru
Рекрутер, который не спит: как мы автоматизировали первичный контакт с соискателями с помощью ИИ

▪️Данил Дмитриев, Senior Data Scientist, Lamoda Tech
Контролируемый агент поддержки: как мы превратили обратную связь из прода в роадмап

▪️Женя Орлов, Руководитель команды разработки AI Lab, hh.ru
Нейроразбор резюме: практический опыт и нюансы создания LLM-судей

▪️Дима Курганский, Teamlead MLOps, Lamoda Tech
Как мы строим GenAI-платформу в Lamoda: от MVP к production-решениям

🗓 28 мая, сбор 18:30, начало 19:00
🔗 Очно и онлайн
📍 Офис hh.ru

🔥 ЗАРЕГИСТРИРОВАТЬСЯ

Количество очных мест ограничено.

Реклама. ООО "ЛАМОДА ТЕХ". ИНН 7734461512. erid: 2W5zFHW2tg9

1🎉29👍8👏7😁6❤5😍1

14K views09:04

Machinelearning

📌

Сколько стоит построить ИИ-ЦОД мощностью 1 ГВт?

Epoch AI опубликовала модельную оценку полной стоимости владения типовым дата-центром для искусственного интеллекта мощностью один гигаватт.

По расчётам, такой объект потребует около $38 млрд первоначальных капитальных вложений и $900 млн операционных расходов в год.

Если капитальные затраты распределить на срок службы оборудования, совокупная стоимость владения составляет примерно $8,5 млрд в год.

Около 60% этой суммы (порядка $5 млрд) приходится на серверы. Расходы на их фоне невелики: даже электроэнергия, крупнейшая операционная статья, по оценке обойдется в $600 млн в год.

Авторы оговариваются, что это упрощённая финмодель, а не оценка конкретного объекта.

Расчёт описывает гипотетический ЦОД крупного американского оператора облачной инфраструктуры на оборудовании NVIDIA GB200 NVL72.

Реальные издержки могут заметно отличаться в зависимости от выбора серверов, проектирования, расположения, схемы финансирования и стратегии энергоснабжения.

Главная неопределённость расчётов связана со сроком службы IT-оборудования.

Базовый сценарий исходит из 5 лет для серверов и сетевой инфраструктуры и 14 лет для здания. При сроке в 3 года годовая стоимость владения возрастает примерно до $12–13 млрд, при 7 - снижается до $7 млрд.

Оценка опирается на статистику государственного энергорегулятора США, показатели энергоэффективности Lawrence Berkeley Lab, стоимость серверов по выкладкам SemiAnalysis, строительные индексы Turner & Townsend и ряд других источников.

Модель предполагает полное питание от энергосети и не учитывает собственную генерацию, налоговые льготы оценены приблизительно.

Обновлённый расчёт даёт стоимость владения $8,5 млн на мегаватт в год против прежних $10,8 млн.

Снижение авторы объясняют переходом на новое оборудование и пересмотром части исходных данных.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤74🤔64🤓26👏17🔥5👍3🌚2

13.9K views10:05

Machinelearning

Forwarded from C++ Academy

1:48

Media is too big

VIEW IN TELEGRAM

🖥

Создатель C++ разнёс вайбкодинг: “сеньоры не хотят разгребать этот мусор”

Бьёрн Страуструп, легендарный создатель C++, в новом двухчасовом интервью резко прошёлся по вайбкодингу.

Главная претензия простая: сгенерированный код пока слишком часто выглядит красиво только на демке. В реальном проекте он приносит баги, раздувает кодовую базу, плодит уязвимости и плохо поддаётся нормальной проверке.

Особенно больно это бьёт по опытным разработчикам. Им потом приходится не “магически ускоряться с ИИ”, а читать, чинить и переписывать слоп, который кто-то нагенерировал за пять минут.

Похожая история уже достала и Линуса Торвальдса. Его буквально завалили кривыми AI-отчётами по ядру Linux: вроде бы люди “помогают”, а на практике создают шум, который мешает настоящей разработке.

Сеньоры не боятся ИИ.
Они просто не хотят провести остаток карьеры, разгребая чужой промптованный мусор.

https://www.youtube.com/watch?v=U46fJ2bJ-co

@cpluspluc

Please open Telegram to view this post

VIEW IN TELEGRAM

👍106🤬48😁32🤔20🤨13❤11😢11💯7🤣7🔥3👌1

12.7K views12:00

Machinelearning

🌟

Alice AI ART получила обновление с фокусом на генерацию русского текста

Яндекс выпустил новую версию своей визуально-генеративной модели - точность воспроизведения кириллического текста при использовании приемов промптинга выросла в 3 раза относительно предыдущей версии.

Диффузионные модели плохо справляются с текстом, в процессе генерации буквы для них ничем не отличаются от любой другой текстуры, нет встроенного представления о символах как о дискретных единицах со стабильной формой. С кириллицей ситуация усугубляется дисбалансом обучающих данных: в открытых датасетах её доля минимальна, а доступные примеры с русским текстом в большинстве низкого качества - их прямое добавление в претрейн просаживает эстетику и общее качество генерации.

🟡

Технические изменения

🟠 Собственный датасет пар «изображение - текст» с разметкой глифов: 30 млн примеров в претрейн и около 100 тыс. в файнтюн, отобранных по качеству и визуальной эстетике. Ключевой фокус - на разнообразии символов и токенов, без этого модель хорошо писала бы только частотные буквы.

🟠 Переход с UNet на Diffusion Transformer - трансформерная архитектура лучше работает с пространственными связями между удалёнными участками картинки, что критично для длинных надписей.

🟠 Замена текстового энкодера на LLM для более точного понимания семантики и контекста запроса.

🟠 Обучение на русскоязычных промптах вместо схемы с переводом с английского.

🟡

Результаты внутренних замеров

🟢 Кириллический текст - фразы 7–9 слов корректно генерируются в большинстве случаев (предыдущая версия с ними практически не справлялась)

🟢 Общее качество — доля генераций без визуальных искажений выросла на треть

🟢 Локальная айдентика - 85% корректных генераций, на уровне топовых индустриальных решений

По доле успешных генераций кириллического текста Alice AI ART показывает лучшие результаты среди российских моделей. Команда также рекомендует приёмы промптинга для получения заявленного роста качества генерации — заключать текст в кавычки, сложные слова писать заглавными, длинные фразы разбивать на части с явным указанием расположения.

https://admin.kod.ru/alisa-ai-russkiy-tekst-na-kartinkah-prompty/

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

👍32🎉29🤣13👏12❤8😍3

12.3K views12:15

Machinelearning

Orion soft запускает Сезон ИИ-инфры

Чтобы ИИ приносил конкретные результаты, важно понимать ограничения своей ИТ-инфраструктуры. Спецпроект российского разработчика ПО поможет пройти практический путь к ИИ: от первичной оценки готовности инфраструктуры — до конкретных решений и рекомендаций экспертов, которые внедряют ИИ в продакшн.

Вы можете выбрать любую из следующих активностей или все:

Чек-лист готовности инфраструктуры к ИИ
• определите свой уровень инфраструктуры
• получите подробные рекомендации по каждому из этапов

Серия вебинаров
• как стартовать ИИ без типовых ошибок
• где считать экономику
• архитектура production-ИИ
• реальная стоимость «своей платформы»

Персональный аудит
• разбор вашей инфраструктуры с экспертами Orion soft
• рекомендации под конкретные AI/ML-сценарии
• практические шаги внедрения

Подробнее

#ai #ml

❤7👍7🔥4❤‍🔥1😁1🌭1

12.9K views13:20

Machinelearning

0:27

This media is not supported in your browser

VIEW IN TELEGRAM

✔️

Black Forest Labs запустила MCP-сервер

Сервер доступен по адресу mcp.bfl.ai и позволяет создавать и редактировать изображения в чат-клиентах, поддерживающих этот протокол. Заявлена совместимость с Claude, Cursor, Codex, Windsurf и другими MCP-клиентами.

MCP-сервер предоставляет несколько инструментов: генерацию до 8 изображений параллельно, создание вариаций на основе предыдущего результата, просмотр истории запросов и проверку остатка средств на счёте.

Нужную модель клиент выбирает автоматически в зависимости от запроса. Доступно несколько моделей линейки FLUX.2: от быстрой Klein до топовой Мax. По умолчанию используется Flux2 Pro.

Оплата, согласно документации, производится напрямую BFL: счёт выставляется той организации, которая была выбрана при авторизации.

Актуальные тарифы - на странице bfl.ai/pricing.

@ai_machinelearning_big_data

#news #ai #ml

Please open Telegram to view this post

VIEW IN TELEGRAM

❤15👍12🔥4😁3❤‍🔥1

13.6K views14:25

Machinelearning

1:27

This media is not supported in your browser

VIEW IN TELEGRAM

Бывший CEO Google Эрик Шмидт выступил на выпускной церемонии Университета Аризоны с речью про ИИ.

Когда он сказал:

Вам не обязательно интересоваться ИИ. Какую бы карьеру вы ни выбрали, ИИ всё равно будет ее частью.

И зал раздался свистом.

Студенты воспринимают это так:

Вам придётся конкурировать с машинами за вашу первую работу.

Но с другой стороны, они находятся в лучшей позиции, чем предшественники и могут использовать мощные ИИ-инструменты уже на самом старте своей карьеры.

@ai_machinelearning_big_data

🤔77❤63💯18👨‍💻15👍11👏8🔥5😁5🗿4🌚3❤‍🔥1

12.8K viewsedited 15:11

Machinelearning

Forwarded from Анализ данных (Data analysis)

Андрей Карпаты перешёл в Anthropic

Один из самых известных людей в индустрии - сооснователь OpenAI, бывший директор по ИИ в Tesla, автор легендарных лекций по нейросетям - официально объявил о переходе в Anthropic.

В твите он написал, что ближайшие несколько лет на фронтире LLM будут особенно формирующими, и он рад вернуться к R&D в команде Anthropic. Образовательные проекты, включая Eureka Labs, обещает не бросать и вернуться к ним позже.

Карпаты последние пару лет фактически был «свободным агентом» - выпускал собственные туториалы, строил Eureka Labs, считался одной из самых независимых фигур в ИИ.

Его выбор в пользу Anthropic, а не OpenAI, xAI или Google, многое говорит о том, где сейчас концентрируется самая интересная исследовательская работа.
С учётом недавнего policy paper Anthropic про 2028 год и фронтирные модели - у компании явно идёт серьёзная фаза найма под большие задачи.

https://x.com/karpathy/status/2056753169888334312

@data_analysis_ml

🔥105🤩60❤31👍24🎉20👏13🤣7😁4❤‍🔥3🤔3😭2

12.8K views15:29

Machinelearning

0:54

This media is not supported in your browser

VIEW IN TELEGRAM

Google выкатили сразу два больших релиза: Gemini Omni и Gemini 3.5 Flash

Похоже, Google снова пытается перехватить повестку в ИИ.

Первый релиз - Gemini Omni. Это семейство мультимодальных моделей, которые работают почти со всем сразу: текстом, кодом, изображениями, видео и даже виртуальными мирами.

Модель может принимать разные типы контента и не просто «понимать» их, а редактировать, дополнять и превращать в новые форматы:

- добавить эффекты в видео со смартфона
- сделать картину из грубого наброска
- собрать образовательный подкаст по фото
- работать с кодом, текстом, визуалом и видео в одном контексте

Первая модель семейства - Gemini Omni Flash - должна стать доступна уже сегодня.

Второй релиз - Gemini 3.5 Flash.

Google называет её своей самой сильной моделью для агентов и кодинга. Главное отличие - не просто быстрые ответы, а способность планировать работу по большим кодовым базам, рассуждать на длинной дистанции и запускать subagents параллельно.

По словам Google DeepMind, Gemini 3.5 Flash обходит 3.1 Pro на agentic и coding-бенчмарках вроде Terminal-Bench 2.1, GDPval-AA и MCP Atlas, при этом стоит заметно дешевле фронтирных моделей.

Если коротко:

- Gemini Omni - модель для всего: текст, код, картинки, видео, миры
- Gemini 3.5 Flash - ставка на агентов, кодинг и работу с большими проектами

Ещё выкатили Antigravity 2.0 - инструмент для создания и оркстрации множества ИИ-агентов.

Интересно, насколько хорошо модель будет работать как исполнитель: в IDE, браузере, видео, агентных workflow и реальных продуктах.

Релиз https://x.com/GoogleDeepMind/status/2056786446636212467

Попробовать: https://gemini.google.com/app

👍82🔥37❤14👏6🤩3💯2🤔1🤣1

11.8K views17:31

About

Blog

Apps

Platform