332K subscribers
4.1K photos
748 videos
17 files
4.66K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
Создавай, обучай и внедряй LLM-проекты вместе с экспертами из Газпромбанка и X5 Tech🚀

Курс «LLM-инженер» — это практическая программа для ML-инженеров и разработчиков, которые хотят выйти за рамки экспериментов и научиться создавать рабочие системы на базе больших языковых моделей.

Создан GIGASCHOOL, совместно с крупнейшей магистратурой по искусственному интеллекту AI Talent Hab.
Ты научишься:
➡️использовать методы RLHF (включая DPO, PPO);
➡️настраивать модели с помощью fine-tuning, LoRA / QLoRA, PEFT;
➡️снижать ресурсоёмкость через квантование и дистилляцию;
➡️запускать и адаптировать open-source модели под реальные задачи с помощью vLLM;
➡️разрабатывать интеллектуальных агентов и мультиагентные системы на LangGraph;
➡️строить RAG-системы с векторными базами (FAISS) и отслеживать метрики качества через Langfuse.

Тебя будут обучать лиды и хеды ИИ-команд:
- Желтова Кристина, директор по разработке моделей в Газпромбанке;
- Потехин Александр, NLP Lead X5 Tech;
- Андреева Дарья, ML Engineer (NLP) X5 Tech.

▪️252 часа теории и практики;
▪️диплом о профессиональной подготовке;
▪️старт 15 октября|18 недель онлайна с заранее продуманными каникулами;
▪️35 117 ₽/мес (рассрочка);
▪️повышение цены — 25 сентября.

Смотри программу и регистрируйся по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣5112🔥9👍6🗿6🥱4
⚡️ Новая модель LFM2-2.6B - лидер в классе до 3B параметров.

Ключевые особенности:
- лёгкая и быстрая, всего 2.6B параметров
- построена на архитектуре v2 (short convs + group query attention)
- обучена на 10 трлн токенов, поддерживает контекст до 32k

LFM2-2.6B - компактная, но мощная моделька для широкого спектра задач.

🟠Blog post: https://liquid.ai/blog/introducing-lfm2-2-6b-redefining-efficiency-in-language-models
🟠HF: https://huggingface.co/LiquidAI/LFM2-2.6B
🟠Model Bundle on LEAP: https://leap.liquid.ai/models?model=lfm2-2.6b

@ai_machinelearning_big_data

#AI #LLM #LFM2 #OpenSourceAI #Multilingual
Please open Telegram to view this post
VIEW IN TELEGRAM
48👍18🔥10🥱2💘2👌1
Media is too big
VIEW IN TELEGRAM
✔️ Alibaba открыла исходный код модели Qwen3-VL.

Это vision-language модель, которая умеет управлять графическими интерфейсами, писать код, строить диаграммы в Draw.io по макетам и распознавать объекты в самых разных областях - от повседневной жизни до узкоспециализированных сфер. Среди ключевых возможностей: точное определение событий в видео продолжительностью до двух часов, расширение поддержки OCR с 19 до 32 языков с улучшением качества на редких символах и наклонном тексте, работа с контекстом длиной 256 тысяч токенов с возможностью увеличения до миллиона, а также высокая точность в задачах обнаружения рисков в реальных условиях.
HF

✔️ Google Research представил новую работу о моделях для временных рядов.

Исследователи показали, что foundation-модели могут обучаться в стиле few-shot, то есть адаптироваться к новой задаче прямо «на лету», без отдельного переобучения.

В основе подхода лежит TimesFM, расширенный методом in-context fine-tuning (TimesFM-ICF). Модель получает несколько примеров вместе с историей данных и учится делать прогнозы более точно. В экспериментах на 23 датасетах точность выросла на 6,8% по сравнению с базовой моделью, при этом качество оказалось сопоставимо с версиями, обученными специально под каждый набор данных.

Теперь модели временных рядов можно использовать как LLM: им достаточно нескольких примеров в контексте, чтобы подстроиться под задачу. Это открывает путь к более гибкому и простому применению таких систем в бизнесе, финансах, энергетике и других областях.
Google

✔️ Исследователи из MIT, OpenAI и Sakana AI предложили новый метод ASAL (Automated Search for Artificial Life), который автоматизирует поиск «искусственной жизни» с помощью foundation-моделей.

Главная идея в том, что вместо ручного конструирования симуляций теперь можно задавать цель в виде текста, а модель будет находить или создавать такие системы, где возникают жизнеподобные явления.

ASAL работает на разных субстратах - от классических Boids и Game of Life до Lenia, Particle Life и нейронных клеточных автоматов. В ходе экспериментов метод открыл новые формы поведения в Lenia и Boids, а также клеточные автоматы, способные демонстрировать открытое и сложное развитие, сравнимое с «Жизнью» Конвея.

Это открывает путь к ускоренному исследованию искусственной жизни и автоматическому открытию новых «жизнеподобных» систем, которые раньше приходилось искать вручную.

✔️ Еще Qwen представила свою новую флагманскую модель Qwen3-Max, сразу доступную без ограниченного превью. Линейка включает две версии: Qwen3-Max-Instruct, ориентированную на кодинг и агентные задачи, и Qwen3-Max-Thinking, оснащённую инструментальным использованием и «heavy mode» для сложных сценариев.

По результатам тестов Qwen3-Max выходит на уровень топовых моделей на таких бенчмарках, как SWE-Bench, Tau2-Bench, SuperGPQA, LiveCodeBench и AIME25. Модель построена на масштабном датасете и опирается на значительные вычислительные мощности как в предобучении, так и в RL.

Компания позиционирует Qwen3-Max как новый флагман и открывает доступ сразу на нескольких платформах: в Qwen Chat, через API Alibaba Cloud и в блоге разработчиков.
X

✔️ Отчёт Google DORA показал: 90% IT-специалистов уже используют ИИ в работе, что на 14% больше, чем год назад. В опросе участвовало почти 5 тысяч разработчиков, и в среднем они тратят около двух часов в день на взаимодействие с AI-инструментами.

Доверие остаётся ограниченным: 46% доверяют «отчасти», 23% — «немного», и только 20% - «сильно». Это объясняется частыми мелкими исправлениями после автогенерации. Влияние на качество кода оценивается сдержанно: 31% видят лёгкое улучшение, 30% — «без изменений». Зато ощутим рост скорости за счёт снижения рутины.

На рынке труда обстановка сложнее: вакансии для новичков сократились на 71% с 2022 года, а кандидаты подают сотни заявок, прежде чем получить работу.
Report

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5635👍18🤔4💘2
🤖 AI Studio — платформа для создания ИИ-агентов без навыков разработки

Yandex B2B Tech обновила AI Studio: теперь на платформе можно собрать своих ИИ-агентов всего за несколько часов

Что умеют:
🟠Голосовые агенты для контакт-центров на базе realtime API с ответами в реальном времени;
🟠AI Search для поиска по изображениям, таблицам и документам, а также по интернету;
🟠Составление мультиагентных сценариев (несколько агентов решают задачу вместе);
🟠Подключение агентов к внешним сервисам по шаблону через MCP Hub (уже можно интегрировать их с системами Контур.Фокус и amoCRM)

📌 Встроены готовые решения: SpeechSense для анализа звонков, Нейроюрист для юридических заключений и другие.

AI Studio уже доступна для всех клиентов Yandex Cloud.

@ai_machinelearning_big_data

#ai #cloud #agents
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣33👍2314🔥5🗿3🍓2
✔️ GitHub запустил публичное превью GPT-5-Codex для Copilot

OpenAI представила новую модель GPT-5-Codex, оптимизированную под программирование и агентные задачи.

Она доступна пользователям GitHub Copilot в публичном превью.

Модель можно выбрать прямо в VS Code в режимах Ask, Edit и Agent, но только начиная с версии Copilot v1.104.1. Доступ распространяется на тарифы Pro, Pro+, Business и Enterprise, при этом в бизнес- и корпоративных планах администратор должен включить поддержку GPT-5-Codex в настройках.

https://github.blog/changelog/2025-09-23-openai-gpt-5-codex-is-rolling-out-in-public-preview-for-github-copilot/

@ai_machinelearning_big_data


#openai #chatgpt
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥9❤‍🔥74💘2
🧠 MIT доказал: LLM могут логически рассуждать, если правильно их учить.

📄 Исследователи предложили метод PDDL-INSTRUCT. Он превращает обучение модели из «угадай ответ» в пошаговое решение задач с внешней проверкой.

Как это устроено:
1️⃣ На первом этапе модели показывают правильные и неправильные планы с объяснениями.
2️⃣ На втором этапе она сама прописывает рассуждения для каждого шага. После этого внешний инструмент (**VAL**) проверяет логику. Если ошибка - модель получает чёткое объяснение, что не так.

📊 Результаты:
- У Llama-3-8B точность выросла с 28% до 94% на задачах планирования.
- Подробная обратная связь работает намного лучше, чем простое «правильно/неправильно».

💡 Главное: модель не заменяет символический планировщик, а учится мыслить как он, сохраняя внешнюю проверку.

Такой подход можно применить к любым многошаговым задачам - от математики до программирования. Возможно, многие «невозможные» способности моделей скрыты внутри и ждут правильного метода обучения.

🟠Статья: https://arxiv.org/abs/2509.13351

@machinelearning_interview
Please open Telegram to view this post
VIEW IN TELEGRAM
👍84🔥5035🤔7💘2
🎁 РАЗЫГРЫВАЕМ iPhone Air!

Друзья, запускаем новый конкурс на один из самых неубиваемых (кто бы мог подумать?) и необычных iPhone в этом году!

Условия участия максимально простые:


🔸Подписаться на медиа-канал о нейросетях и машинном обучении «Machine Learning»
🔸Подписаться на канал о технологиях и о будущем «Droider»
🔸Нажать кнопку «Участвовать» под постом

Итоги — 24 октября. Доставка приза осуществляется по РФ, РБ и Казахстану.

Всем удачи!
Please open Telegram to view this post
VIEW IN TELEGRAM
1275🔥127👏43👍28😁13🥱12💘10🤬6🤔5🌭2😭1
⚡️Магнитный транзистор от MIT: электроника будущего

Инженеры MIT создали новый тип транзистора - магнитный транзистор.
Обычные транзисторы работают только за счёт электричества, а здесь добавлен магнитный контроль.

Что это даёт:
- транзистор может быть и переключателем, и памятью одновременно
- работает быстрее и потребляет меньше энергии
- размеры схем можно сделать ещё меньше

Почему это интересно:
- Сейчас в компьютерах логика и память разделены: процессор считает, память хранит.
- Новый подход объединяет эти функции прямо в одном элементе. Это может упростить схемы и ускорить работу устройств.

Вызовы:
- нужно научиться производить такие транзисторы массово
- переключение пока требует магнитного поля, а в будущем его хотят делать электрическим током

Перспективы:
Если технология выстрелит, мы получим мощные и экономичные чипы, что особенно важно для смартфонов, носимой электроники и систем с ограниченными ресурсами.

🟠 Статья: https://news.mit.edu/2025/mit-engineers-develop-magnetic-transistor-more-energy-efficient-electronics-0923

@ai_machinelearning_big_data


#MIT #технологии #электроника #полупроводники
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥103👍3717🥰12🤔6🥱3💘3
Media is too big
VIEW IN TELEGRAM
✔️ Новый агент от OpenAI может оказаться на базе GPT-5.

По данным TestingCatalog, в закрытом тестировании замечена модель под названием Alpha Agent, которая, предположительно, является улучшенной версией ChatGPT Agent.
Первые результаты тестов показывают значительно более высокую эффективность и возможности по сравнению с текущим поколением.

Если эти слухи подтвердятся, то 2025 год действительно может стать «годом агентов». Всё больше признаков указывает, что во второй половине года мы увидим по-настоящему полезные автономные системы, и предсказание Сэма Альтмана может оказаться верным.
X

✔️ Microsoft расширяет возможности 365 Copilot, добавив поддержку моделей Claude от Anthropic.

Теперь пользователи могут использовать как OpenAI, так и Claude — сначала в инструментах Researcher и Copilot Studio, а позже и в других продуктах.

Компания подчёркивает, что её стратегия «multi-model» выходит за рамки простого выбора: цель — объединить лучшие ИИ-модели индустрии, настроенные под рабочие процессы и потребности бизнеса.
Microsoft

✔️Германия объявила о крупной инициативе: SAP и OpenAI запускают проект “OpenAI for Germany”.

В отличие от обычных PR-заявлений, это поддержанный Microsoft проект с размещением на суверенной облачной инфраструктуре Германии. Это значит, что миллионы сотрудников государственного сектора будут пользоваться ИИ, созданным в Германии и для Германии, с учётом строгих требований к суверенитету данных, юридической прозрачности и национальным ценностям.

SAP выделяет 631 млрд евро инвестиций и дополнительно 20 млрд на цифровой суверенитет. Цель Берлина - к 2030 году увеличить вклад ИИ в экономику страны до 10% ВВП.

Долгое время Германию обвиняли в том, что она отстаёт в технологиях. Сегодня ситуация меняется: с суверенным ИИ, колоссальными вложениями и партнёрством SAP + OpenAI страна заявляет о возвращении в мировую технологическую гонку.

✔️Google выпустила руководство о том, как создавать и использовать AI-агентов.

Внутри: 10 способов применения AI-агентов, пошаговая инструкция по в Google Agentspace, более 100 полезных готовых промптов.
Гайд

✔️ NVIDIA представила способ создания RAG-агента на базе модели Nemotron, который может сам решать, когда искать информацию, а когда — генерировать ответ напрямую.

Новый подход, основанный на архитектуре ReAct (Reason + Act), интегрирует модели NeMo Retriever Embedding и Reranking, а также фреймворк LangGraph. Агент запускается в Jupyter и разворачивается через DevX Workshop.

Инструмент предлагает более гибкие интеллектуальные агенты, которые обращаются к базе знаний только по необходимости и способны решать комплексные задачи, комбинируя инструменты и принятие решений.
nvidia

@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
63👍33🥰5🔥3😴2😁1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Sakana AI представили: ShinkaEvolve — новый open-source фреймворк для научных открытий, который использует LLM и работает на порядки эффективнее традиционных эволюционных систем.

Обычные эволюционные алгоритмы похожи на brute-force: им нужны тысячи выборок, чтобы найти хорошее решение.

ShinkaEvolve, вдохновлённый принципами природы (*shinka* — «эволюция» по-японски), решает задачи всего за сотни попыток.

Пример: в классической задаче упаковки кругов (разместить несколько кругов так, чтобы они не перекрывались и при этом занимали как можно меньше места или максимально эффективно заполняли заданную область) ShinkaEvolve нашёл новое SOTA-решение, использовав 150 выборок, тогда как прошлым методам требовались тысячи.

📌 Применения ShinkaEvolve:

1️⃣ AIME Math Reasoning - система создала новые агентные шаблоны (scaffolds), которые оказались сильнее существующих методов.
2️⃣ Соревновательное программирование (ALE-Bench) - улучшила готовые решения и подняла результат с 5-го до 2-го места в рейтинге.
3️⃣ Обучение LLM - открыла новую функцию потерь для MoE-моделей, что помогло экспертам лучше специализироваться и снизило perplexity моделей.

⚙️ Основные инновации, которые дают такой прирост эффективности:
- умный отбор родителей, балансирующий исследование новых идей и улучшение старых;
- фильтрация по новизне, чтобы не тратить ресурсы на повторные варианты;
- ансамбль из нескольких LLM, где bandit-алгоритм в реальном времени выбирает наиболее подходящую модель для задачи.

ShinkaEvolve открыт для сообщества и задуман как универсальный помощник для учёных и инженеров. Цель команды — сделать поиск новых решений быстрее и доступнее.

🔗 Блог: https://sakana.ai/shinka-evolve/
🔗 Код: https://github.com/SakanaAI/ShinkaEvolve
📄 Репорт: https://arxiv.org/abs/2509.19349

@ai_machinelearning_big_data

#AI #LLM #EvolutionaryAI #ShinkaEvolve #OpenSource
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7061👍21
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Kimi представила новый агентный режим OK Computer

Что он может:
Генерирует сайты, дашборды приложения и презентации
Работает с файлами, браузером и терминалом
Большой встроенный набор инструментов

K2 получил полезный агентский функционал.

🟢Попробовать: https://kimi.com

@ai_machinelearning_big_data


#AI #Agents #Kimi #K2 #OKComputer
Please open Telegram to view this post
VIEW IN TELEGRAM
67👍19🔥12👏3
Media is too big
VIEW IN TELEGRAM
✔️ Liquid Nanos - новая линейка ультракомпактных моделей, которые дают производительность уровня GPT-4o на эйдж девайсах.

Модели (от 350M до 2.6B параметров) с архитектурой LFM2 v2, которые выдают производительность уровня GPT-4o при минимальной задержке и конкурируют с моделями, которые в сотни раз больше.
Hf

✔️ ChatGPT Pulse - новый проактивный ассистент от OpenAI.

Он сам формирует повестку дня: напоминает о событиях, подбирает полезные материалы и советы на основе ваших интересов. При подключении Gmail и Google Calendar готовит агенду встреч, напоминает о днях рождения и даже предлагает подарки.

Сейчас доступен только Pro-пользователям в мобильном приложении, позже появится и у Plus.
X

✔️ Euclyd Craftwerk — европейский ответ Nvidia в AI

Стартап Euclyd представил систему Craftwerk, которая обещает кардинально снизить стоимость и энергопотребление инференса. Архитектура впечатляет: 16 384 процессора, до 32 PFLOPS мощности и собственная память UBM с 1 ТБ DRAM и пропускной способностью 8000 ТБ/с.

Один блок Craftwerk способен выдавать 20 000 токенов/сек (против ~1000 у Nvidia), а полный рэк - до 7,68 млн токенов/сек для моделей уровня Llama-4. Главная цель - сделать мощный AI-инференс доступным всем, а не только технологическим гигантам.
eetimes

✔️ Google DeepMind обновила модели Gemini 2.5 Flash и Flash-Lite (preview).

Они теперь работают быстрее, дают более качественные ответы и стоят дешевле: Flash-Lite на 50% понижен по стоимости токенов, Flash — на 24%. Улучшились мультимодальные возможности и переводы, а также работа с инструментами. На бенчмарке SWE-Bench модель Flash показала прирост производительности на 5%.

Обновления делают Gemini более доступным и полезным для реальных задач, особенно в программировании и мультимодальных сценариях.

✔️ OpenAI представила GDPval - свой новый бенчмарк

OpenAI запустила метрику GDPval, которая оценивает модели не по абстрактным тестам, а по реальным экономически значимым задачам из 44 профессий.

Результаты показали: современные модели могут работать на уровне экспертов, выполняя задачи примерно в 100 раз быстрее и дешевле. Но важно - в честном сравнении лидером оказался Claude Opus 4.1, опередивший решения OpenAI.
Openai

✔️ Tencent представила Hunyuan3D-Part — открытую модель для генерации 3D-объектов на уровне отдельных деталей.

Модель уже обгоняет все существующие открытые и закрытые аналоги.
В состав разработки входят две ключевые новинки: P3-SAM, первая нативная модель сегментации деталей в 3D, и X-Part, генератор, который задаёт новые стандарты управляемости и качества форм.

Модель обучена на датасете из 3,7 миллиона объектов с чистыми аннотациями и полностью исключает использование 2D SAM. В ней реализован автоматический пайплайн сегментации прямо в 3D без участия пользователя, а также диффузионный механизм разбиения объектов на части с учётом геометрии и семантики.
Code

@ai_machinelearning_big_data


#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6627🔥10❤‍🔥1
⚡️Новый датасет Т-ECD — крупнейший кросс-доменный набор для RecSys

Ключевые особенности:
- синтезирован на основе поведения 44 млн пользователей
- более 135 млрд взаимодействий
- включает 30 млн товаров и 1,2 млн брендов
- охватывает домены: Marketplace, Retail, Payments, Offers, Reviews, Reciepts
- подходит для большинства рекомендательных задач
- глубина данных 1– 3,5 года — можно изучать как краткосрочные, так и долгосрочные взаимодействия

T-ECD универсален и применяется от базовой коллаборативной фильтрации до сложных мультизадачных моделей последовательных и графовых рекомендаций. Можно использовать целиком и по отдельным доменам.

🟠HF: https://huggingface.co/datasets/t-tech/T-ECD

@ai_machinelearning_big_data

#AI #LLM
Please open Telegram to view this post
VIEW IN TELEGRAM
48👍14🔥8🗿3
13 сентября Илье Сегаловичу, одному из создателей и техническому директору «Яндекса», исполнился бы 61 год.

Для многих он был не только выдающимся инженером, но и человеком, который умел вдохновлять, поддерживать и замечать в других то, чего они сами в себе не видели.

Во многом именно он заложил основы внутренней культуры и ценности компании.

Яндекс опубликовал видео с воспоминаниями друзей и коллег Ильи, которые работали с ним в разные годы. Рекомендую посмотреть каждому!
🫡5030👍11🔥4👏4🥰2🤣2🌭1😭1🤓1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ Tencent представила Hunyuan3D-Omni: первую в индустрии модель для генерации 3D-объектов с мультиконтрольным управлением.

Модель ростроенная на базе open-source Hunyuan3D 2.1 и называемая «ControlNet для 3D», система решает проблемы кривых генераций и искажённой геометрии, интегрируя до четырёх условий контроля.

Две ключевые инновации:
- Лёгкий унифицированный энкодер управления для эффективного мультимодального фьюжна
- Стратегия прогрессивного обучения по сложности, повышающая устойчивость модели

Возможности:
- Управление по одному изображению и наброску позволяет точно задавать позы для анимаций и аватаров
- Использование облака точек (полного или построенного по глубине): убирает визуальную неопределённость и обеспечивает реалистичную геометрию
- Контроль через bounding box: задаёт пропорции объекта (длину, ширину и высоту) в соответствии с дизайном
- Voxel-контроль: формирует топологию объекта, что удобно и для инженерных, и для творческих сценариев

Tencent дропнули код и веса.

🟢Код: https://github.com/Tencent-Hunyuan/Hunyuan3D-Omni
🟢Веса: https://huggingface.co/tencent/Hunyuan3D-Omni
🟢Отчёт: https://arxiv.org/pdf/2509.21245

@ai_machinelearning_big_data


#3DGenAI #TencentHunyuan #OpenSourceAI
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3116👍9🥰2
Wink AI Challenge — хакатон на стыке IT и кино. Участников ждут задачи, которые ускорят производство фильмов и сериалов за счёт прикладных AI-решений. Призовой фонд соревнования — 1 125 000 рублей.

🗓 Регистрация до 31 октября: https://cnrlink.com/winkaichallengeml
💻 Формат: онлайн, а в финале — очная защита. Участвовать можно в команде или соло. 
⭐️ Приглашаем: ML-инженеров, backend- и frontend-разработчиков, специалистов в DevOps, MLOps, а также инженеров в сфере мультимедиа.

Главные причины присоединиться:
🔸 Первый в России хакатон, посвящённый применению ИИ в кинопроизводстве.
🔸 Разработка ML-модели, которую оценят и будут использовать продюсеры популярных российских фильмов и сериалов.
🔸 Работа с настоящими сценариями и видеоматериалами, анализ текстов, извлечение сущностей, генерация структуры съёмок.

Задачи хакатона основаны на реальных кейсах, с которыми продюсеры сталкиваются каждый день:
→ Трек 1. Разработайте решение, которое на основе сценария проведет анализ каждой сцены, определит место действия, персонажей, реквизит и поможет оптимизировать планирование съемок.
→ Трек 2. Обучите модель определять возрастную категорию контента и выделять ключевые сцены, влияющие на рейтинг. Решение сэкономит время профильных юристов и облегчит адаптацию контента для разных медиа.  
→ Трек 3. Создайте систему, которая превращает текст сценария в превиз с эскизами, ключевыми кадрами, анимацией и возможностью командного редактирования. 

Регистрируйтесь на Wink AI Challenge, чтобы разработать ИИ-ассистента, который станет частью производства фильмов и сериалов: https://cnrlink.com/winkaichallengeml
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍8😁6🗿4🔥3
🦾 Google представил Gemini Robotics-ER 1.5 - новую модель для роботов, которая умеет видеть, рассуждать, планировать и действовать в реальном мире.

Что она может:
- Понимать пространство и объекты вокруг.
- Разбивать задачу на шаги (например: «убери стол» → план действий).
- Подключать внешние инструменты - поиск, модели для анализа изображений и др.
- Балансировать скорость и точность: быстро реагировать или глубже анализировать.
- Работать безопаснее: учитывать вес предметов и физические ограничения.

Мир слишком сложен для роботов: окружение, сцены, объекты постоянно меняются.

Gemini Robotics-ER помогает роботам соединять понимание и действие.

📌 Пример: робот сортирует мусор.
Он узнаёт местные правила, распознаёт предметы, планирует действия и выполняет всё безопасно.

https://developers.googleblog.com/en/building-the-next-generation-of-physical-agents-with-gemini-robotics-er-15/

@ai_machinelearning_big_data


#Google #Gemini #Robotics #AI #PhysicalAgents
🔥3714👍12🤔3