295K subscribers
5.11K photos
1.16K videos
17 files
5.47K links
Погружаемся в машинное обучение и Data Science

Показываем как запускать любые LLm на пальцах.

По всем вопросам - @haarrp

@itchannels_telegram -🔥best channels

Реестр РКН: clck.ru/3Fmqri
Download Telegram
📌 WSJ: коммерческие сделки OpenAI связаны с ростом личных инвестиций Сэма Альтмана

The Wall Street Journal со ссылкой на судебные документы, ставшие публичными в ходе процесса "Маск против OpenAI", опубликовала расследование о том, что контракты OpenAI повышали оценку стартапов, в которые лично вкладывается Сэм Альтман.

Для контекста: Альтман не владеет долей в самой OpenAI, поэтому его доходы зависят от внешних инвестиций.


🟡Механизм

OpenAI заключает контракт или соглашение о сотрудничестве, что поднимает оценку стартапа. Затем крупные акционеры OpenAI (например, Thrive Capital) или партнёры (SoftBank) выкупают доли стартапа, от чего личное состояние Альтмана растёт, так как он является их инвестором.

🟡Helion

В 2025 году Сэм предлагал OpenAI вложить около $500 млн в термоядерный стартап Helion. Часть сотрудников восприняла идею с настороженностью, и от прямых инвестиций компания отказалась.

В марте 2026 года стороны подписали пересмотренное соглашение о сотрудничестве и тогда же Альтман вышел из совета директоров Helion, объяснив это конфликтом интересов.

В июне 2026 года Helion оценили в $15,5 млрд, а личная доля Альтмана выросла как минимум до $4,1 млрд.

🟡Cerebras

После того как производитель чипов получил от OpenAI обязательство о закупках и провёл IPO, стоимость доли Альтмана выросла более чем в 6 раз по сравнению с декабрём 2025 года.

🟡Retro Biosciences

После соглашения о научном сотрудничестве с OpenAI доля Альтмана в этой компании по продлению жизни к декабрю 2025 года достигла $258 млн.

Всего, по данным WSJ, не менее 10 компаний из инвестиционного портфеля Альтмана имеют сделки с OpenAI.


🟡На это обратили внимание власти

Комитет Палаты представителей США по надзору начал официальное расследование, а генеральные прокуроры нескольких штатов призвали Комиссию по ценным бумагам и биржам проверить деятельность главы OpenAI в преддверии IPO.

Сам Альтман и представители компаний называют сотрудничество обычной практикой.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔54🤨1910👍8😁7😐6🔥4🤬2
Qwen-AgentWorld обошёл Claude Opus и GPT-5.4 на новом агентном бенчмарке.

Qwen выпустили open-weight модели, которые симулируют реальные среды для агентов: web, terminal, coding, search, OS и Android.

Главное:

• 397B набрала 58.71 и обошла Opus 4.8 / GPT-5.4
• 35B MoE обошла Sonnet 4.6
• сильный прирост в coding, web и terminal задачах
• веса уже доступны на Hugging Face

Paper: https://arxiv.org/abs/2606.24597
Blog: https://qwen.ai/blog?id=qwen-agentworld
GitHub: https://github.com/QwenLM/Qwen-AgentWorld
HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld
ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld
🔥104🎉69👍24👏127🤣5👀4🤔1
🌟 Moebius: ультракомпактная модель для инпейнта изображений

Команда из китайского университета HUST и лаборатории VIVO AI Lab опубликовала проект Moebius для восстановления и дорисовки недостающих или удалённых фрагментов изображений.

Модель объёмом 220 млн параметров, по словам авторов, достигает качества, сопоставимого с системами на порядок большего размера, при значительно более высокой скорости работы.

На 6 тестовых наборах Moebius работает на уровне моделей с 10 млрд параметров (FLUX.1-Fill-Dev), а в отдельных случаях (сложные текстуры и правдоподобность лиц) превосходит их.

Скорость инференса составляет около 26 мс на один шаг вычислений, а суммарное ускорение более чем в 15 раз по сравнению с крупными системами.

🟡Под капотом два решения

Первое, блок Local-λ Mix Interaction, который перестраивает механизм внимания, сводя пространственный и смысловой контекст к матрицам фиксированного размера.


Второе - дистилляция знаний от более крупной модели-учителя PixelHacker, выполненная в латентном пространстве.


На Hugging Face технический отчет Moebius занял первое место в ежедневном рейтинге статей, а сам проект подан на конференцию ECCV 2026.

Опубликованы код для дообучения и веса:

🟢Базовый чекпоинт
🟠Дообученная версия на Places2 (общие знания);
🟠Дообученная версия на CelebA-HQ (фото знаменитостей);
🟠Дообученная версия на FFHQ (люди с Flickr).


📌Лицензирование кода : Apache 2.0 License

📌Лицензирование моделей: MIT License


🟡Страница проекта
🟡Arxiv
🟡Веса
🖥GitHub


@ai_machinelearning_big_data

#AI #ML #Diffusers #InPaint #Moebius
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4013🔥5😁1🎉1
Авито запустил набор на совместные магистратуры с МФТИ и ВШЭ — программы построены на реальных кейсах компании, а преподают действующие сотрудники. В разработке всех программ участвовали более 300 экспертов со стороны Авито.

Из трех направлений два — для тех, кто специализируется на ML:

✔️ «Прикладное машинное обучение и анализ данных» с МФТИ

Программа охватывает классический ML, рекомендательные системы, компьютерное зрение и генеративный ИИ. Стек актуален под текущие запросы индустрии.

✔️ «Машинное обучение в цифровом продукте» с ФКН ВШЭ

Фокус на применении ML внутри продуктовых экосистем. Слушатели работают с данными и кейсами из реальной практики, а не с учебными датасетами. Преподаватели — сотрудники Авито, которые ежедневно решают задачи такого класса.

Поступить можно из любого региона России — программы открыты для выпускников бакалавриата со всей страны. Выпускники выходят с опытом, сопоставимым с первыми месяцами работы на позиции.

@ai_machinelearning_big_data

#ml #education #avito
🤣165👍5💅1
Media is too big
VIEW IN TELEGRAM
✔️ Апдейт GPT-5.5 Instant

OpenAI начала развертывание обновления для GPT-5.5 Instant в ChatGPT. Апдейт улучшил удержание контекста в многошаговых промптах со сложными условиями. Еще пофиксили проблему с зацикливанием, теперь при оспаривании ответа или запросе уточнений модель перестраивает логику вывода, а не дублирует первоначальный вариант.

Также оптимизирована обработка коммерческих запросов - модель комбинирует геоданные, информацию о бизнесе и изображения. В задачах на сравнение и принятие решений заявлено более точное распознавание цели запроса.
openai.com

✔️ Computer Use в Gemini 3.5 Flash

Google запустила функцию Computer Use в API Gemini 3.5 Flash. Модель анализирует происходящее на экране и автономно выполняет действия в браузерах, десктопных и мобильных ОС.

Для защиты агентов от инъекций промптов модель прошла состязательное обучение. При обнаружении попытки взлома выполнение задачи автоматически прерывается, а для запуска необратимых или критичных действий предусмотрена настройка обязательного подтверждения от человека.

Инструмент открыт в Gemini API и на платформе Enterprise Agent. Документация с референсным кодом уже опубликована, а демо-среда для тестирования развернута на базе Browserbase.
blog.google

✔️ Альянс Pax Silica расширяется до 24 стран

Евросоюз, Германия, Нидерланды и Греция присоединились к американской инициативе Pax Silica по защите глобальных цепочек поставок для ИИ. Ожидается, что после присоединения Казахстана, Аргентины, Чили, Коста-Рики и Панамы число стран-участниц достигнет 24.

Проект охватывает добычу редкоземельных металлов, производство чипов и энергетическую инфраструктуру. США инициировали коалицию на фоне технологической конкуренции с Китаем.

Среди первых заявленных шагов - создание зоны экономической безопасности в Казахстане для стабильной добычи минералов под аппаратную базу ИИ.
ft.com

✔️ В MIT создали микрочип для аппаратного рендеринга 3D-карт в реальном времени

Инженеры института представили SoC Gleanmer для построения 3D-карт в реальном времени на микророботах. Энергопотребление чипа составляет всего 6 мВт (это 2,5% от показателей традиционных решений для пространственного картирования).

Разработчики отказались от воксельных сеток в пользу кастомного алгоритма GMMap. Он моделирует препятствия и свободное пространство с помощью гауссианов.

Энергоэффективность достигнута за счет совместного проектирования аппаратной и программной архитектуры. Gleanmer обрабатывает карты глубин за один проход (пиксели сравниваются только с ближайшими соседями, после чего исходные данные удаляются). Слияние перекрывающихся гауссианов выполняется во встроенной памяти, полностью исключая обращения к внешним накопителям.

Исследование поддержали Amazon и Intel.
news.mit.edu

✔️ В Anthropic уходят еще 2 ключевых разработчика из команды Gemini

Google продолжает терять ИИ-спецов, компанию покидают Йонас Адлер и Александр Притцель. Адлер отвечал за ИИ-инструменты кодинга, а Притцель занимался выстраиванием процессов обучения Gemini. Оба исследователя переходят в конкурентам в Anthropic.

Тенденция вызывает обеспокоенность у инвесторов, поскольку недавно поисковый гигант лишился еще двух звездных сотрудников: Джон Джампер также выбрал Anthropic, а Ноам Шазир присоединился к OpenAI.

Главный мотив такой утечки мозгов кроется в экономике. Оба конкурента, находящиеся в шаге от IPO, привлекают перспективными долями и опционами, способными принести немалый доход после выхода на биржу.

Несмотря на отток талантов, Google уверяет, что сохраняет прочные позиции и полностью уверена в своем кадровом потенциале.
bloomberg.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔6124👍10👏10🔥5😢4🤨1😨1
🗓 13 июля в 18:00 МСК приглашаем вас на открытый урок в преддверии старта курса «Большие языковые модели. Экспертный уровень / LLM».

На занятии разберём: 👇
• как RAG помогает модели работать с фактами и внешними источниками;
• в чём суть LoRA и почему этот метод позволяет эффективно дообучать большие языковые модели;
• отдельно обсудим, когда использовать RAG, когда выбирать LoRA, а когда эти подходы стоит комбинировать.

Урок подойдёт DS-специалистам, ML-инженерам и ИТ-специалистам, которые работают с текстовыми данными и хотят внедрять LLM-решения осознанно.

Зарегистрируйтесь и разберитесь, как выбирать архитектуру LLM-решения под реальные задачи: https://otus.pw/93To/?erid=2W5zFHxdK7F


Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
👍43🤔12🤣9👏76💯31🤝1
🌟 OpenAI предлагает поговорить с комнатным растением

Компания опубликовала на GitHub проект Plant Talk, с помощью которого комнатное растение можно наделить голосом и вести с ним беседу через ChatGPT.

Среди предлагаемых сценариев - дом, школьный класс, лаборатория или арт-проект.

В минимальной конфигурации нужны лишь компьютер с веб-камерой, микрофоном и динамиками, браузер Chrome или Edge и аккаунт OpenAI.

Камера делает снимок растения и проводит, как это называют OpenAI, "структурированную проверку его состояния", после чего можно начать разговор в реальном времени.

Например, спросить, как у него дела. в ответ растение "сверится со своими недавними наблюдениями" и оценит текущую обстановку.


Растению можно задать имя, характер и голос, а также настроить, на что именно обращает внимание камера.

Очевидно, что без дополнительных датчиков система судит о состоянии растения лишь по тому, что видит камера.

К системе можно подключить микроконтроллер Arduino с датчиком влажности почвы и модулем освещённости LM393, тогда к разговору добавятся реальные измерения.


📌Лицензирование: Apache 2.0 License


🖥Github


@ai_machinelearning_big_data

#AI #ML #PlantTalk #OpenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👏88🤣37🤩1917🤔13🤗9🔥5😍5👍4🗿3🥱2
📌OpenAI открыла прием заявок на DevDay 2026

Конференция состоится 29 сентября 2026 года в Форт-Мейсон-центре в Сан-Франциско.

В случае одобрения участия стоимость билета составит 650 долларов и заявитель должен завершить регистрацию в течение 2-х недель, иначе его место будет передано другим желающим.

Участники, не имеющие возможности присутствовать лично, смогут следить за основными выступлениями в онлайне.

Крайний срок подачи заявок - 10 июля.

Помимо основного мероприятия, OpenAI также проведет в конце года серию DevDay Exchange в Бангалоре, Токио, Сеуле, Париже, Берлине, Лондоне, Сан-Паулу и Мехико.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍93🎉197🤩6👏4🔥3🐳1
IBM только что представила прорыв в области чипов меньше 1 нанометра.

Новая технология 0,7 нм, или 7 ангстрем, использует 3D-архитектуру транзисторов nanostack, где транзисторы вертикально укладываются и смещаются относительно друг друга.

IBM заявляет, что сможет разместить почти 100 млрд транзисторов на чипе размером с ноготь. Это почти в 2 раза выше плотность по сравнению с её 2-нм чипом 2021 года.

• до 50% больше производительности
• до 70% выше энергоэффективность
• 40% масштабирование SRAM для AI-нагрузок

Важная оговорка: это пока исследовательская технология, а не чип, который начнут поставлять на рынок.

IBM говорит, что производство может начаться уже в ближайшие 5 лет.

https://newsroom.ibm.com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology

@ai_machinelearning_big_data

#ibm #ai #ml
👍12534🤩29🔥27👏11💯6👌4🤔1🌭1
Media is too big
VIEW IN TELEGRAM
✔️ Альянс Pax Silica расширяется до 24 стран

Страны ЕС присоединились к американской инициативе Pax Silica по защите глобальных цепочек поставок для ИИ. На очереди - Казахстан, Аргентина, Чили, Коста-Рика и Панама. Вместе с ними число стран-участниц достигнет 24.

Проект охватывает добычу редкоземельных металлов, производство чипов и энергетическую инфраструктуру. США инициировали коалицию на фоне технологической конкуренции с Китаем.

Среди первых заявленных шагов - создание зоны экономической безопасности в Казахстане для стабильной добычи минералов под аппаратную базу ИИ.
ft.com

✔️ Власти США впервые превентивно вмешались в релиз коммерческой модели

Белый дом потребовал от OpenAI ограничить публичный релиз GPT-5.6 из соображений безопасности. Это первый прецедент вмешательства властей в запуск коммерческой ИИ-модели. Доступ к системе получит только узкий круг одобренных правительством компаний.

Инициатива исходит от профилных ведомств Администрации США. Властям нужна пауза для разработки стандартов тестирования и оценки защищенности LLM. Сэм Альтман подтвердил ограниченный формат релиза и готовность сотрудничать с регуляторами.

По неподтвержденным данным, часть корпоративных клиентов OpenAI уже тестирует модель, а её публичный релиз планировался на 2 июля.
axios.com

✔️ Microsoft расширила возможности Copilot для Excel

Обновление ассистента для редактора таблиц принесло поддержку Skills. Алгоритмы работы ИИ теперь задаются через Markdown-файлы вместо текстовых промптов, а сам Copilot выполняет инструкции с сохранением исходной структуры и форматирования таблиц.

Также в Excel добавили коннекторы для загрузки данных в реальном времени из платформ PitchBook, FactSet и Morningstar. Для контроля вычислений появилась функция Plan with Copilot, которая показывает планируемые изменения формул и диапазонов ячеек до выполнения команд.

Поддержка Skills доступна в тестовом канале Insiders, глобальный релиз запланирован на следующий месяц, а партнерские интеграции появятся в 3 квартале 2026 года.
microsoft.com

✔️ Модели Topaz Labs станут частью экосистемы Adobe

Adobe покупает разработчика ИИ-апскейлеров Topaz Labs. Сделка закроется во второй половине 2026 года. Компания интегрирует модели Astra (для видео) и Wonder (для изображений) в Firefly и профессиональные редакторы.

Основной технический актив поглощения - экспертиза Topaz в запуске ресурсоемких сетей для обработки медиа на потребительских GPU. Перенос этих алгоритмов в экосистему Adobe расширит возможности локального апскейлинга при видеомонтаже и фоторедактуре.

Самостоятельные сервисы и продукты Topaz останутся доступны.
adobe.com

✔️ Grok превратился в платформу генерации NSFW-контента

Более 50% трафика ИИ-системы от xAI связано с взрослым контентом, ролевыми чатами и генерацией откровенных видео. По оценкам бывших сотрудников компании, такие запросы идут даже к кодинг-моделям.

xAI занимает нишу с лояльной модерацией, которую избегают OpenAI, Anthropic и Google. Согласно документам SpaceX, за 1 квартал этого года года Grok сгенерировал 10 млрд изображений и 2 млрд видеороликов.

Внутри компании сотрудники недовольны тем, что вместо фундаментальной работы над ИИ они обслуживают NSFW-трафик. Плюс растут репутационные риски - из-за отсутствия фильтров пользователи генерировали дипфейки реальных людей, а xAI ввела ограничения только под давлением регуляторов.
theinformation.com


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔95🤨32👀1713🤗9👍6🍓6🔥2💯1😴1
✔️ На OpenRouter появилась Fugu Ultra

OpenRouter добавил возможность запуска мультиагентной системы Fugu Ultra, которая по словам Sakana Ai обошла Fable 5 в кодинге на бенчмарках.

Это специализированная LLM для маршрутизации и координации задач между GPT-5.5, Gemini 3.1 Pro и Claude Opus 4.8.


Fugu Ultra поддерживает окно контекста в 1 млн токенов, вызов внешних инструментов и мультимодальность. Максимальная длина генерации - 128 тысяч токенов.

Биллинг формируется из базового тарифа маршрутизатора ($5 за 1 млн токенов ввода и $30 за вывод) и суммарной стоимости задействованных моделей.

Для контроля расходов можно самостоятельно ограничивать глубину рассуждений и лимиты токенов через настройки API.


@ai_machinelearning_big_data

#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓111👍30👨‍💻248🤣6🥰3🔥1🗿1
📌 Ai2: Гибридные модели и трансформеры по-разному работают с текстом

Институт Аллена опубликовал работу, в которой выяснили, как архитектура моделей влияет на понимание текста.

Спойлер: гибридные модели лучше улавливают смысл, а классические трансформеры точнее копируют данные.

Для эксперимента взяли 2 собственные языковые модели - Olmo 3 и Olmo Hybrid. Обе обучались абсолютно одинаково, отличалось лишь их внутреннее устройство.

🟢Olmo 3: классический decoder-only трансформер

🟠Olmo Hybrid: гибрид c чередованием слоев RNN и трансформеров в пропорции 3:1

Трансформеры используют механизм внимания на каждом слое. Модель может напрямую обращаться к любому из предыдущих токенов. Это требует вычислительных мощностей, зато позволяет идеально цитировать прочитанное.


Гибрид сохраняет несколько слоёв внимания, а остальные заменяет рекуррентными. Они читают текст строго слева направо и сохраняют его в виде сжатой памяти. Такая память не даёт точно обратиться к конкретному предыдущему токену, зато затраты на обработку остаются постоянными независимо от длины текста.


Чтобы измерить разницу, обеим моделям подавали статьи, страницы Wikipedia, книги, научные работы, а также код на Python, HTML и LaTeX. На выходе фиксировали, насколько точно каждая модель предсказывает следующий токен.

🟡Результат

Гибрид лучше предсказывает смысловые слова (существительные, глаголы и прилагательные). Он также превосходит чистый трансформер там, где нужно глубокое понимание контекста.

Но его преимущество почти исчезало в случаях, когда дело доходит до точного цитирования. Чем длиннее был повтор, тем меньше становился разрыв. Здесь точнее оказывался трансформер.

В дополнительном прогоне с 3-мя моделями на 1В параметров (трансформером, гибридом и чистой рекуррентной моделью без внимания), выяснилось, что гибрид пасует перед точным повторением текста и закрывающими скобками в коде.


🟡Выводы

Первый: единый усреднённый показатель ошибки слишком груб для сравнения архитектур - различия видны только при разборе отдельных типов токенов.

Второй: преимущество гибрида на смысловых словах связано со способностью RNN-слоёв отслеживать меняющееся состояние текста.


@ai_machinelearning_big_data

#AI #ML #LLM #Research #Ai2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥87🤔31👍149🤓7👏5👌2
OpenAI показала GPT-5.6 Sol.

Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.

Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.

Появляются два важных режима:

max — больше времени на глубокое рассуждение
ultra — работа через субагентов для сложных процессов

Пока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.

https://openai.com/index/previewing-gpt-5-6-sol/
👨‍💻78🔥69👏3012🤣7👍6🙈2🥰1🤩1