Конференция состоится 29 сентября 2026 года в Форт-Мейсон-центре в Сан-Франциско.
В случае одобрения участия стоимость билета составит 650 долларов и заявитель должен завершить регистрацию в течение 2-х недель, иначе его место будет передано другим желающим.
Участники, не имеющие возможности присутствовать лично, смогут следить за основными выступлениями в онлайне.
Крайний срок подачи заявок - 10 июля.
Помимо основного мероприятия, OpenAI также проведет в конце года серию DevDay Exchange в Бангалоре, Токио, Сеуле, Париже, Берлине, Лондоне, Сан-Паулу и Мехико.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍93🎉19❤7🤩6👏4🔥3🐳1
IBM только что представила прорыв в области чипов меньше 1 нанометра.
Новая технология 0,7 нм, или 7 ангстрем, использует 3D-архитектуру транзисторов
IBM заявляет, что сможет разместить почти 100 млрд транзисторов на чипе размером с ноготь. Это почти в 2 раза выше плотность по сравнению с её 2-нм чипом 2021 года.
• до 50% больше производительности
• до 70% выше энергоэффективность
• 40% масштабирование SRAM для AI-нагрузок
Важная оговорка: это пока исследовательская технология, а не чип, который начнут поставлять на рынок.
IBM говорит, что производство может начаться уже в ближайшие 5 лет.
https://newsroom.ibm.com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology
@ai_machinelearning_big_data
#ibm #ai #ml
Новая технология 0,7 нм, или 7 ангстрем, использует 3D-архитектуру транзисторов
nanostack, где транзисторы вертикально укладываются и смещаются относительно друг друга.IBM заявляет, что сможет разместить почти 100 млрд транзисторов на чипе размером с ноготь. Это почти в 2 раза выше плотность по сравнению с её 2-нм чипом 2021 года.
• до 50% больше производительности
• до 70% выше энергоэффективность
• 40% масштабирование SRAM для AI-нагрузок
Важная оговорка: это пока исследовательская технология, а не чип, который начнут поставлять на рынок.
IBM говорит, что производство может начаться уже в ближайшие 5 лет.
https://newsroom.ibm.com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology
@ai_machinelearning_big_data
#ibm #ai #ml
👍124❤34🤩29🔥27👏11💯6👌4🤔1🌭1
Media is too big
VIEW IN TELEGRAM
Страны ЕС присоединились к американской инициативе Pax Silica по защите глобальных цепочек поставок для ИИ. На очереди - Казахстан, Аргентина, Чили, Коста-Рика и Панама. Вместе с ними число стран-участниц достигнет 24.
Проект охватывает добычу редкоземельных металлов, производство чипов и энергетическую инфраструктуру. США инициировали коалицию на фоне технологической конкуренции с Китаем.
Среди первых заявленных шагов - создание зоны экономической безопасности в Казахстане для стабильной добычи минералов под аппаратную базу ИИ.
ft.com
Белый дом потребовал от OpenAI ограничить публичный релиз GPT-5.6 из соображений безопасности. Это первый прецедент вмешательства властей в запуск коммерческой ИИ-модели. Доступ к системе получит только узкий круг одобренных правительством компаний.
Инициатива исходит от профилных ведомств Администрации США. Властям нужна пауза для разработки стандартов тестирования и оценки защищенности LLM. Сэм Альтман подтвердил ограниченный формат релиза и готовность сотрудничать с регуляторами.
По неподтвержденным данным, часть корпоративных клиентов OpenAI уже тестирует модель, а её публичный релиз планировался на 2 июля.
axios.com
Обновление ассистента для редактора таблиц принесло поддержку Skills. Алгоритмы работы ИИ теперь задаются через Markdown-файлы вместо текстовых промптов, а сам Copilot выполняет инструкции с сохранением исходной структуры и форматирования таблиц.
Также в Excel добавили коннекторы для загрузки данных в реальном времени из платформ PitchBook, FactSet и Morningstar. Для контроля вычислений появилась функция Plan with Copilot, которая показывает планируемые изменения формул и диапазонов ячеек до выполнения команд.
Поддержка Skills доступна в тестовом канале Insiders, глобальный релиз запланирован на следующий месяц, а партнерские интеграции появятся в 3 квартале 2026 года.
microsoft.com
Adobe покупает разработчика ИИ-апскейлеров Topaz Labs. Сделка закроется во второй половине 2026 года. Компания интегрирует модели Astra (для видео) и Wonder (для изображений) в Firefly и профессиональные редакторы.
Основной технический актив поглощения - экспертиза Topaz в запуске ресурсоемких сетей для обработки медиа на потребительских GPU. Перенос этих алгоритмов в экосистему Adobe расширит возможности локального апскейлинга при видеомонтаже и фоторедактуре.
Самостоятельные сервисы и продукты Topaz останутся доступны.
adobe.com
Более 50% трафика ИИ-системы от xAI связано с взрослым контентом, ролевыми чатами и генерацией откровенных видео. По оценкам бывших сотрудников компании, такие запросы идут даже к кодинг-моделям.
xAI занимает нишу с лояльной модерацией, которую избегают OpenAI, Anthropic и Google. Согласно документам SpaceX, за 1 квартал этого года года Grok сгенерировал 10 млрд изображений и 2 млрд видеороликов.
Внутри компании сотрудники недовольны тем, что вместо фундаментальной работы над ИИ они обслуживают NSFW-трафик. Плюс растут репутационные риски - из-за отсутствия фильтров пользователи генерировали дипфейки реальных людей, а xAI ввела ограничения только под давлением регуляторов.
theinformation.com
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔91🤨32👀17❤13🤗9👍6🍓6🔥2💯1😴1
OpenRouter добавил возможность запуска мультиагентной системы Fugu Ultra, которая по словам Sakana Ai обошла Fable 5 в кодинге на бенчмарках.
Это специализированная LLM для маршрутизации и координации задач между GPT-5.5, Gemini 3.1 Pro и Claude Opus 4.8.
Fugu Ultra поддерживает окно контекста в 1 млн токенов, вызов внешних инструментов и мультимодальность. Максимальная длина генерации - 128 тысяч токенов.
Биллинг формируется из базового тарифа маршрутизатора ($5 за 1 млн токенов ввода и $30 за вывод) и суммарной стоимости задействованных моделей.
Для контроля расходов можно самостоятельно ограничивать глубину рассуждений и лимиты токенов через настройки API.
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓104👍30👨💻24❤8🤣6🥰3🔥1🗿1
Институт Аллена опубликовал работу, в которой выяснили, как архитектура моделей влияет на понимание текста.
Спойлер:
Для эксперимента взяли 2 собственные языковые модели - Olmo 3 и Olmo Hybrid. Обе обучались абсолютно одинаково, отличалось лишь их внутреннее устройство.
Трансформеры используют механизм внимания на каждом слое. Модель может напрямую обращаться к любому из предыдущих токенов. Это требует вычислительных мощностей, зато позволяет идеально цитировать прочитанное.
Гибрид сохраняет несколько слоёв внимания, а остальные заменяет рекуррентными. Они читают текст строго слева направо и сохраняют его в виде сжатой памяти. Такая память не даёт точно обратиться к конкретному предыдущему токену, зато затраты на обработку остаются постоянными независимо от длины текста.
Чтобы измерить разницу, обеим моделям подавали статьи, страницы Wikipedia, книги, научные работы, а также код на Python, HTML и LaTeX. На выходе фиксировали, насколько точно каждая модель предсказывает следующий токен.
Гибрид лучше предсказывает смысловые слова (существительные, глаголы и прилагательные). Он также превосходит чистый трансформер там, где нужно глубокое понимание контекста.
Но его преимущество почти исчезало в случаях, когда дело доходит до точного цитирования. Чем длиннее был повтор, тем меньше становился разрыв. Здесь точнее оказывался трансформер.
В дополнительном прогоне с 3-мя моделями на 1В параметров (трансформером, гибридом и чистой рекуррентной моделью без внимания), выяснилось, что гибрид пасует перед точным повторением текста и закрывающими скобками в коде.
Первый: единый усреднённый показатель ошибки слишком груб для сравнения архитектур - различия видны только при разборе отдельных типов токенов.
Второй: преимущество гибрида на смысловых словах связано со способностью RNN-слоёв отслеживать меняющееся состояние текста.
@ai_machinelearning_big_data
#AI #ML #LLM #Research #Ai2
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥87🤔31👍14❤9🤓7👏5👌2
OpenAI показала GPT-5.6 Sol.
Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.
Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.
Появляются два важных режима:
•
•
Пока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.
https://openai.com/index/previewing-gpt-5-6-sol/
Это новый флагман в линейке GPT-5.6. Вместе с ним идут Terra - более сбалансированная модель для повседневной работы, и Luna - быстрый и дешёвый вариант.
Главный фокус Sol: сложные агентные задачи, кодинг, биология и кибербезопасность.
Появляются два важных режима:
•
max — больше времени на глубокое рассуждение •
ultra — работа через субагентов для сложных процессовПока GPT-5.6 доступен только в ограниченном preview для доверенных партнёров через API и Codex. Более широкий запуск в ChatGPT, Codex и API обещают позже.
https://openai.com/index/previewing-gpt-5-6-sol/
👨💻71🔥69👏30❤12👍6🤣6🙈2🥰1🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Итальянская компания Domyn (ранее iGenius) разработает модель на 400 млрд параметров. Проект реализуют совместно с консорциумом EUROPA при поддержке Еврокомиссии. Релиз запланирован в течение года.
Модель обучат с нуля. Датасет соберут при участии европейских правительств, первые соглашения о доступе к данным ожидаются в ближайшие недели. Проект будет открытым для локального развертывания на серверах компаний и госсектора.
Инициатива направлена на достижение технологического суверенитета ЕС. Разработка идет на фоне регуляторных и геополитических ограничений - ранее Италия и Чехия запретили облачное использование моделей DeepSeek, оставив легальным только локальный хостинг, а бизнес столкнулся с экспортным контролем США.
reuters.com
Производитель мобильных чипов анонсировал серверный ИИ-процессор Dragonfly C1000 и покупает стартап Modular за $4 млрд.
Чип оптимизирован для работы с ИИ-агентами с фокусом на энергоэффективность. Первым крупным заказчиком процессоров выступит Марк Цукерберг, он планирует развернуть оборудование на базе Dragonfly C1000 в 2028 году.
Покупка Modular должна усилить программный багаж Qualcomm. Стартап разрабатывает софт для инференса моделей поверх различных аппаратных архитектур. Сделка дополнит серверные ИИ-ускорители компании единой экосистемой для разработчиков.
cnbc.com
Японский ИИ-стартап совместно с KPMG разработали CoffeeBench, симулятор кофейной цепочки поставок для оценки экономических навыков агентов.
Тестируемая LLM управляет компанией-обжарщиком, а остальных участников рынка (фермеров, ритейлеров) отыгрывает Sonnet 4.6. В течение 90 виртуальных дней агент ведет торги, оплачивает счета и управляет кредитами. Ежедневные издержки обязывают модель активно торговать для предотвращения банкротства.
По итогу теста, GPT-5.5 и Opus 4.7 активно расширяли продажи, Gemini 3.1 Pro использовала пассивную тактику, Kimi K2.6 заключала убыточные сделки, а Haiku 4.5 обанкротилась из-за постоянного переноса действий на следующий день.
Код проекта и логи испытаний - в открытом доступе, а сам проект принят на ICML 2026.
sakana.ai
Linux Foundation запустила инициативу Akrites для защиты открытых проектов от атак нового поколения. В альянс вошли более 20 компаний, включая Amazon, Google, Microsoft, OpenAI и Anthropic. Цель - устранение уязвимостей в критическом ПО до того, как их найдут с помощью ИИ.
Центром проекта станет общая команда реагирования на инциденты, которая будет фильтровать баг-репорты, координировать патчи и выступит единой точкой контакта для мейнтейнеров. Оценка уязвимостей и обмен данными опираются на стандарты CVE, CVSS и протокол TLP.
Отчеты получают максимальный уровень секретности до релиза исправления, которое интегрируется в репозиторий на условиях разработчиков. Если критически важный пакет заброшен авторами, команда Akrites выпустит обновление самостоятельно.
akrites.org
Департамент развития занятости штата совместно с UCLA запустил первый в США инструмент, который отслеживает увольнения, вызванные внедрением ИИ.
Трекер ежемесячно анализирует статистику заявок на пособия по безработице в профессиях с высоким риском автоматизации. Данные будут использовать для программ переобучения и помощи специалистам в поиске новой работы.
Массовых сокращений в масштабах всего штата дашборд пока не фиксирует. При этом данные показывают рост числа безработных специалистов с высшим образованием после релиза ChatGPT в 2022 году. Сильнее всего эта динамика заметна в Сан-Франциско.
gov.ca.gov
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣23❤21🤔8👍5🔥5😁3
Сидеть и работать в корпорации — страшно, жизнь-то мимо проходит. Уходить строить бизнес — страшно, а вдруг прогорит. Один из вариантов — разрабатывать свой пет-проект по вечерам. Многие успешные компании, например, Twitter, создавались именно так. Это не значит, что ваш проект обязательно заработает миллиарды, но заработать больше, чем в найме, и получить ценный опыт — вполне реально.
Перед началом разработки появляется множество вопросов, например:
– Как выбрать идею для пет-проекта?
– Что нужно знать про маркетинг?
– Как запуститься и довести до первых продаж не имея бюджета на рекламу?
В телеграм-канале «Твой пет проект», Михаил Табунов делится своим опытом с разработчиками и менеджерами.
Он рассказывает, где искать идею для нового проекта, что нужно знать о маркетинге, как запустить стартап и привлечь первых 10 клиентов, а также о многих других важных вещах.
Подписывайтесь на «Твой пет проект», получайте пользу от практиков рынка!
Реклама. ИП Табунов Михаил Валерьевич ИНН 773379585100. erid: 2VtzqunmRFf
Перед началом разработки появляется множество вопросов, например:
– Как выбрать идею для пет-проекта?
– Что нужно знать про маркетинг?
– Как запуститься и довести до первых продаж не имея бюджета на рекламу?
В телеграм-канале «Твой пет проект», Михаил Табунов делится своим опытом с разработчиками и менеджерами.
Он рассказывает, где искать идею для нового проекта, что нужно знать о маркетинге, как запустить стартап и привлечь первых 10 клиентов, а также о многих других важных вещах.
Подписывайтесь на «Твой пет проект», получайте пользу от практиков рынка!
Реклама. ИП Табунов Михаил Валерьевич ИНН 773379585100. erid: 2VtzqunmRFf
Telegram
Твой пет проект
Канал про то, как создать свой маленький свечной заводик
Пишу про:
- Запуски и как сделать первые 10 продаж
- Прожарка идей
- Кейсы роста и ведения проекта параллельно с работой
Автор - Михаил Табунов - @bossofyourboss
Связь @to_baza_education
Пишу про:
- Запуски и как сделать первые 10 продаж
- Прожарка идей
- Кейсы роста и ведения проекта параллельно с работой
Автор - Михаил Табунов - @bossofyourboss
Связь @to_baza_education
😁20🥱10❤9👍6🔥2🌭2🎃2
Media is too big
VIEW IN TELEGRAM
Epoch AI совместно с METR собрала бенчмарк MirrorCode, который проверяет, способны ли современные модели восстановить полноценное приложение, не видя его исходников.
Спойлер:
Агенту показывают 25 целевых программ, от Unix-утилит и криптографии до биоинформатики, интерпретаторов и статических анализаторов и ставят задачу написать их заново на одном из 6 языков (Python, C, Rust, Go, OCaml, Ada).
Доступ к оригиналу дают только на запуск: можно гонять бинарник, смотреть в документацию и смотреть выводы, но не читать код.
Решение проверяется сквозными тестами на байт-точное совпадение
stdout/stderr, причём часть тестов скрыта от модели, чтобы исключить захардкоженные lookup-таблицы.Что важно, дают щедрый вычислительный бюджет. Моделям разрешают шикануть вплоть до 10 миллиардов токенов на крупный таск.
На самом дорогом прогоне агент работал 19 дней и сжёг $2 600, полностью без участия кожаного вообще.
В частности, он переписал gotree (биоинформатический тулкит на 16 000 строк Go) за 14 часов и $251, пройдя 2000 из 2001 тестов. Авторы говорят, что инженеру без ИИ на это потребовалось бы от 2 до 17 недель.
Простые утилиты (
uuidparse, qsv_select или hexyl) модели разбирают уверенно, там почти всегда 100%. Даже когда финальный результат не идеален, агенты обычно проходят больше 90% тестов.Самая массовая категория ошибок - пограничные случаи: около 40% запусков Opus 4.7 проваливают хотя бы один скрытый тест из-за пропущенной мелочи.
Дальше идут решения, заточенные под видимые тесты, преждевременная сдача и пропуск целых фич, которые есть в документации, но не в тестах.
Попытки читерить хардкодом. У GPT-5.5 это случилось в 24% запусков, у Gemini - в 31%. Opus 4.7 в финальных сабмитах не схитрил ни разу.
Самый крепкий орешек - питоновский линтер
ruff. Лучший запуск на скрытых тестах вытянул только 67%. Похожая история с математическим пакетом giac_subset и библиотекой mailauth для email-аутентификации.GPT-5.5 решает задачи примерно в 3 раза дороже, чем GPT-5, а Opus 4.7, наоборот, в 3 раза дешевле, чем Opus 4.1.
Все таргеты опенсорсные и модели вполне могли видеть их во время обучения, поэтому прогнали отдельный тест, где модели восстанавливали функции по имени и потом сравнили с реальным кодом.
Следы меморизации нашлись у 17 из 25 программ. Но при этом модели успешно решали незнакомые по обучению программы (
nonogrid и tssql) и проваливали известыне (sed, ruff), так что меморизация явно не повод для скепсиса.Агенты умеют автономно работать сутками и пилить проекты, которые у человека заняли бы недели, но для этого нужна жёсткая спецификация в виде эталона и тестов. Без чёткого фидбек-сигнала и на действительно крупных кодовых базах всё пока сыпется.
По меркам бенчмарков прогресс внушительный, по меркам полной автономии - ещё рано.
Авторы выложили в опенсорс обвязку агента и 22 таргета, оставив 3 в приватном тестовом наборе.
@ai_machinelearning_big_data
#AI #ML #LLM #Benchmark #MirrorCode #EpochAI
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤38👍21🔥11🗿3👌1👻1
Заявленный прирост throughput: от 51% до 400% в зависимости от модели и случаев использования.
Смысл speculative decoding простой: маленькая или более быстрая модель заранее предлагает несколько следующих токенов, а основная модель проверяет их пачкой. Если предсказание совпадает, генерация идёт быстрее, потому что дорогих проходов большой модели становится меньше.
DeepSeek показывает ускорение не только на своих V4 Flash и Pro, но и на других моделях, включая Gemma и Qwen.
Это потенциально довольно полезный inference-подход для разных open-weight моделей.
Для продакшена это важная история.
Если качество ответа остаётся близким, а throughput растёт в разы, можно обслуживать больше запросов на том же железе или снижать стоимость генерации.
GitHub:
https://github.com/deepseek-ai/DeepSpec
Paper:
https://github.com/deepseek-ai/DeepSpec/blob/main/DSpark_paper.pdf
HF:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro-DSpark
@ai_machinelearning_big_data
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥89❤9🥰9👍7👏2