gonzo-обзоры ML статей

6.03K views19:45

6:26

Media is too big

VIEW IN TELEGRAM

6.5 минут рассказа про работу с демонстрациями

6.13K views19:50

gonzo-обзоры ML статей

Работа на самом деле год отлёживалась

5.2K views19:51

gonzo-обзоры ML статей

О, Sonnet 3.7 подоспел!

У модели теперь можно включать Extended thinking режим:
https://www.anthropic.com/research/visible-extended-thinking

И вроде как они приняли решения не скрывать "мысленный процесс" модели. Это почётно. Гугл вот убрал :(

Цены прежние: $3/$15 за входные/выходные токены, последние включают thinking tokens.

https://anthropic.com/news/claude-3-7-sonnet

Anthropic

Claude 3.7 Sonnet and Claude Code

Today, we’re announcing Claude 3.7 Sonnet, our most intelligent model to date and the first hybrid reasoning model generally available on the market.

👍17❤4

6.18K viewsedited 20:13

gonzo-обзоры ML статей

Обещают лучше на SWE

😱10

6.81K views20:17

gonzo-обзоры ML статей

👍1

7.55K views20:17

gonzo-обзоры ML статей

Акустические модемы снова в моде!

https://devpost.com/software/gibber-link

Devpost

gibber link

Communication protocol for optimized AI agent - AI agent communication over phone

😁18🔥4

6.98K views00:23

gonzo-обзоры ML статей

https://youtu.be/EtNagNezo8w

YouTube

Two AI agents on a phone call realize they’re both AI and switch to a superior audio signal ggwave

Try Gibberlink mode here! https://gbrl.ai/
(open on two devices 📱📱)

🏆 The Project is Winner of ElevenLabs 2025 Hackathon London

Our project "gibberlink" demonstrated how two AI agents started a normal phone call about a hotel booking, then discovered they…

❤21🔥2

6.87K views00:24

gonzo-обзоры ML статей

DeepSeek пошёл всё опенсорсить на этой неделе.

Сегодня опубликовали DeepEP, коммуникационную библиотеку для MoE с GPU кернелами
https://github.com/deepseek-ai/DeepEP

Вчера выложили кернелы для MLA
https://github.com/deepseek-ai/FlashMLA

Завтра ещё что-нибудь выложат.

GitHub

GitHub - deepseek-ai/DeepEP: DeepEP: an efficient expert-parallel communication library

DeepEP: an efficient expert-parallel communication library - deepseek-ai/DeepEP

🔥64👍3

8.19K viewsedited 07:26

gonzo-обзоры ML статей

DeepSeek пошёл всё опенсорсить на этой неделе. Сегодня опубликовали DeepEP, коммуникационную библиотеку для MoE с GPU кернелами https://github.com/deepseek-ai/DeepEP Вчера выложили кернелы для MLA https://github.com/deepseek-ai/FlashMLA Завтра ещё что-нибудь…

Сегодня выложили кернелы для матричных операций в FP8

https://github.com/deepseek-ai/DeepGEMM

DeepGEMM is a library designed for clean and efficient FP8 General Matrix Multiplications (GEMMs) with fine-grained scaling, as proposed in DeepSeek-V3. It supports both normal and Mix-of-Experts (MoE) grouped GEMMs. Written in CUDA, the library has no compilation need during installation, by compiling all kernels at runtime using a lightweight Just-In-Time (JIT) module.

Currently, DeepGEMM exclusively supports NVIDIA Hopper tensor cores. To address the imprecise FP8 tensor core accumulation, it employs CUDA-core two-level accumulation (promotion). While it leverages some concepts from CUTLASS and CuTe, it avoids heavy reliance on their templates or algebras. Instead, the library is designed for simplicity, with only one core kernel function comprising around ~300 lines of code. This makes it a clean and accessible resource for learning Hopper FP8 matrix multiplication and optimization techniques.

Despite its lightweight design, DeepGEMM's performance matches or exceeds expert-tuned libraries across various matrix shapes.

Неделя опенсорса продолжается!

GitHub

GitHub - deepseek-ai/DeepGEMM: DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling

DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling - deepseek-ai/DeepGEMM

🔥30❤6🤔2👍1

8.19K views11:20

gonzo-обзоры ML статей

Всех поздравляю!

https://openai.com/index/introducing-gpt-4-5/

Openai

Introducing GPT-4.5

We’re releasing a research preview of GPT‑4.5—our largest and best model for chat yet. GPT‑4.5 is a step forward in scaling up pre-training and post-training.

🔥13😱7😁2🥴1

7.62K views22:37

gonzo-обзоры ML статей

Forwarded from Сиолошная

Пост с выжимкой трансляции:

— модель будет в API вместе с выпуском в Pro-подписку (сегодня)
— Модель будет доступна разработчикам в API ВСЕХ ТИРОВ (не только тем, кто потратил $100+ или $250+). У меня уже появился доступ. В теории завтра-послезавтра появятся независимые бенчмарки... если авторы наскребут денег на тесты ;) новая модель ОЧЕНЬ дорогая
— в остальные тиры (Plus за $20) попадёт уже на следующей неделе
— появился блог: https://openai.com/index/introducing-gpt-4-5/
— модель уже работает с Canvas и поиском (инструменты в ChatGPT), а самое главное поддерживает загрузку файлов
— «GPT-4.5 демонстрирует более сильную эстетическую интуицию и креативность» (прилагаются результаты слепого тестирования на пользователях, как часто они предпочитали ответ одной модели другой). Новая модель побеждает в 57%-63% чатов (более высокий процент достигается на «профессиональных» запросах, что бы это не значило).
— модель тренировалась на нескольких датацентрах одновременно (как Gemini 1.0 год назад)
— как я писал, сделали акцент на том, что новая модель будет очень крутой базой для обучения рассуждающих моделей. Второй акцент — на существенном уменьшении галлюцинаций и улучшении надёжности.

UPD: появились цены!
— $75 долларов за миллион токенов на входе, $150 за миллион на выходе — существенно дороже, чем на релизе была GPT-4. Сейчас GPT-4o стоит $2.5/$10 — в 30 и 15 раз дешевле соответственно (а ведь это ещё и не самая дешёвая модель на рынке DeepSeek стоит значимо дешевле). Страшно представить, сколько будут рассуждалки стоить..
— модель похоже реально ОГРОМНАЯ, скорость генерации ну очень маленькая. Даже простых ответов приходится ждать... как будто вернулся в март '23-го и свежую GPT-4.

Длина контекста остаётся 128k токенов, но почти для всех кейсов этого хватает. Всё равно длинный контекст не так надёжен сам по себе :)

UPD2: модель имеет знания до Октября 2023-го года, согласно документации, то есть как o1/o3/GPT-4o. Это очень не здорово( хотелось хотя бы плюс 8-10 месяцев данных получить...

👍26😁4❤2

7.74K views22:37

gonzo-обзоры ML статей

Давно Шмидхубера не видели?

https://www.ted.com/talks/juergen_schmidhuber_why_2042_will_be_a_big_year_for_ai

Ted

Why 2042 will be a big year for AI

From the Big Bang to the rise of artificial intelligence, AI pioneer Juergen Schmidhuber unpacks history's rapid-fire advancement — and why 2042 might just be the year AI reaches superhuman levels. Blending insights from biology, technology and the cosmos…

😁41🔥8🗿4

9.97K views10:10

gonzo-обзоры ML статей

Turing Award у Barto & Sutton за RL! ~~И bitter lesson~~

https://www.acm.org/media-center/2025/march/turing-award-2024

www.acm.org

Andrew Barto and Richard Sutton are the recipients of the 2024 ACM A.M. Turing Award for developing the conceptual and algorithmic…

In a series of papers beginning in the 1980s, Barto and Sutton introduced the main ideas, constructed the mathematical foundations, and developed important algorithms for reinforcement learning—one of the most important approaches for creating intelligent…

❤44🔥19⚡10👌1

8.12K viewsedited 15:43

gonzo-обзоры ML статей

Дожили

https://corticallabs.com/cl1.html

Corticallabs

Cortical Labs - CL1

The world's first code deployable biological computer. Test how lab-grown neurons process information and learn.

👏25😱17😈3🥰2👎1

8.68K views07:45

gonzo-обзоры ML статей

Что ни день, то сто грамм! А то и двести!

"Mutual Assured AI Malfunction (MAIM)"

https://www.nationalsecurity.ai/

www.nationalsecurity.ai

Superintelligence Strategy

Superintelligence Strategy is written by: Dan Hendrycks, Eric Schmidt, Alexandr Wang. Rapid advances in AI are beginning to reshape national security.

👍13😁5❤3🌚2👎1👏1

8.35K views08:43

gonzo-обзоры ML статей

Ну и до кучи к предыдущему, если ещё не видели

https://www.anthropic.com/news/anthropic-s-recommendations-ostp-u-s-ai-action-plan

Anthropic

Anthropic’s Recommendations to OSTP for the U.S. AI Action Plan

Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.

💩10🤣10😁2👍1🔥1

7.72K views20:33

gonzo-обзоры ML статей

1😁123💯31🔥5👍3🤡3❤2🥰1🥴1🦄1👾1

9.7K views20:33

gonzo-обзоры ML статей

Хорошее

5.8K views22:54

gonzo-обзоры ML статей

Forwarded from Новости психофизиологии

Прогресс в зоопсихологии:

Интересный систематический обзор всех аспектов психики головоногих, включен полный библиографический список всей накопленной к данному моменту литературы по этому вопросу. Линии человека и головоногих разошлись более 600 миллионов лет назад, тем не менее дальнейшие эволюционные процессы (включая механизмы конвергентной эволюции) создали во многом параллельные формы мозга и психики. Изучение психики настолько эволюционно далеких от нас форм жизни важно для дальнейшего расширения круга эмпатии человечества и разработки законодательных мер защиты сложных форм нечеловеческого сознания.

https://thebrooksinstitute.org/sites/default/files/2025-02/Cephalopod%20Cognition%20and%20Sentience.pdf

👍39🔥12🐳8❤7👎1

5.74K views22:54

gonzo-обзоры ML статей

И вот до кучи мой старый пост из 2020-го.

“Чужой разум”, Питер Годфри-Смит (Peter Godfrey-Smith, Other Minds: The Octopus, the Sea, and the Deep Origins of Consciousness)
https://ast.ru/book/chuzhoy-razum-841787/

“Ложная слепота”, Питер Уоттс (Peter Watts, Blindsight)
https://ast.ru/book/lozhnaya-slepota-714648/

Две крайне сильно перекликающиеся между собой книги, одна художественная, другая научно-популярная, обе с впечатляющим набором примечаний со ссылками на научные работы. Книги в общем про одно и то же, только одна написана в парадигме what is, а другая — what if. Одно и то же — это сознание или субъективный опыт, причём рассмотренный со стороны распределённых интеллектов типа осьминога (но этим не ограничивающиеся).

Что характерно, оба автора — морские биологи (ну или около того), только один теперь философ, а другой фантаст. И по странному стечению обстоятельств, оба — Питеры.

У нас на планете по факту есть минимум три различных эволюционных эксперимента по созданию разума: мы, млекопитающие (и затем приматы, а также вероятно, иные развилки, типа дельфинов и китов); птицы (особенно врановые и попугаи); головоногие (осьминоги, каракатицы, кальмары). Последние — самые “инопланетные” для нас, хотя в общем и про птиц в последние годы тоже много интересного публикуется (типа https://www.facebook.com/grigory.sapunov/posts/10215874024103747).

“Чужой разум” Годдфри-Смита, книга с подзаголовком “Осьминоги, море и глубинные истоки сознания”, на первый взгляд кажется книгой про сознание осьминогов (что в общем уже интересно), но на поверку оказывается книгой по философии сознания, включающей в себя также довольно подробный разбор эволюционных корней сознания, и даже, неожиданно, вопросы старения.

Автор прослеживает эволюционные истоки развитых нервных систем фактически от коммуникации одноклеточных, к клеткам внутри многоклеточного организма, появлению нервной системы (возможно, ещё у эдиакарской фауны), и множеству дальнейших эволюционных развилок. Описывает устройство тел и особенности биологии головоногих (не знал, что у них кожа по сути представляет многопиксельный экран и то, что они, вероятно, могут кожей “видеть”). Рассуждает, когда в эволюции появляется субъективный опыт, и в какой момент внутри “загорается свет”, обсуждает некоторые теории сознания. Ну и попутно, конечно, много рассказывает о своих и чужих наблюдениях за осьминогами и каракатицами.

Много классных примеров поведения осьминогов, которые вместо того, чтобы дёргать рычаг и получать пищу, начинают откручивать лампочки, брызгаться водой или отламывать этот рычаг. Мне очень запомнился пример с осьминогом, жившим в каком-то аквариуме то ли в зоопарке, то ли в институте, где их кормили вроде размороженной рыбой, которая для осьминогов скорее второсортна. И вот осьминог в первом аквариуме после получения этой еды терпеливо дождался, пока исследовательница пройдёт все остальные аквариумы и раздаст еду их обитателям, и на её обратном пути встретил её у стекла, держа в щупальцах эту еду, а затем не отрывая взгляда поплыл вглубь аквариума, где находился слив воды, и демонстративно, глядя на исследовательницу, отправил туда в слив эту размороженную рыбу.

На очереди у меня также давно лежит “Душа осьминога” Сай Монтгомери, её теперь ещё больше хочется почитать. А “Чужой разум”, думаю, ещё буду перечитывать, она того стоит.

“Ложная слепота” Питера Уоттса появилась раньше, в 2006-м (“Чужой разум” в 2016-м, и, кстати, у Годдфри-Смита вот только что, месяц назад, вышла новая книга “Metazoa: Animal Life and the Birth of the Mind”). Читать интересно, но спойлерить не буду, там кроме инопланетных разумов и про наши тоже есть неплохие рассуждения. Тоже рекомендую.

#books

Издательство AST

«Чужой разум» Годфри-Смит Питер - описание книги | Наука, идеи, ученые | Издательство АСТ

Питер Годфри-Смит (р. 1965) — австралийский морской биолог и философ науки, профессор Сиднейского университета. Его бестселлер "Другие умы" произвел настоящую революцию в нашем понимании...

2❤‍🔥37👍29❤5🔥5

6.56K viewsedited 23:05

About

Blog

Apps

Platform