epsilon correct

Всё-таки нравится работать в компании, где на глупенький 😛 технический вопрос в общем чате тебе отвечает нобелевский лауреат, ещё и псевдокод накидал.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍121💅48🔥20🙏9💔9❤8🥴6👏5

6.49K views14:03

epsilon correct

Please open Telegram to view this post

VIEW IN TELEGRAM

❤40🥴31🤬3🍓2

11:23

epsilon correct

Qwen 3 embedding

На HuggingFace выложили веса самой маленькой моделькт из новой серии эмбеддеров на основе Qwen 3. Размерность 1024, матрёшка (можно использовать меньшую размерность с небольшой потерей качества), поддерживается 100+ языков, ретривал кода. На MTEB официально ещё не завезли.

edit: также выложили 8B веса

🔥34🥴2🤔1

6.34K viewsedited 13:44

epsilon correct

Gemini 2.5 Preview 06-05

Выпустили последнюю перед официальным релизом версию Gemini 2.5 Pro. Пофиксили регрессии относительно версии 03-25, сота на Aider и humanity last exam. На арене +25 Эло относительно майской версии, +35 – на webdev arena. Сильно улучшили multi-turn.

Отдельное издевательство – выпускать версию 06-05 после 05-06. Считаю, что надо выпускать релизы начиная с 13 дня каждого месяца, чтобы избежать путаницы.

👍66🤣32🔥14❤5🥴5

9.17K viewsedited 16:12

epsilon correct

У High-Dimensional Probability Вершинина стал доступен драфт второго издания. Добавили больше 200 упражнений и сделали книгу более удобоваримой. 🥁

Как по мне, лучшая книга по основам вероятностных методов в приложениях к нашему с вами любимому датасаенсу.

pdf

Please open Telegram to view this post

VIEW IN TELEGRAM

👍52🔥27❤12

9.31K views14:48

epsilon correct

Gemini 2.5 Pro – теперь generally available. Финальной стала версия 06-05.

Также выпустили в превью 2.5 Flash Lite, по цене в три раза дешевле флеша 2.5 )на уровне с флешом 2), моделька с ризонингом. Хотели дешёвую рабочую лошадку – получите.

🔥69❤3👎1

7.79K viewsedited 16:30

epsilon correct

Также опубликовали статью (ищите меня на 10 странице авторов)0

👏45🎉20🔥5🥰1

7.71K views17:37

epsilon correct

Сегодня на улице – +40°C и отличное время, чтобы задуматься о том, где живу. Недавно нашёл очень толково сделанный сайт Weatherspark, который позволяет сравнивать города по погоде. Мой любимый график – температура по влажному термометру (статья в вики) – на сайте пересчитывается в humidity comfort level и сильно зависит от влажности. Мне от влажной жары тяжеловато, так что в Дубае было довольно тяжко, и даже в Нью-Йорке к концу лета бывает как в бане. 😎

Please open Telegram to view this post

VIEW IN TELEGRAM

❤34👍24

8.06K views10:41

epsilon correct

There is no antimemetics division.
Qntm. 2021.
#book_review

Книга – амальгамация набора рассказов с сайта SCP foundation, построенна вокруг идеи антимемов – идей, которые засекречивают ██ себя, по своей природе препятствуют ███ распространению. О них можно думать, как о ████ мемов, аномальные антимемы ██████ записать или запомнить, полностью ████████ их ████████.

████████ █ ██ Марион, ██████ ████ ████████. ████ отдела ██████ – в ██████ аномальных ████████, ████████ ██████. ██████ ██ █ ████. █ ███, книга ████, █/10.

P.S. Если вы ████ это и ██████ ██████, то, скорее всего █████ ██.

👍35❤27🤬9🤣6👀3🔥1🎉1

9.18K viewsedited 11:54

epsilon correct

Все мы (надеюсь) писали оптимизированные кернелы под железо, но оптимизировали ли вы название своего кернела? Если нет – очень жаль, потому что CUDA кернел для attention на тритоне с "cutlass" в названии на 100 TFLOPs быстрее, чем без него. 🤫

В целом, куртке не впервой, да и у интела были подобные огрехи

Please open Telegram to view this post

VIEW IN TELEGRAM

👀58🤣22🤔8😭4

8.06K views10:37

epsilon correct

Техрепорт про Gemini 2.5 Pro выложили на архив – теперь с 3295 авторами. 👥

👥

Please open Telegram to view this post

VIEW IN TELEGRAM

🥴75❤20🔥11👍9🤪9🤣5🍓1

6.64K views14:29

epsilon correct

Gemini Embedding теперь зарелижен как gemini-embedding-001 в Gemini API и Vertex AI. Модель относительно мартовской версии почти не изменилась. Цена – $0.15/Mtok против $0.13/Mtok у товарищей конкурентов.

🔥21👍6❤2

5.34K views10:33

epsilon correct

Золотая медаль на IMO 2025

Вчера опубликовали блогпост про решение задач главной математической олимпиады для школьников. И решили не просто, а на золото 🤴, и не просто, а без какого-либо tool use и систем формальных решений, как в прошлом году. Модель тоже была достаточно неспециализированная.

Решения Gemini можно посмотреть вот тут. Два главных отличия в сравнении с решениями от товарищей конкурентов: во-первых, в решении второй задачи Gemini нашёл менее механически переборный способ решения. Во-вторых, ответы Gemini были более внятно написанными, без прыжков в нотации и путаных объяснений.

С задачами в каком-то смысле в этом году повезло – первые пять задач были относительно простые если верить рейтингу известному в олимпиадных кругах Evan Chen, при этом мало участников получили частичные баллы за решения шестой задачи. С другой стороны, для систем, основанных на Lean, было бы сложно решить пятую задачку про игру – они очень тяжело формализуются.

В этом году (в отличие от прошлого), к сожалению, моя идея не выстрелила, так что поучаствовать в финальной системе не получилось 😳. Придётся тешить себя тем, что мы сильно толкнули Gemini в математике на стадии претрейна и работать над идейками для RLя втихую дальше.

Из интересного, в блоге написали про систему, которая пользовалась in-context learning'ом из нужных теорем и решения IMO-подобных задач, но другая система оценённая грейдерами IMO без костылей тоже получила золото.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍43🔥20👏11❤1🤣1💅1

4.83K views11:04

epsilon correct

#book_review
"Empire of AI", Karen Hao, 2025 (amazon)

Долго думал, писать ли ревью на это произведение, но раз уж дочитал, как будто стоит записать мыслишки. Подзаголовок книги "Мечты и кошмары OpenAI Сэма Альтмана" (нет, не шучу) с обложки настраивает на смесь бульварного романа и сиолошной, но внутри неподготовленного читателя быстро настигает отборная дичь. Авторка немного предвзатя к нашему с вами любимому АИ и очень любит пообсасывать грустные истории из третьего мира, где людям тяжело жить. Из чтения о серьёзно больной женщине в Венесуэле, которая в кризис выживала на разметке данных, я однозначно понял, что так ей делать не стоило. Подло подловив читателя на гетеронормативно-либеральный стыд, автор выкатывает линейку экспертов, которая будет задавать тон всей книге.

В одной из первых глав нас знакомят с Гари Маркусом, который года с 2019 повторяет, что диплёрнинг не работает, а когда работает – это нейросимвольный ИИ. Для неподготовленного читателя может показаться, что такая позиция – не маргинальная позиция человека, который в лучшем случае может претендовать на статус инфлюенсера, а чуть ли не консенсус. Дальше может быть только лучше – в следующей главе нас ждёт Emma Strubell, от статьи которой, в которой потребление энергии на один трейн ран переоценили в 88 раз, у некоторых пригорает до сих пор. К этому моменту я уже догадался, что дальше будет Timnit Gebru и история со статьёй со стохастическими попугаями (критика по делу от Йоава Голдберга), рассказаная, конечно, со стороны несправедливно угнётённых. Успокаиваться пришлось, когда в одном из единственных комментариев от экс-сотрудников я узнал интёрна, который проработал в OpenAI три месяца в 2019 году и до сих пор постит кринж у меня в линкедине.

С таким звёздным набором спикеров и колоссальной предвзятостью читать эту книгу как сериал про турецкий гарем не представляется возможным, надёжности источников тоже нет. Довольно сложно, как мне кажется, написать откровенно вредную книгу, но тут, на моё икреннее удивление, получилось. Даже обидно за конкурентов.

🤣47❤9😢8👍6🤔2🔥1

5.3K views11:33

epsilon correct

Gemini 2.5 Flash Lite

Пару дней назад выпустили новую мини-модель для энтерпрайза, которому хочется хорошо, но подешевле. Получилась модель на уровне второго флеша, но сильно быстрее (до 900 tok/s). Кстати, batch processing позволяет сэкономить ещё вдвое, если результаты нужны непрямщас.

На бенчмарки можно 🧐 посмотреть тут, поиграться, как обычно, в ai studio, и бежать за бесплатной тысячей запросов в день.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤30👏9🔥5

11.5K viewsedited 16:52

epsilon correct

Для подписчиков Gemini Ultra выкатили Deep Think. Доставайте $200. 🤑

Сам пользуюсь в хвост и гриву для околорабочих и алгоритмических задач – уважаемо.

Please open Telegram to view this post

VIEW IN TELEGRAM

💅40🔥16👍3👀2❤1

5.52K views11:55

epsilon correct

Чем занимаются консультанты?

Любопытный препринт с таким названием выложили на NBER. Авторы развенчивают убеждение, что консультанты нанимаются бизнесом, чтобы легитимизировать непопулярные решения для руководства – резать затраты, уменьшать зарплаты и смещать деньги работников в сторону акционеров. 😈

Используя данные со всех B2B транзакций в Бельгии с 2002 по 2023 годы авторы твёрдо и чётко доказывают, что это не так. При помощи diff-in-diff с синтетическим контролем авторы показывают, что в компаниях, нанимающих консультантов происходит повышение средних зарплат на 2.7% в течение следующих пяти лет.

При этом консультантов нанимают как высоко-, так и низко-производительные компании, причём основную пользу получают именно низкопроизводительные фирмы – там растёт общая производительность. Таким образом, в экономике консалтинговые компании обеспечивают повышение эффективности распределения капитала по рынку.

Компании тратят на консультантов значительные деньги: в среднем, клиенты тратят ~3% свого фонда оплаты труда, но получают при этом увеличение производительности труда на ~3.6% в течение пяти лет. При этом процент расходов на ФОТ не меняется, а значит мем про бездельников-консультантов – миф.

Что интересно, в более развитой Бельгии продуктивность в сравнении с исследованиями в развивающихся странах (Индии и Мексики) растёт сильно медленнее.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤20👍8👎3🌚2👏1🤔1💔1

6.03K views11:21

epsilon correct

Gemma 3 270M

Выпустили крохотулю размером в 270М параметров – почти как старый добрый берт. Очень дёшево запускается на телефонах, следует инструкциям, может выполнять простые задачи. Quantized-aware training в 4 бита.

Можно поиграться в браузере с созданием сказок языковой моделью прямо в браузере.

😱35❤30🔥20👍6👀5

10.4K views16:37

epsilon correct

Харкорные инженеры из гугла опубликовали гайд про то, как мы думаем про оптимизацию LLMок под TPU с глубоким разбором того, как всё работает под капотом. Рассказывают про шардирование параметров, тренировку, трюки инференса доступно и с диаграммами. 10/10…

В гайде про оптимизацию LLMок под TPU выпустили новую главу про.. GPU. 🤔

В основном разбираются отличия в скорости коммуникаций между чипами и как правильно шардировать модели для максимальной производительности. Примеры на наших с вами любимых ламах и дипсиках.

Последние пару недель занимаюсь такими оптимизациями под TPU на работе, ещё раз рекомендую – очень дидактичный материал.

Please open Telegram to view this post

VIEW IN TELEGRAM

jax-ml.github.io

How to Think About GPUs | How To Scale Your Model

We love TPUs at Google, but GPUs are great too. This chapter takes a deep dive into the world of NVIDIA GPUs – how each chip works, how they’re networked together, and what that means for LLMs, especially compared to TPUs. This section builds on <a href='https://jax…

❤21🔥18👍2

3.06K views15:24

epsilon correct

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

Вчера мы показали Pixel 10, где эйай прёт изо всех щелей (которые остались после IP68 защиты). Захотелось подсветить одну фичу, которая теперь по-настоящему работает – телефон теперь умеет подсвечивать релевантную информацию из других приложений, например, доставать билеты или бронирования ресторанов из почты.

Это – первый раз, когда одна из фич работает на модельке, которую я помогал строить – Gemma 3n. Десятки миллионов девайсов, и это только начало! 🚨

Please open Telegram to view this post

VIEW IN TELEGRAM

❤68🔥38👍10👎2

2.42K viewsedited 13:16

About

Blog

Apps

Platform