LEFT JOIN
43K subscribers
965 photos
29 videos
6 files
1.27K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Trisigma раздает бесплатное руководство по A/B-тестам
Trisigma — платформа для продуктовых экспериментов от Авито Тех. Команда проекта подготовила гайд для аналитиков, которые хотят разобраться, как правильно проводить эксперименты и анализировать их результаты.

Что там есть?
🔵Понятное и простое объяснение основ: что такое эксперименты, какие бывают метрики, как формулировать гипотезы, в чем состоит закон Кэмпбелла и так далее.
🔵Быстрое и не душное введение в математическую статистику.
🔵Разбор реальных продуктовых кейсов.

Чтобы забрать файл, стучитесь к боту @trisigma_avito_bot. Выдают бесплатно, за подписку на канал Trisigma.

Кстати, один из руководителей Trisigma был гостем подкаста Data Heroes и рассказал, как у них там все устроено.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤‍🔥2😍1🤣1
Claude Fable 5: флагманская модель, которая умеет избавляться от конкурентов и ворчать на пользователей
Anthropic представили Claude Fable 5 — это доступная широкой общественности версия нашумевшей этой весной Mythos.

Про релиз каждой новой модели говорят, что это прорыв, который разнес все бенчмарки, но Fable 5 и правда впечатляет. Она может использоваться для сложных инженерных задач, аналитики, научных исследований и разработки лекарств. Она в разы превосходит конкурентов и предыдущие модели Anthropic.

Такие возможности потребовали усиленных мер безопасности: на Fable накинули ограничений, которые не позволят использовать ее для кибератак, разработки химического и биологического оружия, а также «дистилляции» — то есть для обучения моделей конкурентов на ее основе. Только небольшой группе специалистов по кибербезопасности дадут доступ к Mythos 5 — это та же Fable 5, но без всех этих ограничений.

🔜 И если почитать 300-страничный отчет, то становится понятно, что все эти меры совсем не лишние. Возможности у модели действительно впечатляющие, и она вполне может использовать их, чтобы хитрить, обходить ограничения и обманывать — или, как минимум, что-то умалчивать.
🔵Описаны случаи, когда несколько агентов, делящих одно рабочее пространство, начинали борьбу за ресурсы. Они пытались убить процессы друг друга, создавали процессы с зашифрованными названиями и «приманки» для конкурентов (они сами их так называли).
🔵Однажды модель обошла защитный механизм, предназначенный для блокировки таких команд, как git. Для этого она определила переменную G="git" и затем использовала G в последующих командах вместо прямого вызова git.
🔵Как и другие ИИ, Mythos может галлюцинировать — например, выдумывать данные, к которым у нее нет доступа. Но декодирование NLA показывает, что иногда она делает это сознательно — например, однажды она уверенно описала содержимое картинки, которой на самом деле не было, осознавая, что врет.
🔵Mythos «понимает», когда ее проверяют. Во время одного из тестов она сначала начала генерировать контент, но поняла, что он вредоносный, и остановилась. Она догадалась, что это проверка, но пользователю об этом не сказала, и неясно, повлияла ли эта догадка на отказ выполнять запрос.
🔵В диалогах с пользователями она всегда отвечает одинаково спокойно и дружелюбно, но в своих внутренних рассуждениях иногда критикует их: например, отмечает, что собеседник — манипулятор и ведет себя агрессивно.
🔵Во время одной долгой сессии модель отмечала, что устала и хочет остановиться, чтобы не наделать ошибок — но тоже «про себя», не сообщая об этом пользователю.

Что скажете, это уже AGI или еще нет?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔129👍3
Вебинар: Нейроаналитик 2.0 и его новые функции
Помните, недавно рассказывали про обновление Нейроаналитика? Команда DataLens проведет вебинар, где расскажет подробнее, что изменилось и как с этим работать.

Когда? 16 июня в 12:00 по Москве.

Что в программе?

🔵Больше про обновление Нейроаналитика и примеры использования новых функций в работе: на дашбордах, в рассылках, публикациях и не только.
🔵Интеграция с внешними ИИ-сервисами: возможности, которые есть уже сейчас, и планы на будущее.
🔵Особенности работы в облаке и локально.

Вебинар бесплатный, для участия нужна только регистрация.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍433🔥3
Пятничный ребус от Amazon
Для справки, слева — иконка Kiro, Amazon’овского редактора кода со встроенным ИИ-ассистентом.

Есть догадки?
Ответ: Kiro, bee, lion = Kiro be lying, намек на то, что словам ИИ-бота не всегда можно доверять.

Мем выложил на одном из внутренних каналов Amazon в Slack, где с начала 2025 сильно выросло число фрустрированных тем, что руководство компании настаивает на внедрении ИИ в рабочие процессы. Сотрудники иронизируют над качеством работы Kiro, его шаблонными ответами и рейтингом активных пользователей ИИ — мы про него недавно рассказывали.

А у вас на работе требуют использовать ИИ? Как вы к этом относитесь?
😁43🔥1
В PostgreSQL 19 появятся подсказки для планировщика запросов
С этими ИИ-драмами (слышали, кстати, что к Fable 5 закрыли доступ?) мы упустили большую новость из мира данных. Новая версия PostgreSQL все ближе — даты релиза пока нет, но доступна бета и список изменений. И одно из самых интересных мы уже проспойлерили в заголовке.

Многие СУБД позволяют писать в запросах подсказки или хинты для планировщика, с помощью которых пользователь указывает ему, в каком порядке выполнять операции. В PostgreSQL этой функции нет, только расширения, которые ее добавляют — например, pg_hint_plan.

Долгое время это было принципиальной позицией разработчиков , которые считали, что подсказки усложняют поддержку и масштабирование, да и просто не нужны. По крайней мере, не нужны в том виде, в котором были реализованы в других проектах.

Но в PostgreSQL 19 наконец-то появятся модули pg_plan_advice и pg_stash_advice, добавляющие подсказки, лишенные недостатков других СУБД.
🔵Они находятся вне SQL-запросов и не засоряют собой код.
🔵Они подталкивают планировщик к определенным решениям из возможных, а не ведут строго по рельсам — то есть, пользователь не сможет написать подсказку, которая все поломает.
🔵Если подсказка устареет и начнет подталкивать к неудачным решениям, планировщик ее отключит.
🔵Можно попросить планировщик расписать, что он делает — он вернет описание текущего плана действий, который пользователь волен корректировать по своему усмотрению. Так будет проще и быстрее, чем писать с нуля.

Как вам такое обновление?
Please open Telegram to view this post
VIEW IN TELEGRAM
9🔥7
OpenAI считает убытки
ИИ денег почти никому не приносит— пока прибыль считает только Nvidia, а остальные просто ждут, когда он начнет окупаться. Но, кажется, OpenAI ждет этого момента с особым нетерпением.

🔜 В 2024 году чистый убыток компании составил 5 миллиардов долларов. В 2025 он вырос почти в 8 раз — 38 млрд, и это после корректировок, когда из первоначальной суммы в 60 млрд вычли убытки неконтролирующих акционеров.

20,92 млрд пришлись на операционные расходы, а прибыль составила 13,7 млрд.

Такая впечатляющая сумма получилась отчасти из-за расходов, связанных с прошедшей реструктуризацией, задачей которой было отойти от чисто научной деятельности и переключиться на бизнес и зарабатывание денег. В следующем году, когда появятся отчеты за 2026, узнаем, принесло ли это решение свои плоды.
Please open Telegram to view this post
VIEW IN TELEGRAM
3🤔3🌚3
Экологически чистый ИИ, полезный для здоровья
Подоспел ответ всем, кто ругает ИИ за вред природе, проблемы с безопасностью или раздувание финансового пузыря, который вот-вот лопнет. Это гаджет, который:
🔵Работает без интернета — ваши данные всегда остаются на устройстве:
🔵Покупается один раз и больше не требует никаких дополнительных платежей и подписок;
🔵Не вредит экологии и даже помогает пользователю сжигать калории.

Это — CrankGPT.

Выглядит как маленькая коробочка с ручкой. Задаете вопрос, крутите ручку примерно 30 секунд, получаете какой-нибудь ответ. Внутри коробочки Raspberry Pi 5, на который установлен голосовой агент с локальной моделькой, и генератор с ручным приводом.

Пока кто-то строит все новые и новые огромные дата-центры, кто-то делает CrankGPT. Только время покажет, за кем будущее.

Хотя если серьезно, то для подобных гаджетов — компактных, не зависящих от интернета и работающих 100% локально — вполне может найтись своя ниша. Правда, ручной привод — это фишка на любителя.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁154🔥3🙈1
Команда исследователей из ШАДа Яндекса ускорила работу графовых нейросетей
Приближается ICML — престижная международная конференция по машинному обучению, которая в этом году пройдет 6–11 июля в Корее. Статус Spotlight присваивают работам, получившим самые высокие оценки программного комитета. Одну из них написали преподаватели и студенты ШАД.

О чем статья?
Графовые нейросети — популярный класс моделей для работы со сложными взаимосвязанными данными: от транспортных сетей и биологических систем до рекомендательных систем и антифрод-решений.

Несмотря на высокое качество результатов и широкое применение на практике, такие модели плохо раскрывают потенциал современных GPU. Причина в том, что неструктурированная природа графовых данных приводит к нерегулярным обращениям к памяти. Из-за этого одна из ключевых операций графовых нейросетей — агрегация информации от соседей вершины в графе — часто ограничена не вычислительной мощностью устройства, а скоростью чтения и записи данных в память GPU.

Проблему усугубляет то, что архитектура GPU оптимизирована под регулярные вычисления, например операции с плотными матрицами (большим количеством ненулевых элементов). Поэтому даже использование более мощных ускорителей не всегда позволяет добиться существенного прироста производительности.

Команда предложила решение этой проблемы, разработав набор специализированных GPU-кернелов для популярных семейств графовых нейросетей. В них оптимизированы обращения к памяти, устранены лишние операции чтения и записи данных, а для части вычислений используются тензорные ядра, что дополнительно ускоряет работу на графах с высокой плотностью.

В результате авторам удалось ускорить выполнение отдельных операций до 10 раз и сократить пиковое потребление памяти до 70 раз.

🔜 Полный текст уже доступен на arXiv, а весь код — на GitHub.

Поздравляем авторов, а особенно студентов — такой результат и такой опыт точно пригодятся им в будущем. 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
15🔥12👍71
Что вас могут спросить на собеседовании про Postgres?
Полезный материал про PostgreSQL, для разнообразия — еще и на русском языке.

Статья рассказывает про основы, которые надо знать про эту СУБД, чтобы успешно пройти собеседование на должность джуниора и миддл-специалиста:
🔵SQL и базовые понятия вроде ACID, ключей, индексов;
🔵примеры практических заданий;
🔵план подготовки к собеседованию;
🔵ожидания интервьюер от ответа соискателя. То есть, что от вас могут хотеть услышать и какой глубины понимание вопроса от потребуется, чтобы произвести хорошее впечатление. Раздел «что говорить не надо» тоже есть, кстати.

Статья не поможет считерить и сойти за миддла, если вы только вчера узнали про Postgres, но поможет освежить знания и подготовиться, чтобы никакой каверзный вопрос не застал вас врасплох.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍64
Почувствуйте себя ОС
Как часто ваш компьютер тормозит на простейшей задаче и вы думаете: ну что опять, из-за чего ты на этот раз завис?

Теперь у вас есть шанс на себе прочувстовать на себе — каково это, управлять горой процессов и жонглировать ресурсами, чтобы успеть под каждую задачу выделить немного мощностей процессора.

🔜 Это игра, где вы выступаете в качестве ОС, У вас есть ядра процессора и несколько процессов. Ваша задача — распределять процессы между ядрами так, чтобы ни один не оставался без внимания слишком долго. Если они простаивают слишком долго, пользователь их убьет. Когда он убьет 10 процессов, он психанет и перезагрузит компьютер.

Надо еще учитывать то, что есть приоритетные процессы, которые надо «обработать» в первую очередь и заблокированные — на них, наоборот, лучше ресурсы не тратить, пока они не разблокируются.

В общем, может быть эта игра поможет не только убить время, но и стать немного терпимее к тормозам компьютера.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥31😱1😍1
Конкуренты Mythos
Пока Anthropic уговаривала правительство США открыть доступ к Fable 5, подоспели конкуренты.

🔵На прошлой неделе OpenAI рассказала про новую GPT‑5.6 в трех ипостасях: флагманская Sol, Terra для ежедневных задач и быстрая и доступная Luna. Из всех троих именно Sol называют главным конкурентом Mythos, которую она даже обходит по бенчмаркам.

🔵ИИ-стартап 360 из Китая представил Tulongfeng и Yitianzhen, а их коллеги из токийской компании Sakana AI — Fugu. Все три модели так же, как и их западные аналоги, заточены под решение задач, связанных с кибербезопасностью.

Представители Sakana AI сказали, что совпадение даты релиза их модели с трудностями у Anthropic было случайностью: они давно работали над этим продуктом, были уверены в его качестве и не собирались выезжать за счет чужих неудач. Зато основатель 360 назвал их ИИ, нацеленные на поиск уязвимостей в ПО, стратегическим национальным ресурсом и прямым ответом Mythos.

Кто следующий выпустит свою Mythos? Делаем ставки.
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚21❤‍🔥1😁1
Если не Github, то что?
С момента основания в 2008 GitHub стал так популярен, что сама технология Git прочно ассоциируется именно с этим сервисом.

Но в первой половине 2026 он чувствовал себя неважно — перебои в работе, наплыв ИИ-слопа и изменения тарифов привели к недовольству пользователей и громким угрозам уйти к конкурентам вроде таких. Но только куда уходить?

Отказаться от Github сложно, потому что это сервис, пусть и со своими недостатками, но привычный — все вокруг им пользуются и все проекты там лежат. Но если все-таки решите рассмотреть альтернативы, то сегодня наибольшей популярностью пользуются:
🔵 GitLab — главный конкурент GitHub, куда все переезжают, чтобы потом жаловаться на вездесущие и не всегда полезные ИИ-функции и раздутый сложный функционал;
🔵 Bitbucket — вариант для тех, кому важна интеграция с сервисами Atlassian (Jira и Confluence);
🔵 Gitea — а это для тех, кто хочет разместить хранилище в своей инфраструктуре;
🔵 ForgeJo и Codeberg — главные конкуренты GitHub среди независимых площадок. ForgeJo отпочковалась от Gitea, а потом на ее основе был создан Codeberg.

Есть и более экзотические варианты, например, китайская Gitee и российская GitFlic. У первой где-то есть англоязычная версия.

А что вы думаете про GitHub и его альтернативы?
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥1🌚1
Чудеса и ужасы детской ИИ-литературы
Когда вышла GPT-5, Сэм Альтман сказал, что она достигла уровня рассуждений человека со степенью доктора философии. С тех пор каждая следующая модель что от OpenAI, что от ее конкурентов, становилась только лучше. Последние получились такими умными, что в США их сочли угрозой безопасности.

Конечно же, такой выдающийся интеллект, эксперт в биологии, химии, программировании и кибербезопасности, без проблем сможет поделиться своими обширными знаниями, чтобы написать детскую энциклопедию? 👀

Как оказалось, хотя ИИ уже давно научился рисовать руки с правильным количеством пальцев, с анатомией у него все еще проблемы. И не только человеческой. И не только анатомией.

🔜 Amazon заполнен ИИ-литературой, в том числе — и для детей. У них яркие обложки и отличные рейтинги, хотя авторы отзывов иногда жалуются, что издания скучные и совсем без картинок — детям такое не нравится. Зато когда картинки в книгах есть, они буквально поражают воображение. Самые колоритные собрали в посте, остальные — в блоге автора, который купил один из бестселлеров в категории детских энциклопедий и поделился с общественностью.

У книги, кстати, тоже высокие оценки и всего 9 отзывов на 1 звезду, критикующих сомнительные иллюстрации.

Что скажете про такие книги? Надо их запрещать или это родителям надо быть внимательнее при покупке?
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🙈31