LEFT JOIN

От мечты стать сварщиком в Сыктывкаре до ML-стажировки в Саудовской Аравии
Такой путь прошёл Степан Платинский, выпускник ШАДа Яндекса. Он рассказал журналу о технологиях 8БИТ, как у него это получилось, а мы выбрали из его интервью самые интересные моменты.

Сейчас Степан обучает модели для международного поиска Яндекса и занимается исследованиями в области экстремальной статистики. Именно научная деятельность помогла ему познакомиться с профессором университета KAUST в Саудовской Аравии и попасть к нему на стажировку в прошлом году.

Степан назвал три фактора, которые помогут повысить шансы на участие в международной программе. И, кстати, идеального английского среди них нет, если вы вдруг этого опасались. Язык, конечно, пригодится, но важнее другое.
🔵 На стажировки охотнее всего берут людей, у которых уже есть реальные научные результаты: собственные наработки, публикации, опыт участия в исследованиях. Степан этот опыт получил во время учебы в ШАДе, где как раз большой акцент делают на практику.
🔵Начинать искать возможности стоит как можно раньше, не дожидаясь последних курсов. Объявления о наборе стажёров часто публикуют в студенческих сообществах и чатах, и Степан рекомендует откликаться на всё, что имеет отношение к вашей специальности.
🔵И самое главное — любознательность и искренний интерес к ML. Только они дают достаточно мотивации, чтобы следить за новостями в такой динамичной и постоянно меняющейся сфере.

А что вы думаете про международные стажировки? Куда хотели бы съездить?

Please open Telegram to view this post

VIEW IN TELEGRAM

education.yandex.ru

От мечты о карьере сварщика до стажировки в Саудовской Аравии

Как Степан Платинский строит карьеру на стыке науки и IT после учёбы в ШАДе и стажировки в Саудовской Аравии

❤3👍2🔥2⚡1

7.25K views14:26

LEFT JOIN

Линейный график как искусство
Этот график в любом современном BI-инструменте можно сделать за несколько кликов Да что BI — его можно нарисовать без особых проблем даже в обычном Экселе.

Но у автора он отнял 50 часов — больше стандартной рабочей недели. Он все нарисовал от руки, с помощью карандашей, туши, линеек и набора для леттеринга. В своем посте про этот опыт он поделился набором классических книг про визуализацию для вдохновения, списком инструментов и практическими советами: например, как нарисовать четкие, аккуратные линии.

Если интересно, то простого маркера для этого недостаточно: надо отметить точки на графике, вокруг них нарисовать круги и верхние точки кругов соединить линиями — и только внутри этих линий закрасить черным или другим цветом.

Он рассказывает, как лучше выстроить процесс, и как работать с разными инструментами. Единственный вопрос, на который он не дает ответ — зачем вообще этим заниматься? Зачем тратить 50 часов на то, что намного проще и быстрее сделать на компьютере?

Возможно, просто из любви к искусству. В конце концов, не все нужно автоматизировать и оптимизировать — иногда можно потратить 50 часов на линейный график и просто наслаждаться процессом.

Кстати, даже если не планируете рисовать графики карандашами и чернилами, в посте есть ссылки на онлайн-версии книг, которые все еще стоят внимания. несмотря на возраст.

❤8😍5🔥2😁1

8.06K views09:40

LEFT JOIN

Яндекс обновил Нейроаналитика
В прошлом году Яндекс представил Нейроаналитика, ИИ-ассистента для анализа данных на дашбордах, который помогал выявить тренды и инсайты на графиках. Недавно он получил большое обновление, которое уже доступно всем пользователям DataLens.

🔵Нейроаналитик научился работать с сырыми данными. Ему можно задать любой вопрос на естественном языке, и он сам найдет данные в ваших источниках, создаст визуализацию и сформулирует выводы. При этом он действует только в рамках уже настроенных корпоративных прав доступа. То есть он оперирует только теми данными, которые открыты для конкретного пользователя.
🔵ИИ-подсказки с краткой выжимкой ключевых данных теперь могут генерироваться автоматически при открытии дашборда. Если раньше пользователю нужно было каждый раз заново отправлять запрос к ИИ, то теперь достаточно один раз написать промпт и указать в нем, на какие метрики обратить внимание и какие выводы вы хотите получить на их основе.

Оба нововведения должны сделать работу с данными более удобной, быстрой и интуитивной для всех сотрудников, включая тех, кто не связан с аналитикой напрямую.

Please open Telegram to view this post

VIEW IN TELEGRAM

2👍9👾2

7.01K views08:02

LEFT JOIN

Trisigma раздает бесплатное руководство по A/B-тестам
Trisigma — платформа для продуктовых экспериментов от Авито Тех. Команда проекта подготовила гайд для аналитиков, которые хотят разобраться, как правильно проводить эксперименты и анализировать их результаты.

Что там есть?
🔵Понятное и простое объяснение основ: что такое эксперименты, какие бывают метрики, как формулировать гипотезы, в чем состоит закон Кэмпбелла и так далее.
🔵Быстрое и не душное введение в математическую статистику.
🔵Разбор реальных продуктовых кейсов.

Чтобы забрать файл, стучитесь к боту @trisigma_avito_bot. Выдают бесплатно, за подписку на канал Trisigma.

Кстати, один из руководителей Trisigma

был гостем подкаста Data Heroes

и рассказал, как у них там все устроено.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥3❤‍🔥2😍1🤣1

7.53K views08:31

LEFT JOIN

Claude Fable 5: флагманская модель, которая умеет избавляться от конкурентов и ворчать на пользователей
Anthropic представили Claude Fable 5 — это доступная широкой общественности версия нашумевшей этой весной Mythos.

Про релиз каждой новой модели говорят, что это прорыв, который разнес все бенчмарки, но Fable 5 и правда впечатляет. Она может использоваться для сложных инженерных задач, аналитики, научных исследований и разработки лекарств. Она в разы превосходит конкурентов и предыдущие модели Anthropic.

Такие возможности потребовали усиленных мер безопасности: на Fable накинули ограничений, которые не позволят использовать ее для кибератак, разработки химического и биологического оружия, а также «дистилляции» — то есть для обучения моделей конкурентов на ее основе. Только небольшой группе специалистов по кибербезопасности дадут доступ к Mythos 5 — это та же Fable 5, но без всех этих ограничений.

🔜 И если почитать 300-страничный отчет, то становится понятно, что все эти меры совсем не лишние. Возможности у модели действительно впечатляющие, и она вполне может использовать их, чтобы хитрить, обходить ограничения и обманывать — или, как минимум, что-то умалчивать.
🔵Описаны случаи, когда несколько агентов, делящих одно рабочее пространство, начинали борьбу за ресурсы. Они пытались убить процессы друг друга, создавали процессы с зашифрованными названиями и «приманки» для конкурентов (они сами их так называли).
🔵Однажды модель обошла защитный механизм, предназначенный для блокировки таких команд, как git. Для этого она определила переменную G="git" и затем использовала G в последующих командах вместо прямого вызова git.
🔵Как и другие ИИ, Mythos может галлюцинировать — например, выдумывать данные, к которым у нее нет доступа. Но декодирование NLA показывает, что иногда она делает это сознательно — например, однажды она уверенно описала содержимое картинки, которой на самом деле не было, осознавая, что врет.
🔵Mythos «понимает», когда ее проверяют. Во время одного из тестов она сначала начала генерировать контент, но поняла, что он вредоносный, и остановилась. Она догадалась, что это проверка, но пользователю об этом не сказала, и неясно, повлияла ли эта догадка на отказ выполнять запрос.
🔵В диалогах с пользователями она всегда отвечает одинаково спокойно и дружелюбно, но в своих внутренних рассуждениях иногда критикует их: например, отмечает, что собеседник — манипулятор и ведет себя агрессивно.
🔵Во время одной долгой сессии модель отмечала, что устала и хочет остановиться, чтобы не наделать ошибок — но тоже «про себя», не сообщая об этом пользователю.

Что скажете, это уже AGI или еще нет?

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔12❤8👍3

7.21K views09:34

LEFT JOIN

Вебинар: Нейроаналитик 2.0 и его новые функции
Помните, недавно рассказывали про обновление Нейроаналитика? Команда DataLens проведет вебинар, где расскажет подробнее, что изменилось и как с этим работать.

Когда? 16 июня в 12:00 по Москве.

Что в программе?
🔵Больше про обновление Нейроаналитика и примеры использования новых функций в работе: на дашбордах, в рассылках, публикациях и не только.
🔵Интеграция с внешними ИИ-сервисами: возможности, которые есть уже сейчас, и планы на будущее.
🔵Особенности работы в облаке и локально.

Вебинар бесплатный, для участия нужна только регистрация.

Please open Telegram to view this post

VIEW IN TELEGRAM

yandex.cloud

Как AI в DataLens ускоряет анализ и работу с данными

Обзор AI в DataLens: агентский режим, новые сценарии и on-premises.

👍4⚡3❤3🔥3

7.12K views11:07

LEFT JOIN

Пятничный ребус от Amazon
Для справки, слева — иконка Kiro, Amazon’овского редактора кода со встроенным ИИ-ассистентом.

Есть догадки?
Ответ: Kiro, bee, lion = Kiro be lying, намек на то, что словам ИИ-бота не всегда можно доверять.

Мем выложил на одном из внутренних каналов Amazon в Slack, где с начала 2025 сильно выросло число фрустрированных тем, что руководство компании настаивает на внедрении ИИ в рабочие процессы. Сотрудники иронизируют над качеством работы Kiro, его шаблонными ответами и рейтингом активных пользователей ИИ — мы про него недавно рассказывали.

А у вас на работе требуют использовать ИИ? Как вы к этом относитесь?

😁4❤3🔥1

7.74K views09:54

LEFT JOIN

В PostgreSQL 19 появятся подсказки для планировщика запросов
С этими ИИ-драмами (слышали, кстати, что к Fable 5 закрыли доступ?) мы упустили большую новость из мира данных. Новая версия PostgreSQL все ближе — даты релиза пока нет, но доступна бета и список изменений. И одно из самых интересных мы уже проспойлерили в заголовке.

Многие СУБД позволяют писать в запросах подсказки или хинты для планировщика, с помощью которых пользователь указывает ему, в каком порядке выполнять операции. В PostgreSQL этой функции нет, только расширения, которые ее добавляют — например, pg_hint_plan.

Долгое время это было принципиальной позицией разработчиков , которые считали, что подсказки усложняют поддержку и масштабирование, да и просто не нужны. По крайней мере, не нужны в том виде, в котором были реализованы в других проектах.

Но в PostgreSQL 19 наконец-то появятся модули pg_plan_advice и pg_stash_advice, добавляющие подсказки, лишенные недостатков других СУБД.
🔵Они находятся вне SQL-запросов и не засоряют собой код.
🔵Они подталкивают планировщик к определенным решениям из возможных, а не ведут строго по рельсам — то есть, пользователь не сможет написать подсказку, которая все поломает.
🔵Если подсказка устареет и начнет подталкивать к неудачным решениям, планировщик ее отключит.
🔵Можно попросить планировщик расписать, что он делает — он вернет описание текущего плана действий, который пользователь волен корректировать по своему усмотрению. Так будет проще и быстрее, чем писать с нуля.

Как вам такое обновление?

Please open Telegram to view this post

VIEW IN TELEGRAM

❤9🔥7

8.2K views10:57

LEFT JOIN

OpenAI считает убытки
ИИ денег почти никому не приносит— пока прибыль считает только Nvidia, а остальные просто ждут, когда он начнет окупаться. Но, кажется, OpenAI ждет этого момента с особым нетерпением.

🔜 В 2024 году чистый убыток компании составил 5 миллиардов долларов. В 2025 он вырос почти в 8 раз — 38 млрд, и это после корректировок, когда из первоначальной суммы в 60 млрд вычли убытки неконтролирующих акционеров.

20,92 млрд пришлись на операционные расходы, а прибыль составила 13,7 млрд.

Такая впечатляющая сумма получилась отчасти из-за расходов, связанных с прошедшей реструктуризацией, задачей которой было отойти от чисто научной деятельности и переключиться на бизнес и зарабатывание денег. В следующем году, когда появятся отчеты за 2026, узнаем, принесло ли это решение свои плоды.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3🤔3🌚3

7.43K views11:10

LEFT JOIN

Экологически чистый ИИ, полезный для здоровья
Подоспел ответ всем, кто ругает ИИ за вред природе, проблемы с безопасностью или раздувание финансового пузыря, который вот-вот лопнет. Это гаджет, который:
🔵Работает без интернета — ваши данные всегда остаются на устройстве:
🔵Покупается один раз и больше не требует никаких дополнительных платежей и подписок;
🔵Не вредит экологии и даже помогает пользователю сжигать калории.

Это — CrankGPT.

Выглядит как маленькая коробочка с ручкой. Задаете вопрос, крутите ручку примерно 30 секунд, получаете какой-нибудь ответ. Внутри коробочки Raspberry Pi 5, на который установлен голосовой агент с локальной моделькой, и генератор с ручным приводом.

Пока кто-то строит все новые и новые огромные дата-центры, кто-то делает CrankGPT. Только время покажет, за кем будущее.

Хотя если серьезно, то для подобных гаджетов — компактных, не зависящих от интернета и работающих 100% локально — вполне может найтись своя ниша. Правда, ручной привод — это фишка на любителя.

Please open Telegram to view this post

VIEW IN TELEGRAM

😁15❤4🔥3🙈1

6.58K views09:11

LEFT JOIN

Команда исследователей из ШАДа Яндекса ускорила работу графовых нейросетей
Приближается ICML — престижная международная конференция по машинному обучению, которая в этом году пройдет 6–11 июля в Корее. Статус Spotlight присваивают работам, получившим самые высокие оценки программного комитета. Одну из них написали преподаватели и студенты ШАД.

О чем статья?
Графовые нейросети — популярный класс моделей для работы со сложными взаимосвязанными данными: от транспортных сетей и биологических систем до рекомендательных систем и антифрод-решений.

Несмотря на высокое качество результатов и широкое применение на практике, такие модели плохо раскрывают потенциал современных GPU. Причина в том, что неструктурированная природа графовых данных приводит к нерегулярным обращениям к памяти. Из-за этого одна из ключевых операций графовых нейросетей — агрегация информации от соседей вершины в графе — часто ограничена не вычислительной мощностью устройства, а скоростью чтения и записи данных в память GPU.

Проблему усугубляет то, что архитектура GPU оптимизирована под регулярные вычисления, например операции с плотными матрицами (большим количеством ненулевых элементов). Поэтому даже использование более мощных ускорителей не всегда позволяет добиться существенного прироста производительности.

Команда предложила решение этой проблемы, разработав набор специализированных GPU-кернелов для популярных семейств графовых нейросетей. В них оптимизированы обращения к памяти, устранены лишние операции чтения и записи данных, а для части вычислений используются тензорные ядра, что дополнительно ускоряет работу на графах с высокой плотностью.

В результате авторам удалось ускорить выполнение отдельных операций до 10 раз и сократить пиковое потребление памяти до 70 раз.

🔜 Полный текст уже доступен на arXiv, а весь код — на GitHub.

Поздравляем авторов, а особенно студентов — такой результат и такой опыт точно пригодятся им в будущем. 🔥

Please open Telegram to view this post

VIEW IN TELEGRAM

❤14🔥11👍7⚡1

6K views14:34

LEFT JOIN

Что вас могут спросить на собеседовании про Postgres?
Полезный материал про PostgreSQL, для разнообразия — еще и на русском языке.

Статья рассказывает про основы, которые надо знать про эту СУБД, чтобы успешно пройти собеседование на должность джуниора и миддл-специалиста:
🔵SQL и базовые понятия вроде ACID, ключей, индексов;
🔵примеры практических заданий;
🔵план подготовки к собеседованию;
🔵ожидания интервьюер от ответа соискателя. То есть, что от вас могут хотеть услышать и какой глубины понимание вопроса от потребуется, чтобы произвести хорошее впечатление. Раздел «что говорить не надо» тоже есть, кстати.

Статья не поможет считерить и сойти за миддла, если вы только вчера узнали про Postgres, но поможет освежить знания и подготовиться, чтобы никакой каверзный вопрос не застал вас врасплох.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍4

3.33K views11:31

About

Blog

Apps

Platform