От мечты стать сварщиком в Сыктывкаре до ML-стажировки в Саудовской Аравии
Такой путь прошёл Степан Платинский, выпускник ШАДа Яндекса. Он рассказал журналу о технологиях 8БИТ, как у него это получилось, а мы выбрали из его интервью самые интересные моменты.
Сейчас Степан обучает модели для международного поиска Яндекса и занимается исследованиями в области экстремальной статистики. Именно научная деятельность помогла ему познакомиться с профессором университета KAUST в Саудовской Аравии и попасть к нему на стажировку в прошлом году.
Степан назвал три фактора, которые помогут повысить шансы на участие в международной программе. И, кстати, идеального английского среди них нет, если вы вдруг этого опасались. Язык, конечно, пригодится, но важнее другое.
🔵 На стажировки охотнее всего берут людей, у которых уже есть реальные научные результаты: собственные наработки, публикации, опыт участия в исследованиях. Степан этот опыт получил во время учебы в ШАДе, где как раз большой акцент делают на практику.
🔵 Начинать искать возможности стоит как можно раньше, не дожидаясь последних курсов. Объявления о наборе стажёров часто публикуют в студенческих сообществах и чатах, и Степан рекомендует откликаться на всё, что имеет отношение к вашей специальности.
🔵 И самое главное — любознательность и искренний интерес к ML. Только они дают достаточно мотивации, чтобы следить за новостями в такой динамичной и постоянно меняющейся сфере.
А что вы думаете про международные стажировки? Куда хотели бы съездить?
Такой путь прошёл Степан Платинский, выпускник ШАДа Яндекса. Он рассказал журналу о технологиях 8БИТ, как у него это получилось, а мы выбрали из его интервью самые интересные моменты.
Сейчас Степан обучает модели для международного поиска Яндекса и занимается исследованиями в области экстремальной статистики. Именно научная деятельность помогла ему познакомиться с профессором университета KAUST в Саудовской Аравии и попасть к нему на стажировку в прошлом году.
Степан назвал три фактора, которые помогут повысить шансы на участие в международной программе. И, кстати, идеального английского среди них нет, если вы вдруг этого опасались. Язык, конечно, пригодится, но важнее другое.
А что вы думаете про международные стажировки? Куда хотели бы съездить?
Please open Telegram to view this post
VIEW IN TELEGRAM
education.yandex.ru
От мечты о карьере сварщика до стажировки в Саудовской Аравии
Как Степан Платинский строит карьеру на стыке науки и IT после учёбы в ШАДе и стажировки в Саудовской Аравии
❤3👍2🔥2⚡1
Линейный график как искусство
Этот график в любом современном BI-инструменте можно сделать за несколько кликов Да что BI — его можно нарисовать без особых проблем даже в обычном Экселе.
Но у автора он отнял 50 часов — больше стандартной рабочей недели. Он все нарисовал от руки, с помощью карандашей, туши, линеек и набора для леттеринга. В своем посте про этот опыт он поделился набором классических книг про визуализацию для вдохновения, списком инструментов и практическими советами: например, как нарисовать четкие, аккуратные линии.
Если интересно, то простого маркера для этого недостаточно: надо отметить точки на графике, вокруг них нарисовать круги и верхние точки кругов соединить линиями — и только внутри этих линий закрасить черным или другим цветом.
Он рассказывает, как лучше выстроить процесс, и как работать с разными инструментами. Единственный вопрос, на который он не дает ответ — зачем вообще этим заниматься? Зачем тратить 50 часов на то, что намного проще и быстрее сделать на компьютере?
Возможно, просто из любви к искусству. В конце концов, не все нужно автоматизировать и оптимизировать — иногда можно потратить 50 часов на линейный график и просто наслаждаться процессом.
Кстати, даже если не планируете рисовать графики карандашами и чернилами, в посте есть ссылки на онлайн-версии книг, которые все еще стоят внимания. несмотря на возраст.
Этот график в любом современном BI-инструменте можно сделать за несколько кликов Да что BI — его можно нарисовать без особых проблем даже в обычном Экселе.
Но у автора он отнял 50 часов — больше стандартной рабочей недели. Он все нарисовал от руки, с помощью карандашей, туши, линеек и набора для леттеринга. В своем посте про этот опыт он поделился набором классических книг про визуализацию для вдохновения, списком инструментов и практическими советами: например, как нарисовать четкие, аккуратные линии.
Он рассказывает, как лучше выстроить процесс, и как работать с разными инструментами. Единственный вопрос, на который он не дает ответ — зачем вообще этим заниматься? Зачем тратить 50 часов на то, что намного проще и быстрее сделать на компьютере?
Возможно, просто из любви к искусству. В конце концов, не все нужно автоматизировать и оптимизировать — иногда можно потратить 50 часов на линейный график и просто наслаждаться процессом.
Кстати, даже если не планируете рисовать графики карандашами и чернилами, в посте есть ссылки на онлайн-версии книг, которые все еще стоят внимания. несмотря на возраст.
❤8😍5🔥2😁1
Яндекс обновил Нейроаналитика
В прошлом году Яндекс представил Нейроаналитика, ИИ-ассистента для анализа данных на дашбордах, который помогал выявить тренды и инсайты на графиках. Недавно он получил большое обновление, которое уже доступно всем пользователям DataLens.
🔵 Нейроаналитик научился работать с сырыми данными. Ему можно задать любой вопрос на естественном языке, и он сам найдет данные в ваших источниках, создаст визуализацию и сформулирует выводы. При этом он действует только в рамках уже настроенных корпоративных прав доступа. То есть он оперирует только теми данными, которые открыты для конкретного пользователя.
🔵 ИИ-подсказки с краткой выжимкой ключевых данных теперь могут генерироваться автоматически при открытии дашборда. Если раньше пользователю нужно было каждый раз заново отправлять запрос к ИИ, то теперь достаточно один раз написать промпт и указать в нем, на какие метрики обратить внимание и какие выводы вы хотите получить на их основе.
Оба нововведения должны сделать работу с данными более удобной, быстрой и интуитивной для всех сотрудников, включая тех, кто не связан с аналитикой напрямую.
В прошлом году Яндекс представил Нейроаналитика, ИИ-ассистента для анализа данных на дашбордах, который помогал выявить тренды и инсайты на графиках. Недавно он получил большое обновление, которое уже доступно всем пользователям DataLens.
Оба нововведения должны сделать работу с данными более удобной, быстрой и интуитивной для всех сотрудников, включая тех, кто не связан с аналитикой напрямую.
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍9👾2
Trisigma раздает бесплатное руководство по A/B-тестам
Trisigma — платформа для продуктовых экспериментов от Авито Тех. Команда проекта подготовила гайд для аналитиков, которые хотят разобраться, как правильно проводить эксперименты и анализировать их результаты.
Что там есть?
🔵 Понятное и простое объяснение основ: что такое эксперименты, какие бывают метрики, как формулировать гипотезы, в чем состоит закон Кэмпбелла и так далее.
🔵 Быстрое и не душное введение в математическую статистику.
🔵 Разбор реальных продуктовых кейсов.
Чтобы забрать файл, стучитесь к боту @trisigma_avito_bot. Выдают бесплатно, за подписку на канал Trisigma.
Кстати, один из руководителей Trisigma был гостем подкаста Data Heroes и рассказал, как у них там все устроено.
Trisigma — платформа для продуктовых экспериментов от Авито Тех. Команда проекта подготовила гайд для аналитиков, которые хотят разобраться, как правильно проводить эксперименты и анализировать их результаты.
Что там есть?
Чтобы забрать файл, стучитесь к боту @trisigma_avito_bot. Выдают бесплатно, за подписку на канал Trisigma.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤🔥2😍1🤣1
Claude Fable 5: флагманская модель, которая умеет избавляться от конкурентов и ворчать на пользователей
Anthropic представили Claude Fable 5 — это доступная широкой общественности версия нашумевшей этой весной Mythos.
Про релиз каждой новой модели говорят, что это прорыв, который разнес все бенчмарки, но Fable 5 и правда впечатляет. Она может использоваться для сложных инженерных задач, аналитики, научных исследований и разработки лекарств. Она в разы превосходит конкурентов и предыдущие модели Anthropic.
Такие возможности потребовали усиленных мер безопасности: на Fable накинули ограничений, которые не позволят использовать ее для кибератак, разработки химического и биологического оружия, а также «дистилляции» — то есть для обучения моделей конкурентов на ее основе. Только небольшой группе специалистов по кибербезопасности дадут доступ к Mythos 5 — это та же Fable 5, но без всех этих ограничений.
🔜 И если почитать 300-страничный отчет, то становится понятно, что все эти меры совсем не лишние. Возможности у модели действительно впечатляющие, и она вполне может использовать их, чтобы хитрить, обходить ограничения и обманывать — или, как минимум, что-то умалчивать.
🔵 Описаны случаи, когда несколько агентов, делящих одно рабочее пространство, начинали борьбу за ресурсы. Они пытались убить процессы друг друга, создавали процессы с зашифрованными названиями и «приманки» для конкурентов (они сами их так называли).
🔵 Однажды модель обошла защитный механизм, предназначенный для блокировки таких команд, как
🔵 Как и другие ИИ, Mythos может галлюцинировать — например, выдумывать данные, к которым у нее нет доступа. Но декодирование NLA показывает, что иногда она делает это сознательно — например, однажды она уверенно описала содержимое картинки, которой на самом деле не было, осознавая, что врет.
🔵 Mythos «понимает», когда ее проверяют. Во время одного из тестов она сначала начала генерировать контент, но поняла, что он вредоносный, и остановилась. Она догадалась, что это проверка, но пользователю об этом не сказала, и неясно, повлияла ли эта догадка на отказ выполнять запрос.
🔵 В диалогах с пользователями она всегда отвечает одинаково спокойно и дружелюбно, но в своих внутренних рассуждениях иногда критикует их: например, отмечает, что собеседник — манипулятор и ведет себя агрессивно.
🔵 Во время одной долгой сессии модель отмечала, что устала и хочет остановиться, чтобы не наделать ошибок — но тоже «про себя», не сообщая об этом пользователю.
Что скажете, это уже AGI или еще нет?
Anthropic представили Claude Fable 5 — это доступная широкой общественности версия нашумевшей этой весной Mythos.
Про релиз каждой новой модели говорят, что это прорыв, который разнес все бенчмарки, но Fable 5 и правда впечатляет. Она может использоваться для сложных инженерных задач, аналитики, научных исследований и разработки лекарств. Она в разы превосходит конкурентов и предыдущие модели Anthropic.
Такие возможности потребовали усиленных мер безопасности: на Fable накинули ограничений, которые не позволят использовать ее для кибератак, разработки химического и биологического оружия, а также «дистилляции» — то есть для обучения моделей конкурентов на ее основе. Только небольшой группе специалистов по кибербезопасности дадут доступ к Mythos 5 — это та же Fable 5, но без всех этих ограничений.
git. Для этого она определила переменную G="git" и затем использовала G в последующих командах вместо прямого вызова git.Что скажете, это уже AGI или еще нет?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔12❤8👍3
Вебинар: Нейроаналитик 2.0 и его новые функции
Помните, недавно рассказывали про обновление Нейроаналитика? Команда DataLens проведет вебинар, где расскажет подробнее, что изменилось и как с этим работать.
Когда? 16 июня в 12:00 по Москве.
Что в программе?
🔵 Больше про обновление Нейроаналитика и примеры использования новых функций в работе: на дашбордах, в рассылках, публикациях и не только.
🔵 Интеграция с внешними ИИ-сервисами: возможности, которые есть уже сейчас, и планы на будущее.
🔵 Особенности работы в облаке и локально.
Вебинар бесплатный, для участия нужна только регистрация.
Помните, недавно рассказывали про обновление Нейроаналитика? Команда DataLens проведет вебинар, где расскажет подробнее, что изменилось и как с этим работать.
Когда? 16 июня в 12:00 по Москве.
Что в программе?
Вебинар бесплатный, для участия нужна только регистрация.
Please open Telegram to view this post
VIEW IN TELEGRAM
yandex.cloud
Как AI в DataLens ускоряет анализ и работу с данными
Обзор AI в DataLens: агентский режим, новые сценарии и on-premises.
👍4⚡3❤3🔥3
Пятничный ребус от Amazon
Для справки, слева — иконка Kiro, Amazon’овского редактора кода со встроенным ИИ-ассистентом.
Есть догадки?
Ответ:Kiro, bee, lion = Kiro be lying, намек на то, что словам ИИ-бота не всегда можно доверять.
Мем выложил на одном из внутренних каналов Amazon в Slack, где с начала 2025 сильно выросло число фрустрированных тем, что руководство компании настаивает на внедрении ИИ в рабочие процессы. Сотрудники иронизируют над качеством работы Kiro, его шаблонными ответами и рейтингом активных пользователей ИИ — мы про него недавно рассказывали.
А у вас на работе требуют использовать ИИ? Как вы к этом относитесь?
Для справки, слева — иконка Kiro, Amazon’овского редактора кода со встроенным ИИ-ассистентом.
Есть догадки?
Ответ:
Мем выложил на одном из внутренних каналов Amazon в Slack, где с начала 2025 сильно выросло число фрустрированных тем, что руководство компании настаивает на внедрении ИИ в рабочие процессы. Сотрудники иронизируют над качеством работы Kiro, его шаблонными ответами и рейтингом активных пользователей ИИ — мы про него недавно рассказывали.
А у вас на работе требуют использовать ИИ? Как вы к этом относитесь?
😁4❤3🔥1
В PostgreSQL 19 появятся подсказки для планировщика запросов
С этими ИИ-драмами (слышали, кстати, что к Fable 5 закрыли доступ?) мы упустили большую новость из мира данных. Новая версия PostgreSQL все ближе — даты релиза пока нет, но доступна бета и список изменений. И одно из самых интересных мы уже проспойлерили в заголовке.
Многие СУБД позволяют писать в запросах подсказки или хинты для планировщика, с помощью которых пользователь указывает ему, в каком порядке выполнять операции. В PostgreSQL этой функции нет, только расширения, которые ее добавляют — например, pg_hint_plan.
Долгое время это было принципиальной позицией разработчиков , которые считали, что подсказки усложняют поддержку и масштабирование, да и просто не нужны. По крайней мере, не нужны в том виде, в котором были реализованы в других проектах.
Но в PostgreSQL 19 наконец-то появятся модули pg_plan_advice и pg_stash_advice, добавляющие подсказки, лишенные недостатков других СУБД.
🔵 Они находятся вне SQL-запросов и не засоряют собой код.
🔵 Они подталкивают планировщик к определенным решениям из возможных, а не ведут строго по рельсам — то есть, пользователь не сможет написать подсказку, которая все поломает.
🔵 Если подсказка устареет и начнет подталкивать к неудачным решениям, планировщик ее отключит.
🔵 Можно попросить планировщик расписать, что он делает — он вернет описание текущего плана действий, который пользователь волен корректировать по своему усмотрению. Так будет проще и быстрее, чем писать с нуля.
Как вам такое обновление?
С этими ИИ-драмами (слышали, кстати, что к Fable 5 закрыли доступ?) мы упустили большую новость из мира данных. Новая версия PostgreSQL все ближе — даты релиза пока нет, но доступна бета и список изменений. И одно из самых интересных мы уже проспойлерили в заголовке.
Многие СУБД позволяют писать в запросах подсказки или хинты для планировщика, с помощью которых пользователь указывает ему, в каком порядке выполнять операции. В PostgreSQL этой функции нет, только расширения, которые ее добавляют — например, pg_hint_plan.
Долгое время это было принципиальной позицией разработчиков , которые считали, что подсказки усложняют поддержку и масштабирование, да и просто не нужны. По крайней мере, не нужны в том виде, в котором были реализованы в других проектах.
Но в PostgreSQL 19 наконец-то появятся модули pg_plan_advice и pg_stash_advice, добавляющие подсказки, лишенные недостатков других СУБД.
Как вам такое обновление?
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9🔥7
OpenAI считает убытки
ИИ денег почти никому не приносит— пока прибыль считает только Nvidia, а остальные просто ждут, когда он начнет окупаться. Но, кажется, OpenAI ждет этого момента с особым нетерпением.
🔜 В 2024 году чистый убыток компании составил 5 миллиардов долларов. В 2025 он вырос почти в 8 раз — 38 млрд, и это после корректировок, когда из первоначальной суммы в 60 млрд вычли убытки неконтролирующих акционеров.
20,92 млрд пришлись на операционные расходы, а прибыль составила 13,7 млрд.
Такая впечатляющая сумма получилась отчасти из-за расходов, связанных с прошедшей реструктуризацией, задачей которой было отойти от чисто научной деятельности и переключиться на бизнес и зарабатывание денег. В следующем году, когда появятся отчеты за 2026, узнаем, принесло ли это решение свои плоды.
ИИ денег почти никому не приносит— пока прибыль считает только Nvidia, а остальные просто ждут, когда он начнет окупаться. Но, кажется, OpenAI ждет этого момента с особым нетерпением.
20,92 млрд пришлись на операционные расходы, а прибыль составила 13,7 млрд.
Такая впечатляющая сумма получилась отчасти из-за расходов, связанных с прошедшей реструктуризацией, задачей которой было отойти от чисто научной деятельности и переключиться на бизнес и зарабатывание денег. В следующем году, когда появятся отчеты за 2026, узнаем, принесло ли это решение свои плоды.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3🤔3🌚3
Экологически чистый ИИ, полезный для здоровья
Подоспел ответ всем, кто ругает ИИ за вред природе, проблемы с безопасностью или раздувание финансового пузыря, который вот-вот лопнет. Это гаджет, который:
🔵 Работает без интернета — ваши данные всегда остаются на устройстве:
🔵 Покупается один раз и больше не требует никаких дополнительных платежей и подписок;
🔵 Не вредит экологии и даже помогает пользователю сжигать калории.
Это — CrankGPT.
Выглядит как маленькая коробочка с ручкой. Задаете вопрос, крутите ручку примерно 30 секунд, получаете какой-нибудь ответ. Внутри коробочки Raspberry Pi 5, на который установлен голосовой агент с локальной моделькой, и генератор с ручным приводом.
Пока кто-то строит все новые и новые огромные дата-центры, кто-то делает CrankGPT. Только время покажет, за кем будущее.
Хотя если серьезно, то для подобных гаджетов — компактных, не зависящих от интернета и работающих 100% локально — вполне может найтись своя ниша. Правда, ручной привод — это фишка на любителя.
Подоспел ответ всем, кто ругает ИИ за вред природе, проблемы с безопасностью или раздувание финансового пузыря, который вот-вот лопнет. Это гаджет, который:
Это — CrankGPT.
Выглядит как маленькая коробочка с ручкой. Задаете вопрос, крутите ручку примерно 30 секунд, получаете какой-нибудь ответ. Внутри коробочки Raspberry Pi 5, на который установлен голосовой агент с локальной моделькой, и генератор с ручным приводом.
Пока кто-то строит все новые и новые огромные дата-центры, кто-то делает CrankGPT. Только время покажет, за кем будущее.
Хотя если серьезно, то для подобных гаджетов — компактных, не зависящих от интернета и работающих 100% локально — вполне может найтись своя ниша. Правда, ручной привод — это фишка на любителя.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁15❤4🔥3🙈1
Команда исследователей из ШАДа Яндекса ускорила работу графовых нейросетей
Приближается ICML — престижная международная конференция по машинному обучению, которая в этом году пройдет 6–11 июля в Корее. Статус Spotlight присваивают работам, получившим самые высокие оценки программного комитета. Одну из них написали преподаватели и студенты ШАД.
О чем статья?
Графовые нейросети — популярный класс моделей для работы со сложными взаимосвязанными данными: от транспортных сетей и биологических систем до рекомендательных систем и антифрод-решений.
Несмотря на высокое качество результатов и широкое применение на практике, такие модели плохо раскрывают потенциал современных GPU. Причина в том, что неструктурированная природа графовых данных приводит к нерегулярным обращениям к памяти. Из-за этого одна из ключевых операций графовых нейросетей — агрегация информации от соседей вершины в графе — часто ограничена не вычислительной мощностью устройства, а скоростью чтения и записи данных в память GPU.
Проблему усугубляет то, что архитектура GPU оптимизирована под регулярные вычисления, например операции с плотными матрицами (большим количеством ненулевых элементов). Поэтому даже использование более мощных ускорителей не всегда позволяет добиться существенного прироста производительности.
Команда предложила решение этой проблемы, разработав набор специализированных GPU-кернелов для популярных семейств графовых нейросетей. В них оптимизированы обращения к памяти, устранены лишние операции чтения и записи данных, а для части вычислений используются тензорные ядра, что дополнительно ускоряет работу на графах с высокой плотностью.
В результате авторам удалось ускорить выполнение отдельных операций до 10 раз и сократить пиковое потребление памяти до 70 раз.
🔜 Полный текст уже доступен на arXiv, а весь код — на GitHub.
Поздравляем авторов, а особенно студентов — такой результат и такой опыт точно пригодятся им в будущем.🔥
Приближается ICML — престижная международная конференция по машинному обучению, которая в этом году пройдет 6–11 июля в Корее. Статус Spotlight присваивают работам, получившим самые высокие оценки программного комитета. Одну из них написали преподаватели и студенты ШАД.
О чем статья?
Графовые нейросети — популярный класс моделей для работы со сложными взаимосвязанными данными: от транспортных сетей и биологических систем до рекомендательных систем и антифрод-решений.
Несмотря на высокое качество результатов и широкое применение на практике, такие модели плохо раскрывают потенциал современных GPU. Причина в том, что неструктурированная природа графовых данных приводит к нерегулярным обращениям к памяти. Из-за этого одна из ключевых операций графовых нейросетей — агрегация информации от соседей вершины в графе — часто ограничена не вычислительной мощностью устройства, а скоростью чтения и записи данных в память GPU.
Проблему усугубляет то, что архитектура GPU оптимизирована под регулярные вычисления, например операции с плотными матрицами (большим количеством ненулевых элементов). Поэтому даже использование более мощных ускорителей не всегда позволяет добиться существенного прироста производительности.
Команда предложила решение этой проблемы, разработав набор специализированных GPU-кернелов для популярных семейств графовых нейросетей. В них оптимизированы обращения к памяти, устранены лишние операции чтения и записи данных, а для части вычислений используются тензорные ядра, что дополнительно ускоряет работу на графах с высокой плотностью.
В результате авторам удалось ускорить выполнение отдельных операций до 10 раз и сократить пиковое потребление памяти до 70 раз.
Поздравляем авторов, а особенно студентов — такой результат и такой опыт точно пригодятся им в будущем.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14🔥11👍7⚡1
Что вас могут спросить на собеседовании про Postgres?
Полезный материал про PostgreSQL, для разнообразия — еще и на русском языке.
Статья рассказывает про основы, которые надо знать про эту СУБД, чтобы успешно пройти собеседование на должность джуниора и миддл-специалиста:
🔵 SQL и базовые понятия вроде ACID, ключей, индексов;
🔵 примеры практических заданий;
🔵 план подготовки к собеседованию;
🔵 ожидания интервьюер от ответа соискателя. То есть, что от вас могут хотеть услышать и какой глубины понимание вопроса от потребуется, чтобы произвести хорошее впечатление. Раздел «что говорить не надо» тоже есть, кстати.
Статья не поможет считерить и сойти за миддла, если вы только вчера узнали про Postgres, но поможет освежить знания и подготовиться, чтобы никакой каверзный вопрос не застал вас врасплох.
Полезный материал про PostgreSQL, для разнообразия — еще и на русском языке.
Статья рассказывает про основы, которые надо знать про эту СУБД, чтобы успешно пройти собеседование на должность джуниора и миддл-специалиста:
Статья не поможет считерить и сойти за миддла, если вы только вчера узнали про Postgres, но поможет освежить знания и подготовиться, чтобы никакой каверзный вопрос не застал вас врасплох.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍4