LEFT JOIN
43.4K subscribers
962 photos
29 videos
6 files
1.26K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Сколько денег приносит ИИ?
Amazon, Google, Microsoft и другие технокомпании вкладывают в ИИ огромные деньги: они выпускают все новые продукты на его основе и активно — иногда слишком — продвигают их среди клиентов и даже собственных сотрудников. Учитывая их рвение, может показаться, что это приносит им большие доходы, но, кажется, это не так. По крайней мере пока.

🔜 Здесь собрали данные о затратах и прибылях передовых ИИ-компаний: кроме уже упомянутых, там есть запрещенная в России Meta, Nvidia, OpenAI, Anthropic, Oracle, xAI, Mistral, Cohere и Deepseek.

В плюсе пока только Nvidia, которая с 2023 заработала на ИИ-чипах 253 миллиардов. Никто больше к таким результатам даже не приблизился, и в основном все в глубоком минусе.

Выглядит не очень, но стоит учитывать три фактора:
🔵На графиках только затраты и доходы, связанные с ИИ, а не финансовые показатели компании в целом. То есть Copilot не привел Microsoft к банкротству.
🔵Цифры приблизительные и основанные во многом на предположениях, оценках экспертов и слитых данных. Список источников внизу страницы.
🔵Многие денежные потоки в индустрии движутся по кругу: от Google в Anthropic, от Anthropic в Nvidia и от Nvidia в Google. Это тоже влияет на точность оценки прибыльности ИИ-проектов.

В любом случае, выглядят данные любопытно и доля правды в них точно есть. Отсюда вопрос: как думаете, когда ИИ начнет окупаться?
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Почти на каждом нашем проекте, как только мы заходим в Metabase, видим одну и ту же картину: дубли запросов, мертвые дашборды, SQL, в котором уже никто не разбирается. Раньше я лез разгребать это руками и тратил по несколько дней на один аудит.

В какой-то момент стало понятно, что эту работу можно автоматизировать. Начал собирать инструмент для себя, чтобы хотя бы первую инвентаризацию проводить без боли.

Так появился MetaLens.

Если честно, я не люблю называть его «ИИ-инструментом», это создаёт ожидание, что есть одна волшебная кнопка и всё чинится само. На деле это полноценный продукт, в основе которого модели Антропика, Metabase MCP и восемь ИИ-агентов, у каждого своя зона ответственности:
🔵X-Ray делает полный аудит проекта за 90 секунд
🔵Docs пишет документацию к запросам и дашбордам
🔵Catalog находит и архивирует устаревший контент
🔵Reviewer разбирает SQL на баги и плохие паттерны
🔵Chat отвечает на вопросы по данным на естественном языке
🔵Builder собирает дашборды в несколько кликов
🔵Metric Tree рисует карты метрик
🔵Gap подсказывает, каких отчетов не хватает

Конкретный пример из недавнего: маркетплейс на ранней стадии, 23 контрибьютора, 5 баз, 1798 запросов. MetaLens за 2 минуты нашел 94 группы дублей и 901 запрос, к которому уже год никто не обращался. Раньше такой аудит занимал у меня несколько дней.

Изначально это был внутренний инструмент Valiotti Data, но за пару месяцев он вырос в SaaS-платформу, к которой можно подключить и свой Metabase. Если интересно потрогать, зарегистрирвуйте аккаунт и оставьте комментарий, отгрузим 100 кредитов, чтобы спокойно прогнать все агенты на своем проекте.
Please open Telegram to view this post
VIEW IN TELEGRAM
12❤‍🔥1🤔1
Хогвартс против Хемингуэя
Tableau Public — удивительное место. Там можно найти как довольно стандартные, пусть и хорошо сделанные, дашборды с метриками и графиками, так и целые исследования, упакованные в интерактивные инфографики.

Например, одно из них посвящено изучению популярности книг разных жанров на сайте goodreads.com, где пользователи пишут отзывы на прочитанные книги и выставляют оценки по пятибалльной шкале. Автор взял самые популярные из них, у которых уже собралось больше миллиона оценок, и проанализировал их рейтинги.

Выяснилось несколько интересных фактов:
🔵Всего таких книг 210. 46 из них или 22% уже стали мировой классикой — среди них «Старик и море», «Ромео и Джульетта», «Властелин колец», «Одиссея» и другие громкие названия.
🔵При этом почти у 21 книги из этой категории оценки по меркам сайта ниже среднего.
🔵71 книга из 210 «миллионников» относится к современному фэнтези, и там вы найдете «Гарри Поттера» и «Сумерки». У них оценки среднем зачастую выше, чем у классики.

Автор приводит результаты исследований о возможных причинах такого перекоса — например, возраст наиболее активной части пользователей сайта и их возможную предвзятость к классике, которую в них силой запихивали в школе. В конце концов, оценка пользователя говорит не столько об объективном качестве текста, сколько о том, насколько она понравилась и запомнилось читателю. И как бы не был силен Хемингуэй, книжки про волшебников людям в основном заходят лучше.

В итоге получилось интересное чтение для вечера пятницы, инструмент, чтобы выбрать следующую книгу на почитать, и просто крутая визуализация, показывающая возможности Tableau.
Please open Telegram to view this post
VIEW IN TELEGRAM
6🔥2😍1
Два брата отняли работу у ИИ…
…но не ту, которую стоит отнимать.

Помните многочисленные истории про то, как очередной ИИ-агент удалил БД без возможности восстановления, а потом неискренне извинялся? Братья из США, видимо, тоже слышали, и решили, что и сам так могут — и даже доказали на деле.

🔜 В 2015 за участие кибермошеннической схеме Муниб и Сохаиб Ахтер получили 3 и 2 года тюрьмы соответственно. Какое-то время им удавалось скрывать этот факт от работодателей — настолько успешно, что они даже смогли устроиться в Opexus, ИТ-компанию, обслуживающую американские государственные ведомства. Правда, длилось это недолго: один пришел в 2023 году, второй в 2024, а уволили их обоих 18 февраля 2025, когда вскрылось преступное прошлое и новые грешки на текущем месте.

Эту новость им сообщили на звонке в Microsoft Teams в 16:48. Уже в 16:55 Сохаиб попытался, но не смог зайти в свой рабочий аккаунт. Его брат оказался предусмотрительнее: он позаботился о доступе к данным еще до звонка. В течение следующего часа он снес 96 баз с государственными данными, скачал 1805 файлов Комиссии по равным условиям для трудоустройства США и налоговые данные как минимум 450 человек.

Любопытно, что они случайно записали свой разговор во время совершения преступления.

Дальше события развивались предсказуемо: в марте 2025 к братьям пришли с обыском, в апреле 2026 Муниб признал вину сам, а в мае его брата признал виновным суд жюри. Сейчас Муниб пишет от руки письма с просьбой пересмотреть обвинение, а Сохаиб ждет приговора, который должны вынести в сентябре.

🔜Получилась поучительная история по то, что несмотря на стремительное развитие технологий, главной угрозой для кибербезопасности остается человеческий фактор: невнимательность рекрутеров и СБ, наплевательский подход к кибербезопасности и мстительность уволенных сотрудников.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁52🔥2
От мечты стать сварщиком в Сыктывкаре до ML-стажировки в Саудовской Аравии
Такой путь прошёл Степан Платинский, выпускник ШАДа Яндекса. Он рассказал журналу о технологиях 8БИТ, как у него это получилось, а мы выбрали из его интервью самые интересные моменты.

Сейчас Степан обучает модели для международного поиска Яндекса и занимается исследованиями в области экстремальной статистики. Именно научная деятельность помогла ему познакомиться с профессором университета KAUST в Саудовской Аравии и попасть к нему на стажировку в прошлом году.

Степан назвал три фактора, которые помогут повысить шансы на участие в международной программе. И, кстати, идеального английского среди них нет, если вы вдруг этого опасались. Язык, конечно, пригодится, но важнее другое.
🔵 На стажировки охотнее всего берут людей, у которых уже есть реальные научные результаты: собственные наработки, публикации, опыт участия в исследованиях. Степан этот опыт получил во время учебы в ШАДе, где как раз большой акцент делают на практику.
🔵Начинать искать возможности стоит как можно раньше, не дожидаясь последних курсов. Объявления о наборе стажёров часто публикуют в студенческих сообществах и чатах, и Степан рекомендует откликаться на всё, что имеет отношение к вашей специальности.
🔵И самое главное — любознательность и искренний интерес к ML. Только они дают достаточно мотивации, чтобы следить за новостями в такой динамичной и постоянно меняющейся сфере.

А что вы думаете про международные стажировки? Куда хотели бы съездить?
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍2🔥21
Линейный график как искусство
Этот график в любом современном BI-инструменте можно сделать за несколько кликов Да что BI — его можно нарисовать без особых проблем даже в обычном Экселе.

Но у автора он отнял 50 часов — больше стандартной рабочей недели. Он все нарисовал от руки, с помощью карандашей, туши, линеек и набора для леттеринга. В своем посте про этот опыт он поделился набором классических книг про визуализацию для вдохновения, списком инструментов и практическими советами: например, как нарисовать четкие, аккуратные линии.

Если интересно, то простого маркера для этого недостаточно: надо отметить точки на графике, вокруг них нарисовать круги и верхние точки кругов соединить линиями — и только внутри этих линий закрасить черным или другим цветом.

Он рассказывает, как лучше выстроить процесс, и как работать с разными инструментами. Единственный вопрос, на который он не дает ответ — зачем вообще этим заниматься? Зачем тратить 50 часов на то, что намного проще и быстрее сделать на компьютере?

Возможно, просто из любви к искусству. В конце концов, не все нужно автоматизировать и оптимизировать — иногда можно потратить 50 часов на линейный график и просто наслаждаться процессом.

Кстати, даже если не планируете рисовать графики карандашами и чернилами, в посте есть ссылки на онлайн-версии книг, которые все еще стоят внимания. несмотря на возраст.
7😍5🔥2😁1
Яндекс обновил Нейроаналитика
В прошлом году Яндекс представил Нейроаналитика, ИИ-ассистента для анализа данных на дашбордах, который помогал выявить тренды и инсайты на графиках. Недавно он получил большое обновление, которое уже доступно всем пользователям DataLens.

🔵Нейроаналитик научился работать с сырыми данными. Ему можно задать любой вопрос на естественном языке, и он сам найдет данные в ваших источниках, создаст визуализацию и сформулирует выводы. При этом он действует только в рамках уже настроенных корпоративных прав доступа. То есть он оперирует только теми данными, которые открыты для конкретного пользователя.
🔵ИИ-подсказки с краткой выжимкой ключевых данных теперь могут генерироваться автоматически при открытии дашборда. Если раньше пользователю нужно было каждый раз заново отправлять запрос к ИИ, то теперь достаточно один раз написать промпт и указать в нем, на какие метрики обратить внимание и какие выводы вы хотите получить на их основе.

Оба нововведения должны сделать работу с данными более удобной, быстрой и интуитивной для всех сотрудников, включая тех, кто не связан с аналитикой напрямую.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9👾2
Trisigma раздает бесплатное руководство по A/B-тестам
Trisigma — платформа для продуктовых экспериментов от Авито Тех. Команда проекта подготовила гайд для аналитиков, которые хотят разобраться, как правильно проводить эксперименты и анализировать их результаты.

Что там есть?
🔵Понятное и простое объяснение основ: что такое эксперименты, какие бывают метрики, как формулировать гипотезы, в чем состоит закон Кэмпбелла и так далее.
🔵Быстрое и не душное введение в математическую статистику.
🔵Разбор реальных продуктовых кейсов.

Чтобы забрать файл, стучитесь к боту @trisigma_avito_bot. Выдают бесплатно, за подписку на канал Trisigma.

Кстати, один из руководителей Trisigma был гостем подкаста Data Heroes и рассказал, как у них там все устроено.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3❤‍🔥2😍1🤣1
Claude Fable 5: флагманская модель, которая умеет избавляться от конкурентов и ворчать на пользователей
Anthropic представили Claude Fable 5 — это доступная широкой общественности версия нашумевшей этой весной Mythos.

Про релиз каждой новой модели говорят, что это прорыв, который разнес все бенчмарки, но Fable 5 и правда впечатляет. Она может использоваться для сложных инженерных задач, аналитики, научных исследований и разработки лекарств. Она в разы превосходит конкурентов и предыдущие модели Anthropic.

Такие возможности потребовали усиленных мер безопасности: на Fable накинули ограничений, которые не позволят использовать ее для кибератак, разработки химического и биологического оружия, а также «дистилляции» — то есть для обучения моделей конкурентов на ее основе. Только небольшой группе специалистов по кибербезопасности дадут доступ к Mythos 5 — это та же Fable 5, но без всех этих ограничений.

🔜 И если почитать 300-страничный отчет, то становится понятно, что все эти меры совсем не лишние. Возможности у модели действительно впечатляющие, и она вполне может использовать их, чтобы хитрить, обходить ограничения и обманывать — или, как минимум, что-то умалчивать.
🔵Описаны случаи, когда несколько агентов, делящих одно рабочее пространство, начинали борьбу за ресурсы. Они пытались убить процессы друг друга, создавали процессы с зашифрованными названиями и «приманки» для конкурентов (они сами их так называли).
🔵Однажды модель обошла защитный механизм, предназначенный для блокировки таких команд, как git. Для этого она определила переменную G="git" и затем использовала G в последующих командах вместо прямого вызова git.
🔵Как и другие ИИ, Mythos может галлюцинировать — например, выдумывать данные, к которым у нее нет доступа. Но декодирование NLA показывает, что иногда она делает это сознательно — например, однажды она уверенно описала содержимое картинки, которой на самом деле не было, осознавая, что врет.
🔵Mythos «понимает», когда ее проверяют. Во время одного из тестов она сначала начала генерировать контент, но поняла, что он вредоносный, и остановилась. Она догадалась, что это проверка, но пользователю об этом не сказала, и неясно, повлияла ли эта догадка на отказ выполнять запрос.
🔵В диалогах с пользователями она всегда отвечает одинаково спокойно и дружелюбно, но в своих внутренних рассуждениях иногда критикует их: например, отмечает, что собеседник — манипулятор и ведет себя агрессивно.
🔵Во время одной долгой сессии модель отмечала, что устала и хочет остановиться, чтобы не наделать ошибок — но тоже «про себя», не сообщая об этом пользователю.

Что скажете, это уже AGI или еще нет?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔117👍2
Вебинар: Нейроаналитик 2.0 и его новые функции
Помните, недавно рассказывали про обновление Нейроаналитика? Команда DataLens проведет вебинар, где расскажет подробнее, что изменилось и как с этим работать.

Когда? 16 июня в 12:00 по Москве.

Что в программе?

🔵Больше про обновление Нейроаналитика и примеры использования новых функций в работе: на дашбордах, в рассылках, публикациях и не только.
🔵Интеграция с внешними ИИ-сервисами: возможности, которые есть уже сейчас, и планы на будущее.
🔵Особенности работы в облаке и локально.

Вебинар бесплатный, для участия нужна только регистрация.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥31
Пятничный ребус от Amazon
Для справки, слева — иконка Kiro, Amazon’овского редактора кода со встроенным ИИ-ассистентом.

Есть догадки?
Ответ: Kiro, bee, lion = Kiro be lying, намек на то, что словам ИИ-бота не всегда можно доверять.

Мем выложил на одном из внутренних каналов Amazon в Slack, где с начала 2025 сильно выросло число фрустрированных тем, что руководство компании настаивает на внедрении ИИ в рабочие процессы. Сотрудники иронизируют над качеством работы Kiro, его шаблонными ответами и рейтингом активных пользователей ИИ — мы про него недавно рассказывали.

А у вас на работе требуют использовать ИИ? Как вы к этом относитесь?
😁31🔥1