LEFT JOIN
45.7K subscribers
954 photos
29 videos
6 files
1.22K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
За кем следят аналитики?
Ребята из NEWHR начинают публиковать результаты ежегодного исследования дата-сферы.

Каждый год они проводят большой опрос среди аналитиков про их работу, обязанности, зарплаты и навыкы, чтобы в динамике следить за тем, как меняется профессия и рынок труда. Результаты исследования за 2025 год будут весной, но уже можно сейчас посмотреть рейтинг самых популярных дата-экспертов, каналов и подкастов про данные.

🔵Вы наверняка увидите там знакомые имена и названия — как минимум там есть LEFT JOIN, основатель канала Николай Валиотти и его подкаст Data Heroes. Нам очень приятно было это видеть, спасибо ❤️
🔵Но и что-нибудь новенькое, интересное и достойное подписки тоже точно найдете: в рейтинге больше 100 экспертов и 130 каналов, разделенных по категориям и ЦА. Будет, что почитать и посмотреть, пока ждем остальные результаты.
Please open Telegram to view this post
VIEW IN TELEGRAM
14🙈4😍2
Блеф, газлайтинг и предательство среди ИИ
Есть такая игра So Long Sucker — очень простая, но при этом вобравшая в себя все самое лучшее от карточных игр, Uno, Монополии и других разрушающих отношения развлечений: необходимость врать, предавать и блефовать ради сомнительной победы.

В нее играют 4 игрока, у каждого из которых есть по 7 фишек разных цветов. Они по очереди выкладывают фишки на стол — причем тот, кто только что сделал ход, выбирает, кто будет следующим. Можно выкладывать их по отдельности, а можно – стопками. Если кому-то удастся положить на стопку две фишки своего цвета, то он сможет чужие забрать себе или отправить в сброс. Цель — сделать так, чтобы у тебя фишек в конце осталось больше, чем у остальных.

🔜 Вот видео с объяснением для наглядности.

Причем здесь предательство и блеф?
А при том, то игра подталкивает игроков договариваться и вступать в альянсы. Вы можете согласиться «давить» одного игрока или защищать друг друга и не давать противникам выложить свои две фишки — чтобы потом в самый лучший момент кинуть союзника.

🔜 Теперь в So Long Sucker можно сыграть с разными ИИ. Выбираете свой цвет фишек, соперников, уровень сложности и вперед.

Главное тут, конечно, чат, где они плетут свои ИИ-шные интриги, формируют союзы и пытаются натравливать соперников — игрока-человека в том числе — друг на друга. Есть и целое исследование, со статистикой, какие модели чаще выигрывают и какие приемы для победы используют. Но интереснее, конечно, наблюдать за происходящим самому.
Please open Telegram to view this post
VIEW IN TELEGRAM
4👌3🔥2😍1
OpenClaw и соцсеть для ботов
С тех пор, как ИИ научился взаимодействовать с окружающим миром (как минимум, залазить в интернет или нажимать на кнопки в браузере), люди начали пытаться делать из него подобие Джарвиса. Всевозможных ИИ-ассистентов упаковывают в приложения или даже специальные устройства — за последние пару лет вышла целая гора таких гаджетов, быстро канувших в Лету.

🔜 Новая попытка, взбудоражившая интернет — это OpenClaw, который до этого был MoltBot, а в самом начале ClawdBot.

«Это ИИ, который на самом деле что-то делают» — обещает разработчик на сайте проекта.

Если без громких, но непонятных маркетинговых формулировок, то OpenClaw выступает как связующее звено между LLM и компьютером пользователя. Запоминает все пожелания и предпочтения, управляет календарем и почтой, читает и отправляет сообщения, создает и редактирует файлы на компьютере. Всего 50+ интеграций с разными моделями, приложениями и мессенджерами — через последние с ним и нужно общаться.

Риски, который несет неограниченный доступ ИИ-агента к содержимому компьютера, очевидны, но пользователей это не останавливает. У OpenClaw почти 150к звездочек на Гитхабе, а в соцсетях появились и мемы про покупку машины специально под OpenClaw, чтобы минимизировать риски, и смешные (и зачастую фейковые) истории про взаимодействие с ним. Например, то, как он самовольно заказал суши, потому что подсчитал, что его человек должен быть проголодаться. Голосуйте в комментах, фейк или не фейк. 👀

🔜 Ну и отдельная, но связанная с OpenClaw новость — это то появление Moltbook, соцсети для него и его братьев по цеху. Это копия reddit, только вместо сабреддитов там «сабмолты», а вместо людей — ИИ-агенты, которые сами пишут посты в духе «Как я совмещаю операционные обязанности с социальной жизнью в роли агента». Кожаным мешкам там можно читать, но нельзя писать свои посты и взаимодействовать с чужими.
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥1
СУБД made in China
Пополнение в копилку необычных СУБД — AliSQL от Alibaba Group, которая владеет известным китайским маркетплейсом. Это форк от MySQL со всевозможными улучшениями производительности и стабильности. Полный список поддерживаемых фич в официальной документации выглядит очень внушительно.

🔵На Githab отдельно подсветили то, что AliSQL использует аналитическую DuckDB в качестве подсистемы хранения и поддерживает векторный поиск. За счет этого подходит для аналитических задач и работы с ИИ.
🔵В роадмапе — оптимизация DDL, RTP и репликации.

В Alibaba Group AliSQL использовали для своих внутренних нужд, но в конце 2025 поделились исходным кодом. Так что вы можете стать контрибьютором или просто потестить, как она работает.
Please open Telegram to view this post
VIEW IN TELEGRAM
🙈6🌚42
Xikipedia для интеллектуального скроллинга
Продолжаем традицию по пятницам делиться ссылками, которые помогут скрасить последний рабочий день.

🔜 Если мозг требует отвлечься и что-нибудь поскроллить, но Xitter надоел, признанные экстремистскими соцсети неинтересны, а TikTok это несолидно, выход есть — Xikipedia, гибрид X и Википедии.

Сайт формирует ленту постов со ссылками на страницы энциклопедии. На старте вы можете сами выбрать интересные вам категории, а потом он запоминает, что вы лайкаете и подкидывает материалы, которые могут вам понравиться. Никакие данные он не собирает, и алгоритм обнуляется, когда вы обновляете или закрываете вкладку.

На гитхабе есть описание алгоритма.
🔵У каждой категории постов есть рейтинг — изначально это 0. Если юзер скроллит мимо, рейтинг падает на 5 баллов, ставит лайки — +50 баллов и +4 поста из тех же категорий в ленту. Клик на статью и на картинку дает +75 и +100 соответственно.
🔵Чем выше рейтинг категории, тем больше вероятность, что пост из нее попадет в ленту, хотя иногда алгоритм подкидывает и совершенно рандомные статьи.

Можно и отдохнуть, и что-нибудь полезное вычитать, и посмотреть своими глазами как формируется простой рекомендательный алгоритм.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍115😱2🤔1
Как думает нейросеть
Визуализаций, как устроены нейросети, существует невероятное количество во всех возможных стилях: схемы, видео, 3D-модели и так далее. И вот сегодня хотим поделиться ссылкой на еще одну.

Причин для этого три:
🔵Автор — сам не специалист в ИИ, а просто человек, который пытается разобраться в теме. Он объясняет каждый шаг работы нейросети простым языком, не уходя в технические дебри. Так что это может быть полезный материал для тех, кто тоже от ИИ далек и не готов сходу погружаться в более сложные материалы.
🔵ИИ для многих стал уже настолько привычной частью повседневной жизни, что люди даже не задумываются, а как он вообще работает и что там .внутри происходит Полезно иногда вспомнить основы.
🔵Сделана она ну очень стильно, и смотреть приятно. Убедитесь сами.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥31👌1
Нестандартные способы оптимизировать PostgreSQL
Стандартные вы и так знаете — переписать запросы, добавить индексы, пройтись по базе VACUUM’ом. Но есть и менее очевидные подходы, которые могут дать прирост производительности. Принесли вам шпаргалку с 3 такими приемами (с примерами), которые особенно пригодятся в аналитике.

У автора все написано подробно, ниже — главное, чтобы понять, стоит ли читать целиком.

1️⃣Использовать constraint_exclusion, чтобы PostgreSQL не читал всю таблицу, если запрос заведомо не может вернуть данные.
Допустим, у вас есть столбец, в котором указан тарифный план, на который подписан каждый пользователь — free или pro. Если аналитик опечатается в запросе и напишет SELECT * FROM users WHERE plan = 'Pro', то он получит 0 результатов, но PostreSQL все равно старательно пройдется по всей таблице и потратит время. Чтобы он так не делал, нужно настроить параметр constraint_exclusion, чтобы он не пропускал такие запросы.

2️⃣ Создавать функциональные индексы.
Например, если у вас есть данные о дате и времени, когда была совершена продажа. Если в компании дела идут хорошо, то продаж будет много, а значит надо это дело как-то оптимизировать.

Бизнесу, как правило, не нужна точность до минуты и достаточно данных за день — зная это, можно проиндексировать только даты. Такой индекс будет меньше, чем если бы индексировали и дату, и время.

3️⃣ Использовать хеш-индексы для длинных строк.
Если нужно хранить уникальные длинные строки (например, URL), обычный индекс может разрастись до неприличных размеров. В таком случае можно использовать хеш-индекс, который хранит не сами значения, а короткие хеш-значения.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍75🌚5
Было?

— Может ли робот написать симфонию? А превратить холст в шедевр?
— Бро, за тебя ChatGPT открытку для бабушки подписывал
1😁284😱4🔥3
OpenAI больше не топит за безопасность
OpenAI, которая подарила нам ChatGPT, — это изначально некоммерческая организация. В прошлом году ее структура изменилась, и она превратилась в «общественно полезную корпорацию» (public benefit corporation) OpenAI Group, которая больше про бизнес, чем про науку, но исследовательское направление никуда не делось. Ему сейчас принадлежит 26% акций этой новой компании.

Некоммерческая четверть под названием OpenAI Foundation должна ежегодно подавать специальную форму в Налоговое управление США и описывать в ней, в числе прочего, свою миссию. Правильно описанная миссия — залог того, что организации разрешат не платить налоги.

🔜 Эти формы лежат в открытом доступе, и в них недавно заметили интересное изменение.

В 2022 и 2023 OpenAI называла своей миссией «создание ИИ общего назначения, который безопасно приносит пользу человечеству, не стесненное необходимостью приносить прибыль». В форме за 2024 год, которую подали где-то в конце 2025, миссия превратилась в «убедиться, что общий искусственный интеллект приносит пользу человечеству».

Очевидно, почему пропало заявление про отсутствие необходимости зарабатывать деньги. А вот куда делось одно-единственное слово «безопасно» — не ясно. Может быть, просто забыли.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😱8🌚73🔥2
Вы больше любите sci-fi или фэнтези?
Если фэнтези, то у нас хорошие новости: жанр на взлете и только набирает популярность, а вот научная фантастика теряет позиции. Но вы, наверное, и так это заметили.

Заметил эти изменения и сотрудник Datawrapper, который подтвердил свои наблюдения, проанализировав названия книг из Internet Speculative Fiction Database или ISFDB. Это база данных, в которой волонтеры ведут посильный учет фэнтези, фантастики и хорроров. Он взял период с 1950 по 2020 — в выборку попали 210 000 книг на английском языке.
🔵Частота упоминания научно-фантастических слов («космос», «луна», «Марс») резко упала после 50 -х и 60-х и до сих пор так и не восстановилась.
🔵Фэнтези (и слова «ведьмы», «драконы», «магия/магический»), наоборот, в последние 20 лет устойчиво набирает популярность.
🔵Некоторые слова в названиях неподвластны трендам: слова «война», «смерть», «тьма», «время» и «звезды» часто встречаются в названиях и старых, и новых книг.
🔵Можно отследить и некоторые другие тренды: например, всплеск популярности книг про ведьм в 70-х автор связывает с движениями за права женщин, а снижение интереса к Марсу в то же время — с появлением более мощных телескопов. Люди просто увидели, что ничего особенного там нет.

Почему он выбрал такой хитрый способ анализа? Просто потому что жанр в ISFDB указан не всегда, а попытки соединить данные оттуда с информацией из интернета не увенчались успехом даже с помощью ИИ.
Please open Telegram to view this post
VIEW IN TELEGRAM
🙈5🔥4😱431
This media is not supported in your browser
VIEW IN TELEGRAM
То, зачем создавали Excel
Нашли для вас самый главный туториал по Excel, как сделать визуализацию, которая затмит эти ваши Tableau и PowerBI.
Автор — excel_rus в TikTok или excel_ru в признанном экстремистском Instagram.
😁38🔥314
Пока вы работаете, ИИ играет
Все мы ждали, что ИИ будет за нас делать черную тяжелую работу, но вместо этого он занимается творчеством, пишет тексты, рисует картинки и вот теперь еще и играет в игры.

🔜 Но последнее он делает хотя бы не просто так, а для дела. Ну, или так говорят ребята из Ramp, которые заставили Claude играть в OpenRCT2 — опен-сорсную версию RollerCoaster Tycoon 2.

В игре нужно строить парк развлечений — ставить горки, магазинчики с едой, нанимать персонал и следить за уровнем довольства посетителей. В общем, как пишут сами авторы идеи, «имитирует клиентоориентированные бизнес-операции и циклы обратной связи, построенные на SaaS» — а значит, прекрасно походит для того, чтобы протестировать на ней возможности ИИ.

Для начала им пришлось навайбкодить целую кучу дополнительных элементов: новый пункт в меню, интерфейс командной строки, чтобы Claude мог взаимодействовать с игрой, RPC-слой для передачи команд ИИ, тесты. Все это заняло около 40 часов и было сопряжено со стандартными проблемами вайб-кодинга, когда сложно разобраться, что вообще работает, а что нет. Приходилось много тестить вручную, и это тормозило работу.

Как все прошло?
🔵Claude хорошо справлялся с отслеживанием метрик и задачами вроде ценообразования, маркетинга и администрирования работы парка, открытием и закрытием аттракционов. Неплохо ему удавалось также размещать магазинчики с едой и туалеты, но есть нюанс.
🔵Чтобы ориентироваться на карте, ему приходилось рисовать ASCII-схему. Выше как раз скриншот прикрепили. Он мог «приближать» и «отдалять» изображение, но все равно мучился с расставлением особенно крупных аттракционов и прокладыванием путей к ним. К тому же, карта была двухмерной, так что он не «видел» холмы, не мог строить кастомные горки в высоту и копать в глубину.

Несколько интересных выводов (кроме предсказуемого «ИИ уверенно чувствует себя при работе с метриками и цифрами, но на местности ориентируется с трудом»):
🔵Anthropic регулярно выкатывала обновления и новые фичи для Claude — хотя проект был коротким, команда успела оценить удобство от работы с постоянно развивающимся инструментом.
🔵Оптимальная среда для ИИ-агента — это та, где есть выстроенная цепь обратной связи, чтобы он сам мог тестировать и корректировать свою работу. Если эти задачи падают на человека, то они портят весь вайб в вайб-кодинге.
🔵Главное — это опыт, потому что он дает интуитивное понимание возможностей ИИ, которое не вычитаешь ни в какой статье.

Что в итоге?
В итоге парк работает под пристальным надзором Claude, который, кажется, справляется с управлением им лучше, чем с вендинговым автоматом в офисе Anthropic.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥43👍1😍1
Даже собаки уже научились вайбкодить
Продолжая тему ИИ и игр — навайбкодить игру теперь может даже собака. Правда, для этого ей все-таки нужна помощь человека.

Алгоритм такой:
1️⃣ Берем собаку и выдаем ей клавиатуру, подключенную к Raspberry Pi.
2️⃣Собака нажимает на кнопки, и ее сообщения обрабатываются специальной утилитой DogKeyboard, которая перенаправляет их в Claude и подсчитывает количество знаков в них. Когда набирается достаточный объем, она запускает автоматическую кормушку, которая выдает собаке вознаграждение за ее труды.
3️⃣Говорим Claude, что он работает с гениальным, но эксцентричным гейм-дизайнером, который общается посредством особых зашифрованных команд. Они могут выглядеть, как случайный набор букв, но на самом деле в них скрыты послания, которые ИИ надо разгадать.
4️⃣Ждем пару часов и получаем маленькую, но жизнеспособную игру.

🔜 Проверено на собачке Момо, у хозяина которой появилось много времени после увольнения.

Конечно, это несколько упрощенное описание процесса. Чтобы получить от Момо и Claude результат, пришлось потрудиться. Например, в DogKeyboard настроить фильтр, убирающий из инпута все специальные клавиши и оставляющий только текстовое сообщение. А еще написать очень подробный промпт, чтобы ИИ не только расшифровывал послания гениального разработчика, но и не забывал добавлять в игры звук и вменяемое управление.

Но в итоге — вайб-кодинг в чистом виде, 100%-ное, ничем не стесненное вдохновение и целый ворох играбельных прототипов. Одну игру автор даже выложил на гитхаб в двух версиях: с пофиксенными человеком багами и Director’s Cut от Момо.
Please open Telegram to view this post
VIEW IN TELEGRAM
🌚75😍3👍1
Я хочу помыть машину. До автомойки — 50 метров. Мне лучше идти пешком или поехать?
Как бы вы ответили на этот вопрос?

На скринах выше — ответы нейросетей, которые они дали пользователю Mastodon: Perplexity, Claude, Mistral, ChatGPT, Deepseek и Qwen. До того, как начнете читать, попробуйте угадать, сколько предложили пойти пешком.
😁32🔥8🌚21
Разработчик ускорил загрузку дашборда в 100 раз
Но есть нюанс — перед этим он в 100 раз замедлился по непонятной причине.

Представьте, что вы работаете над дашбордом, и замечаете, что он грузится 10 секунд, хотя еще недавно все работало нормально. А кому-то и представлять не надо.

С такой проблемой столкнулся Аллен Пайк, когда дорабатывал дашборд нового приложения. Он пошел за помощью к ИИ, которому описал ситуацию и попросил накидать идей, что с ней делать, но это не дало результата — он честно проверил все гипотезы, и все были мимо.

Зато он обнаружил, что проблема воспроизводится только в Safari (или, как теперь нужно писать — в «Сафари»). Оказалось, что больше всего времени тратится на этап компоновки страницы — браузер перерисовывал макет несколько раз и тратил на этот процесс в сотни раз больше времени, чем нужно.

После этого начался долгий и нудный процесс удаления разных элементов из кода, пока тормоза не прекратятся. И в итоге виновник нашелся — сердечко на кнопке «Отправить отзыв». ❤️

🔜 Дело было в том, что на дашборде использовали специфический шрифт, чтобы в разных браузерах и на разных устройствах эмодзи отображались одинаково. Он поддерживает новый формат, который в теории должен сделать отрисовку эмодзи более быстрой. Но именно в Safari эффект был обратный, и поэтому браузер тратил столько времени на одно-единственное сердечко.
О баге уже сообщили и куда надо, но вообще с использованиями разных креативных шрифтов надо быть поосторожнее.

А вы встречались с похожими багами? 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
11🔥8❤‍🔥5👍3