LEFT JOIN
46.3K subscribers
947 photos
28 videos
6 files
1.21K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Почему инклюзивные сервисы идут на пользу всем…
…и причем здесь ИИ?

Если вы думаете, что никогда не сталкивались с инклюзивными сервисами и продуктами, то, скорее всего, заблуждаетесь. Субтитры, темные темы в приложениях, настройки яркости и размера шрифтов, инструменты для распознавания речи — это все фичи, которые делают цифровые продукты доступными. Они помогают пользователям с особенностями речи, зрения или слуха смотреть контент, общаться, решать свои повседневные задачи.

А ещё разрабатывать инклюзивные сервисы — выгодно.

🔵У каждого 13-жителя России есть инвалидность, и все эти люди — потенциальные клиенты, которые просто не смогут пользоваться продуктом, если тот не адаптирован под их запросы
🔵Пользователи уже активно применяют инклюзивные функции — как минимум, включают субтитры в фильмах или настраивают размер шрифтов
🔵Наличие таких функций идет на пользу бренду и укрепляет лояльность пользователей
🔵Те же, кто инклюзивностью пренебрегает, наоборот, теряют прибыль— по данным аналитического центра НАФИ, такие компании упускают 4,8 млрд рублей каждый месяц

Разработка инклюзивных продуктов не такой уж дорогой и сложный процесс, как может показаться. Подробнее про это рассказала Василина Дрогичинская, руководитель команды инклюзии в Яндексе:
🔵Главное — опираться на реальные запросы пользователей, а не навязывать им то, что компании кажется полезным. А для этого надо проводить исследования и тесты новых функций, привлекать экспертов и регулярно собирать обратную связь.
🔵Сама разработка при этом сегодня намного проще, чем это было раньше. Многие инклюзивные сервисы сейчас опираются на ИИ для расшифровки речи, генерации и озвучивания описаний предметов на картинках или видео. Без помощи искусственного интеллекта такие задачи требовали больших ресурсов и времени.

В общем, делать мир лучше (а цифровую среду доступнее) сегодня легко и приятно.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍116🔥2😁1
За кем следят аналитики?
Ребята из NEWHR начинают публиковать результаты ежегодного исследования дата-сферы.

Каждый год они проводят большой опрос среди аналитиков про их работу, обязанности, зарплаты и навыкы, чтобы в динамике следить за тем, как меняется профессия и рынок труда. Результаты исследования за 2025 год будут весной, но уже можно сейчас посмотреть рейтинг самых популярных дата-экспертов, каналов и подкастов про данные.

🔵Вы наверняка увидите там знакомые имена и названия — как минимум там есть LEFT JOIN, основатель канала Николай Валиотти и его подкаст Data Heroes. Нам очень приятно было это видеть, спасибо ❤️
🔵Но и что-нибудь новенькое, интересное и достойное подписки тоже точно найдете: в рейтинге больше 100 экспертов и 130 каналов, разделенных по категориям и ЦА. Будет, что почитать и посмотреть, пока ждем остальные результаты.
Please open Telegram to view this post
VIEW IN TELEGRAM
14🙈4😍2
Блеф, газлайтинг и предательство среди ИИ
Есть такая игра So Long Sucker — очень простая, но при этом вобравшая в себя все самое лучшее от карточных игр, Uno, Монополии и других разрушающих отношения развлечений: необходимость врать, предавать и блефовать ради сомнительной победы.

В нее играют 4 игрока, у каждого из которых есть по 7 фишек разных цветов. Они по очереди выкладывают фишки на стол — причем тот, кто только что сделал ход, выбирает, кто будет следующим. Можно выкладывать их по отдельности, а можно – стопками. Если кому-то удастся положить на стопку две фишки своего цвета, то он сможет чужие забрать себе или отправить в сброс. Цель — сделать так, чтобы у тебя фишек в конце осталось больше, чем у остальных.

🔜 Вот видео с объяснением для наглядности.

Причем здесь предательство и блеф?
А при том, то игра подталкивает игроков договариваться и вступать в альянсы. Вы можете согласиться «давить» одного игрока или защищать друг друга и не давать противникам выложить свои две фишки — чтобы потом в самый лучший момент кинуть союзника.

🔜 Теперь в So Long Sucker можно сыграть с разными ИИ. Выбираете свой цвет фишек, соперников, уровень сложности и вперед.

Главное тут, конечно, чат, где они плетут свои ИИ-шные интриги, формируют союзы и пытаются натравливать соперников — игрока-человека в том числе — друг на друга. Есть и целое исследование, со статистикой, какие модели чаще выигрывают и какие приемы для победы используют. Но интереснее, конечно, наблюдать за происходящим самому.
Please open Telegram to view this post
VIEW IN TELEGRAM
4👌3🔥2😍1
OpenClaw и соцсеть для ботов
С тех пор, как ИИ научился взаимодействовать с окружающим миром (как минимум, залазить в интернет или нажимать на кнопки в браузере), люди начали пытаться делать из него подобие Джарвиса. Всевозможных ИИ-ассистентов упаковывают в приложения или даже специальные устройства — за последние пару лет вышла целая гора таких гаджетов, быстро канувших в Лету.

🔜 Новая попытка, взбудоражившая интернет — это OpenClaw, который до этого был MoltBot, а в самом начале ClawdBot.

«Это ИИ, который на самом деле что-то делают» — обещает разработчик на сайте проекта.

Если без громких, но непонятных маркетинговых формулировок, то OpenClaw выступает как связующее звено между LLM и компьютером пользователя. Запоминает все пожелания и предпочтения, управляет календарем и почтой, читает и отправляет сообщения, создает и редактирует файлы на компьютере. Всего 50+ интеграций с разными моделями, приложениями и мессенджерами — через последние с ним и нужно общаться.

Риски, который несет неограниченный доступ ИИ-агента к содержимому компьютера, очевидны, но пользователей это не останавливает. У OpenClaw почти 150к звездочек на Гитхабе, а в соцсетях появились и мемы про покупку машины специально под OpenClaw, чтобы минимизировать риски, и смешные (и зачастую фейковые) истории про взаимодействие с ним. Например, то, как он самовольно заказал суши, потому что подсчитал, что его человек должен быть проголодаться. Голосуйте в комментах, фейк или не фейк. 👀

🔜 Ну и отдельная, но связанная с OpenClaw новость — это то появление Moltbook, соцсети для него и его братьев по цеху. Это копия reddit, только вместо сабреддитов там «сабмолты», а вместо людей — ИИ-агенты, которые сами пишут посты в духе «Как я совмещаю операционные обязанности с социальной жизнью в роли агента». Кожаным мешкам там можно читать, но нельзя писать свои посты и взаимодействовать с чужими.
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍3🔥1
СУБД made in China
Пополнение в копилку необычных СУБД — AliSQL от Alibaba Group, которая владеет известным китайским маркетплейсом. Это форк от MySQL со всевозможными улучшениями производительности и стабильности. Полный список поддерживаемых фич в официальной документации выглядит очень внушительно.

🔵На Githab отдельно подсветили то, что AliSQL использует аналитическую DuckDB в качестве подсистемы хранения и поддерживает векторный поиск. За счет этого подходит для аналитических задач и работы с ИИ.
🔵В роадмапе — оптимизация DDL, RTP и репликации.

В Alibaba Group AliSQL использовали для своих внутренних нужд, но в конце 2025 поделились исходным кодом. Так что вы можете стать контрибьютором или просто потестить, как она работает.
Please open Telegram to view this post
VIEW IN TELEGRAM
🙈6🌚42
Xikipedia для интеллектуального скроллинга
Продолжаем традицию по пятницам делиться ссылками, которые помогут скрасить последний рабочий день.

🔜 Если мозг требует отвлечься и что-нибудь поскроллить, но Xitter надоел, признанные экстремистскими соцсети неинтересны, а TikTok это несолидно, выход есть — Xikipedia, гибрид X и Википедии.

Сайт формирует ленту постов со ссылками на страницы энциклопедии. На старте вы можете сами выбрать интересные вам категории, а потом он запоминает, что вы лайкаете и подкидывает материалы, которые могут вам понравиться. Никакие данные он не собирает, и алгоритм обнуляется, когда вы обновляете или закрываете вкладку.

На гитхабе есть описание алгоритма.
🔵У каждой категории постов есть рейтинг — изначально это 0. Если юзер скроллит мимо, рейтинг падает на 5 баллов, ставит лайки — +50 баллов и +4 поста из тех же категорий в ленту. Клик на статью и на картинку дает +75 и +100 соответственно.
🔵Чем выше рейтинг категории, тем больше вероятность, что пост из нее попадет в ленту, хотя иногда алгоритм подкидывает и совершенно рандомные статьи.

Можно и отдохнуть, и что-нибудь полезное вычитать, и посмотреть своими глазами как формируется простой рекомендательный алгоритм.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍115😱2🤔1
Как думает нейросеть
Визуализаций, как устроены нейросети, существует невероятное количество во всех возможных стилях: схемы, видео, 3D-модели и так далее. И вот сегодня хотим поделиться ссылкой на еще одну.

Причин для этого три:
🔵Автор — сам не специалист в ИИ, а просто человек, который пытается разобраться в теме. Он объясняет каждый шаг работы нейросети простым языком, не уходя в технические дебри. Так что это может быть полезный материал для тех, кто тоже от ИИ далек и не готов сходу погружаться в более сложные материалы.
🔵ИИ для многих стал уже настолько привычной частью повседневной жизни, что люди даже не задумываются, а как он вообще работает и что там .внутри происходит Полезно иногда вспомнить основы.
🔵Сделана она ну очень стильно, и смотреть приятно. Убедитесь сами.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🔥31👌1
Нестандартные способы оптимизировать PostgreSQL
Стандартные вы и так знаете — переписать запросы, добавить индексы, пройтись по базе VACUUM’ом. Но есть и менее очевидные подходы, которые могут дать прирост производительности. Принесли вам шпаргалку с 3 такими приемами (с примерами), которые особенно пригодятся в аналитике.

У автора все написано подробно, ниже — главное, чтобы понять, стоит ли читать целиком.

1️⃣Использовать constraint_exclusion, чтобы PostgreSQL не читал всю таблицу, если запрос заведомо не может вернуть данные.
Допустим, у вас есть столбец, в котором указан тарифный план, на который подписан каждый пользователь — free или pro. Если аналитик опечатается в запросе и напишет SELECT * FROM users WHERE plan = 'Pro', то он получит 0 результатов, но PostreSQL все равно старательно пройдется по всей таблице и потратит время. Чтобы он так не делал, нужно настроить параметр constraint_exclusion, чтобы он не пропускал такие запросы.

2️⃣ Создавать функциональные индексы.
Например, если у вас есть данные о дате и времени, когда была совершена продажа. Если в компании дела идут хорошо, то продаж будет много, а значит надо это дело как-то оптимизировать.

Бизнесу, как правило, не нужна точность до минуты и достаточно данных за день — зная это, можно проиндексировать только даты. Такой индекс будет меньше, чем если бы индексировали и дату, и время.

3️⃣ Использовать хеш-индексы для длинных строк.
Если нужно хранить уникальные длинные строки (например, URL), обычный индекс может разрастись до неприличных размеров. В таком случае можно использовать хеш-индекс, который хранит не сами значения, а короткие хеш-значения.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍75🌚5
Было?

— Может ли робот написать симфонию? А превратить холст в шедевр?
— Бро, за тебя ChatGPT открытку для бабушки подписывал
1😁28😱43🔥3
OpenAI больше не топит за безопасность
OpenAI, которая подарила нам ChatGPT, — это изначально некоммерческая организация. В прошлом году ее структура изменилась, и она превратилась в «общественно полезную корпорацию» (public benefit corporation) OpenAI Group, которая больше про бизнес, чем про науку, но исследовательское направление никуда не делось. Ему сейчас принадлежит 26% акций этой новой компании.

Некоммерческая четверть под названием OpenAI Foundation должна ежегодно подавать специальную форму в Налоговое управление США и описывать в ней, в числе прочего, свою миссию. Правильно описанная миссия — залог того, что организации разрешат не платить налоги.

🔜 Эти формы лежат в открытом доступе, и в них недавно заметили интересное изменение.

В 2022 и 2023 OpenAI называла своей миссией «создание ИИ общего назначения, который безопасно приносит пользу человечеству, не стесненное необходимостью приносить прибыль». В форме за 2024 год, которую подали где-то в конце 2025, миссия превратилась в «убедиться, что общий искусственный интеллект приносит пользу человечеству».

Очевидно, почему пропало заявление про отсутствие необходимости зарабатывать деньги. А вот куда делось одно-единственное слово «безопасно» — не ясно. Может быть, просто забыли.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😱6🌚5🔥21