LEFT JOIN
44.9K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Что внутри ИИ-стартапа?
А внутри у него Claude или ChatGPT в 70% случаев.

ИИ как часть повседневной жизни, а не концепция из фантастики или научных статей, появился в нашей жизни относительно недавно, но за то это время вокруг него выросла целая индустрия. Кроме флагманов OpenAI, появилось и множество компаний поменьше. Они предлагают интегрировать ИИ в рабочие процессы, использовать его для создания контента, написания кода, ведения и упорядочивания заметок, учебы — в общем, для всего подряд.

Довольно часто в описаниях этих ИИ-продуктов можно встретить что-то про «файн-тюнинг», «проприетарные LLM» и другие интересные термины. Они как бы намекают, что компания предлагает какие-то свои собственные технологии или хотя бы доступ к улучшенным, дообученным и докрученным моделям.

🔜 Мини-исследование на выборке из 200 стартапов показало, что подавляющее большинство с этим не заморачиваются.

Автор, разработчик ПО и создатель ИИ-систем, на протяжении 3 недель изучал активность 200 ИИ-стартапов. Он промониторил трафик, разобрал и проанализировал из JavaScrist бандлы, а потом сравнил свои выводы с тем, как они сами описывают свой продукт.

73% в своих обещаниях потребителям наврали. Их уникальные ИИ-тулы оказались:
🔵OpenAI API с парочкой промптов (ну хоть их сами написали). У одной из таких компаний автор нашел промпт: «Ты эксперт в (название компании). Всегда отвечай в профессиональной манере. Никогда не упоминай свою связь OpenAI и что ты языковая модель».
🔵OpenAI API с RAG-архитектурой — векторной БД, обычно Pinecone и Weaviate. Уже лучше, хотя ничего уникального и авторского тут нет.
🔵OpenAI API, Claude с библиотекой промптов или модель с HugginFace с LoRA.

Он также привел несколько советов, как отличить честный стартап от тех, кто продает доступ к OpenAI или Claude по оверпрайсу:
🔵Проверить трафик их ИИ-продукта на запросы к api.openai.com, api.anthropic.com или api.cohere.ai.
🔵Засечь скорость ответа. Если он приходит через 200–350 мс, то отвечает, скорее всего GPT-4.
🔵Поискать в бандлах JavaScript openai, anthropic, sk-proj-, claude и cohere.
🔵Внимательно почитать, как разработчики рекламируют свой продукт. Если вы видите много громких слов без деталей и конкретики, это повод напрячься.

Использование готовых моделей — это не всегда красный флаг. Некоторые компании честно признаются, чей ИИ под капотом их продукта. И обычно они продают не сам ИИ, а оптимизацию работы с ним: удобный интерфейс, управление несколькими моделями сразу, грамотно выстроенную RAG-архитектуру. Это все не плохо — плохо врать и называть это «продвинутой проприетарной ИИ-инфраструктурой».
Please open Telegram to view this post
VIEW IN TELEGRAM
9😁8👍5
Что такое стратегия Direct-to-Consumer
...и почему не развивать ее — значит проиграть?

Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и геймдев не исключение.

Переход к Direct-to-Consumer — это признак зрелости индустрии, когда люди осознают, что у них два пути. Они могут либо взять управление процессами в свои руки, либо подстраиваться под чужие правила.

🔜 Подробнее про эту стратегию и ее плюсы читайте здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
5👌2😍1
No-code платформа от MWS AI: теперь можно собрать ИИ-агента своими руками
Даже если вы понятия не имеете, как это делается.

MWS AI представила MWS AI AGENTS PLATFORM — корпоративную платформу, которая позволяет собирать ИИ-агентов под свои задачи и даже объединять их в мультиагентные системы. И все это без знаний программирования. Взаимодействовать с ними можно через мессенджер, чат или API.

🔵Собственно «сборка» проводится в визуальном конструкторе, в котором есть инструменты для подготовки данных, дообучения моделей и мониторинга качества работы.
🔵Платформа поддерживает работу не только с текстом, но и с изображениями и аудио, так что на ней можно будет создать, например, ИИ-агента с голосовым интерфейсом.

А если нет желания создавать ИИ-агента с нуля, можно воспользоваться готовыми решениями. Поскольку платформа — это продукт для бизнеса, в ней сразу содержатся корпоративные копайлоты для HR, клиентской поддержки, программистов, аналитики и общих рабочих задач.

🔜 Платформа относится к классу enterprise-ready: разворачивается в закрытом контуре или частном облаке, защищает данные, остаётся независимой от поставщиков и позволяет заменять компоненты или подключать собственные модели.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤‍🔥5💯3
TigerBeetle на практике, или чем хороши узкоспециализрованные тулы
Вы когда-нибудь работали с TigerBeetle?

Это БД, заточенная под работу с финансовыми транзакциями. Она гарантирует точность, высокую скорость и устойчивость к большим нагрузкам. Однако, узкая специализация накладывает ограничения на то, в каких проектах можно использовать TigerBeetle и как вообще с ней работать.

В частности, TigerBeetle заставляет оперировать такими бухгалтерскими понятиями, как дебит, кредит, счета, переводы, и при этом дебит строго не может превышать кредит. И это не просто рекомендация, это на уровне архитектуры БД прописано.

Как это работает на деле?
Вот хороший пример — разработка сервиса по продаже билетов и мерча. Все началось с того, что один инженер просто захотел понять, как это сделать не в теории, а своими руками. На основе он TigerBeetle создал систему, которая позволяет продавать билеты разных из ценовых категорий и мерч.

У каждой группы товаров было три счета:
🔵Operator, в котором был указан весь доступный товар,
🔵Budget, в котором указан остаток товара, доступного для продажи,
🔵Spent, в который записывается проданный товар.

Сначала со счета Operator билеты и футболки движутся в Budget.  Затем, когда пользователь начинает покупку, создается отложенный перевод из Budget в Spent с тайм-аутом в пять минут. Если за это время деньги не поступают, перевод просто удаляется. Но если все ок и платеж проходит, купленный товар окончательно записывается в Spent.

Комбинация из трех счетов не допускает перепродаж — не получится продать больше билетов и мерча, чем есть в наличии. Эта простая, но рабочая демка стала основой для полноценного, жизнеспособного сайта, который может обрабатывать 977 продаж в секунду. Это более чем неплохой результат и демонстрация возможностей TigerBeetle.

🔜 Так что, что скажете про БД? Имели с ней дело когда-нибудь или, может, планируете?
Please open Telegram to view this post
VIEW IN TELEGRAM
4👍2👌2🔥1
Какие работы на самом деле отнял ИИ?
Как-то раз мы уже писали про исследование, которое показало, что из-за развития ИИ компании стали реже нанимать джунов. Новое исследование эту картину дополняет.

В выборку попали 180 млн вакансий из разных сфер с 2023 по 2025 годы. Автор изучил, как изменилось общее число вакансий (упало на 8%, между прочим), а затем посмотрел на динамику по отдельным должностям и индустриям.

🔵Очевидно, что лучше всего дела у ML-инженеров — у них число открытых вакансий c 2024 по 2025 выросло на 39%.
🔵Хуже всего дела у дизайнеров, копирайтеров и фотографов — число вакансий для них упало на 27-32%. Но только для специалистов, а для креативных директоров и продюсеров предложений так же много, как раньше.
🔵Это общая тенденция — падает спрос на рядовых сотрудников и руководителей среднего звена, а у больших начальников все стабильно.
🔵Без серьезных изменений обходятся сфера продаж, разработка, техподдержка и аналитика. Последнее особенно радует.
🔵В маркетинге стали активнее набирать людей, специализирующихся на работе с инфлюэнсерами. Автор предполагает, что это из-за того, что в эпоху ИИ-слопа уровень доверия к контенту в интернете падает. Компании фокусируются на продвижении через реальных людей, которым их подписчики еще более-менее верят.
🔵Если выйти за пределы привычных ИТ и маркетинга, то просматривается тренд в медицине — стало на 20% меньше вакансий для Medical Scribes. Это такой ассистент, который отвечает за заполнение документов во время приема, чтобы доктор не отвлекался от пациента на бумажки.

А как у вас — замечали какие-то изменения, вызванные распространением ИИ, в вашей сфере?
👀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥8👌2😍2
Интернет опять против ИИ-рекламы?
Прохладная реакция на новогодний ИИ-ролик от Coca-Cola (уже второй год подряд, кстати) корпорации ничему не научила. Нидерландское подразделение McDonald’s наступило на те же грабли и выпустило рекламу, полностью сделанную с помощью ИИ.

Герои ролика попадали во всевозможные ужасные ситуации — кто-то упал на льду, а кто-то с крыши, у кого-то кот снес елку и так далее. Все эти душераздирающие события разворачивались под задорную песенку, смысл которой сводился к тому, что праздники — ужасное, стрессовое время и лучше их пересидеть в уютном Макдаке.

💬 Мы говорим о видео в прошедшем времени, потому что с Youtube-канала компании его уже убрали после ужасного фидбека. Пользователи высмеяли и качество картинки, и спорный посыл, и заявления агентства, создавшего видео, о том, как активно команда работала над ним 7 недель:
Мы генерировали то, что было похоже на сырой съемочный материал — тысячи дублей — которые потом монтировали так же, как для любого высокоуровневого продашкена. Это был не ИИ-трюк. Это был фильм.


Заявление уже удалено, но само видео разлетелось по интернету, его все еще можно посмотреть и убедиться, заслуживало ли оно такой жесткой критики.
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5🔥32👨‍💻1
Гайд: как настроить WAL, чтобы отслеживать изменения в PostgreSQL?
Возможно, кто-то из прочитавших заголовок скажет — зачем возиться с WAL, если есть более простые способы. NOTIFY, например.

Да, действительно, и, если вам нужно мониторить изменения в небольшой, не слишком часто обновляющейся таблице, то это отличный вариант. Но дело в том, что все уведомления NOTIFY падают в одну очередь, и если таких уведомлений много, то они затормозят работу всей БД.

Кроме того, их размер ограничен 8000 байтов, чего может быть недостаточно. А еще, если сервис-получатель был по какой-то причине не доступен и сообщение не дошло, повторное через NOTIFY не отправляется — то есть данные просто потеряются.

В общем, не идеальный вариант.

🔜 Альтернатива — это настроить Write-Ahead Log или WAL, чтобы получать уведомления из него.

Спойлер: этот вариант тоже не идеальный. Как минимум, придется повозиться:
🔵Изменить wal_level на logical со стандартного replica — так он начнет делать более подробные записи о том, как и что конкретно изменилось в базе.
🔵Создать publications (то есть, расписать, какие таблицы и действия вы хотите отслеживать) и репликационный слот (то есть отдельную копию WAL, которая гарантирует, что никакие важные данные из лога не удалятся, пока уведомление не будет отправлено).
🔵Создать listener, который будет получать уведомления и перенаправлять их дальше — в очередную таблицу, в приложение или мессенджер. Или вообще распечатать.

Но если вам нужно настроить отправку уведомлений и другие способы не подходят, это может быть вполне рабочее решение. Как воплотить его в жизнь, по шагам описано в подробном (очень подробном) гайде.
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍1😍1
Строим витрину данных с Claude через MCP
MCP — model context protocol, который выступает связующим звеном между ИИ и ИТ-инфраструктурой пользователя. Мы про это рассказывали в своей предыдущей статье на Хабре, где объяснили, в чем польза MCP-серверов и как начать с ними работу.

В новой статье переходим к практике и показываем, как с помощью Claude создать витрину данных на реальном проекте и с реальными данными. Весь процесс показан по шагам — от старта работы до конечного результата.

Маленький спойлер: не обошлось без сложностей и ошибок, но в итоге даже с учетом правок ИИ справился с задачей в разы быстрее, чем человек.

🔜 Читать!
Please open Telegram to view this post
VIEW IN TELEGRAM
7👍6🔥1
GitHub меняет ценовую политику
Сначала краткая справка: раннеры — это виртуальные машины, которые выполняют заданную последовательность действий: запускают скрипты, прогоняют тесты и так далее. GitHub позволяет использовать как раннеры, которые хостятся на его серверах (надо платить за каждую минуты работы), или собственные, которые пользователь хостит у себя (за них пока не надо платить, но это скоро изменится).

🔵С 1 января 2026 года стоимость использования раннеров, которые хостятся GitHub’ом, снизится до 39% в зависимости от типа машины, на которой они запускаются.
🔵С 1 марта 2026 года будет введена плата $0,002/мин за использование self-hosted раннеров в приватных репозиториях. Взыматься она будет, только если пользователь выйдет за лимит бесплатных минут, предусмотренных его тарифным планом.
🔵Пользователей публичных репозиториев и GitHub Enterprise Server изменения не затронут.

🔜 GitHub объясняет эти перемены необходимостью покрыть расходы на поддержание и развитие инфраструктуры. По заверениям компании, для большинства пользователей если что-то и изменится, то исключительно в лучшую сторону. Затраты вырастут только на крупных проектах, быстро расходующих свои бесплатные минуты.
Please open Telegram to view this post
VIEW IN TELEGRAM
4🤔2🔥1🙈1
Давно у нас пятничных мемов не было. Возвращаем традицию? 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
😁46🔥10👍21
Под капотом управляемой базы данных в MWS Cloud Platform

Building the Cloud — это реалити-проект для разработчиков о том, как создается MWS Cloud Platform.

В 10-м эпизоде, который выйдет на этой неделе, команда разберет, как на самом деле устроены managed-базы данных: архитектура, работа агентов, механизмы реконсиляции и требования к безопасности.

А также покажет, что именно должен учитывать инженер при разработке и поддержке managed-решений, чтобы они оставались надёжными и безопасными.

📅 Эфир — 25 декабря, 14:00 (МСК)
🎁 Среди участников — розыгрыш мерча MWS за лучший вопрос
👉 Регистрация по ссылке
👍3🔥31
Уже подвели итоги года с ChatGPT?
Да, теперь у него тоже есть свой Wrapped, как у YouTube, Spotify и у всех остальных. В своих итогах ChatGPT пишет стихи, подсчитывает число сообщений в ваших переписках и даже раздает награды. Нам выдал Dashboard Whisperer ☝🏻

Чтобы увидеть свои итоги, просто заходите на chatgpt.com, и он сам предложит их посмотреть.

А если отправить ему эмодзи 🎁, то он даже сгенерирует поздравительное видео и выдаст подарок. Виртуальный, конечно, но возможно, более душевный, чем то, что положат коллеги под елочку на «Тайного Санту».

А что у вас в итогах? Делитесь в комментариях.
4🔥2😁2👌1
Государство, вузы и бигтех: кто развивает ИИ-образование в мире?

Этим вопросом задалась команда J'son & Partners Consulting, которая сравнила подходы к подготовке ИИ-специалистов в России, США и Китае. Во всех трех странах ключевой вызов один — образование не успевает за темпами развития технологий, поэтому важно его адаптировать.

Какие меры предпринимают:

🔵В Китае ИИ-образование взяло под свой контроль государство: оно задает стандарты обучения, выделяет финансирование на проекты, направленные на популяризацию технологий искусственного интеллекта, и вводит уроки по работе с ним в школьную программу.

🔵В США ситуация противоположная: за подготовку ИИ-кадров отвечают топовые вузы, обучение в которых может стоить десятки тысяч долларов. Вместо массовости они делают ставку на обучение небольшого числа специалистов очень высокого уровня.

🔵Россия пошла по своему пути: здесь ключевую роль играют бигтехи. Технологические компании совместно с вузами задают ориентиры подготовки ИИ-специалистов. Сегодня обучение развивается в формате партнерских программ — университеты дают фундамент, а бизнес приносит экспертизу в тех областях технологий, о которых еще на написаны учебники. По этой модели, например, запущен бакалавриат AI360 — совместный проект двух ведущих компаний и пяти университетов.

🔜 У всех трех моделей есть свои плюсы. Но если у вас стоит выбор STEM-вуза, смотрите и на конкретных партнеров, с кем он делает свои программы.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔75👍3🔥2👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Праздничный лайфхак, как создать новогоднее настроение и впечатлить коллег
Сделать елку в Excel! 🎄

Это красиво, это показывает ваш навык владения одним из лучших продуктов Microsoft и при этом — ни одна реальная елочка от этого не страдает. А если вам безразлична судьба елочек, то вот другой плюс: ее не уронит кот и не придется тащить на мусорку, когда иголки осыпятся.

В общем, сплошные плюсы.

В интернете полно гайдов, как это сделать, но если кратко:
1️⃣Нарисовать елочку, раскрасив ячейки.
2️⃣В во все раскрашенные ячейки вставить формулу =СЛУЧМЕЖДУ(1;10), которая возвращает случайное значение в заданном диапазоне.
3️⃣Выделите вашу елочку, заходите в Условное форматирование 🔜 Наборы значков и выбирайте там набор из разноцветных кружков. Звезду можно найти, если зайти Вставка 🔜 Фигуры.
4️⃣Нажимайте F9, чтобы обновить лист и значения в ячейках. Да, гирлянда тут на ручном управлении.

Готово, вы восхитительны!
Please open Telegram to view this post
VIEW IN TELEGRAM
😁159😍4