LEFT JOIN
44.3K subscribers
959 photos
29 videos
6 files
1.25K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Что еще умеет SQLite
Раз уж заговорили про эту СУБД в прошлом посте, давайте посмотрим, как еще интересные функции и возможности у нее есть, о которых кто-то может не знать.

Нашли подборку примеров. Кроме уже знакомого WAL, там упомянуты:
🔵Работа с файлами JSON: SQLite умеет хранить их прямо в таблицах и отправлять к ним запросы.
🔵Полнотекстовый поиск с с ранжированием, поиском по фразе или части слова — для этого понадобится расширение FTS5.
🔵Обработка сложных аналитических запросов с применением оконных функций и общих табличных выражений.
🔵«Строгие» таблицы, как в PostgreSQL и других классических СУБД. — их добавили в дополнение к динамической типизации, которой известна SQLite.
🔵Виртуальные столбцы, в которых можно хранить производные данные (например, результаты вычислений) рядом с исходными, не удаляя, изменяя или дублируя их.

А какие полезные функции SQLite вы знаете?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3
Как ИИ меняет аналитику
Нет, речь не про то, как он отнимает у кого-нибудь работу.

Ксения Бокша из OneData VK поделилась наблюдениями о том, как сейчас развивается дата-сфера.

Сегодня выделяются 4 крупных тренда:
🔵Демократизация аналитики. Знать SQL, чтобы залезть в БД за выгрузкой, больше необязательно — теперь вопрос решается через отправку запроса на естественном языке к ИИ.
🔵Автоматизация процессов и избавление от рутины, за которые компании платят растущими рисками. Хотя ИИ снимает нагрузку с сотрудников, растет риск ошибок из-за галлюцинаций, которыми искусственный интеллект до сих пор грешит.
🔵Централизация дата-инфраструкутры. ИИ с децентрализованными системами не дружит: для обучения ему нужно, чтобы весь контекст лежал в одном месте.
🔵Смещение акцента на качество, а не на количество. Очистить «грязные» данные дешевле, чем разбираться с ошибками, которые наделает ИИ на их основе.

🔜 Следующий шаг — это переход к системам с автономными ИИ-агентами. Люди будут делать еще меньше работы руками и больше управлять, обучать и контролировать.
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍2🔥1
Хэй, ребята, Коля на связи 🙂
Планирую дать вам немного апдейтов от первого лица в ближайших постах.

Главное: Valiotti Analytics — все. Теперь вместо нее Valiotti Data. К этой трансформации мы шли 7 лет, и причин у нее несколько.

Первая: мир сильно изменился. Последний год мы в агентстве чувствовали, что стагнируем, вся сфера аналитики коммодитизируется, а стоимость услуг падает. После бума курсов появилось огромное количество новых кадров, а мы получили перегретый рынок.

Нашими основными рынками всегда были США и Европа, но на них сейчас царит жесткая конкуренция с кандидатами из постсоветского пространства и азиатских регионов. Они за работу просят меньше, чем мы, и, соответственно, борьбу с ними мы проигрываем. И хотя мы никогда не целились в низкоценовой сегмент и работали с крупными компаниями, у которых есть деньги на качественные услуги, есть и другая проблема.

Вторая причина — это ИИ. Уже сегодня огромное количество работы я лично, мои коллеги и все наши клиенты могут делегировать искусственному интеллекту.

Наше агентство специализировалась на чисто исполнительской работе: мы приходили как толковые руки и помогали компании настроить дашборды, отчеты, инжиниринг, хранилище. Такой подход больше не работает, и даже само понятие «аналитика» меняется и может исчезнуть вовсе. Написать SQL-запрос или код на Python — это больше не серьезная задача, под которую надо нанимать специалиста.

На этом фоне я нашел для себя новую роль: fractional CDO или руководителя по данным на неполный день. Я прихожу и беру на себя ответственность за все, что происходит с данными и аналитикой в компании. Эта должность подразумевает, что человек должен мыслить инструментами, ресурсами, проблемами и задачами, которые помогают бизнесу расти. Она тоже сильно изменилась по сравнению с тем, что было раньше: сегодня, используя ИИ, я могу выполнить построение аудита и дорожной карты для клиента в разы быстрее, чем пару лет назад. Я в этой роли намного счастливее, чем когда я был просто менеджером агентства, потому что воочию вижу результат своей работы, но это отдельная история.

Главное, что на это есть спрос: людям нужны не просто исполнители, а толковые умы, которые готовы взять на себя ответственность. Когда я пришел к этому осознанию, я понял, что надо полностью менять модель бизнеса и взять этот функционал за основу. И теперь моя компания фокусируется на работу с данными в целом, а не только на аналитику, и логичным решением стала и смена позиционирования. В совокупности, все это повлекло переосмысление бренда и стека технологий и услуг, которые мы предлагаем.

Заходите на обновленный сайт — там все подробности.

P.S. Скоро расскажу еще о ряде проектов, которые делаем
👍2213🤔4🌚4🤩2
ИИ, который работает для бизнеса
Бронируйте слот в календаре! 🔥

28 апреля в 12:00 МСК пройдет KARPOV.CONF 2026 — большая онлайн-конференция от karpovꓸcourses про работу с ИИ.

Там обсудят все, что действительно важно сегодня: как компании внедряют ИИ в свои процессы, какие задачи он решает и какой результат это дает на практике. Среди спикеров — эксперты из топовых российских компаний, которые работают с ИИ не в теории, а каждый день.

На конференции не будет обзорных докладов и пересказа очевидных вещей. Только реальные кейсы, цифры и выводы:
🔵какие решения действительно работают;
🔵где ИИ дает ощутимый эффект;
🔵с какими ограничениями и рисками сталкиваются команды;
🔵какие ошибки допускают на проектах и как их избежать.

Это возможность за короткое время получить концентрат практического опыта и посмотреть на ИИ без иллюзий — через реальные задачи бизнеса.

🔜 Зарегистрироваться
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥2🤔211🔥1
OpenAI представила Images 2.0
Это новая «думающая» модель для генерации изображений. Вместо тысячи слов — одна картинка, которую она сделала сама целиком, включая текст.

Эх, уходит эпоха мемов со смешной кривой кириллицей на ИИ-картинках.

Главные особенности модели по сравнению с предыдущей версией:

🔵Точнее следует промптам и за счет этого дает пользователю больше контроля над процессом генерации изображения.
🔵Знает больше языков, включая японский, хинди и, как видите, русский.
🔵Лучше придерживается заданного стиля — и реалистичную фотографию сделает и страничку из манги.
🔵В целом серьезнее подходит к задачам за счет умения «рассуждать» — может искать информацию в интернете, создавать сразу несколько изображений, рисовать схемы и инфографики. Хотя с очень уж сложными задачами она еще справляется неидеально. В качестве примера таких задач приводят инструкции по сборке оригами или изображения с большим количеством мелких деталей.

Модель доступна бесплатно, так что ничто не мешает потестить, что еще она умеет.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥5❤‍🔥33🤣1
Приближается дефицит ИИ?
Взрывной рост ИИ столкнулся с серьезным препятствием — таким же взрывным ростом цен на железо и недостатком вычислительных мощностей. Стоимость аренды часа использования ИИ-чипов NVIDIA Blackwell подскочила на 48% по сравнению с тем, что было еще в начале года. Дата-центры в США, мало того что перегружены, так еще и встречают постоянное — и объяснимое — сопротивление местных жителей, которые выступают против их строительства.

Если тенденция сохранится, то рынок неизбежно изменится.
🔵Доступ к самым продвинутым и умным моделям будет ограничен. Mythos, новая нашумевшая модель от Anthropic, которой те поделились с достаточно небольшим количеством компаний, тому пример.
🔵Бизнесам, полагающимся на ИИ в работе, и разработчикам ИИ-продуктов придется тщательнее отбирать модели и искать, где можно сэкономить. Возможно, вместо «рассуждающих» флагманов придется задуматься о небольших, локальных опциях.
🔵Рост цен на железо и поддержание инфраструктуры приведет к росту цен на использование ИИ — а значит, и компаниям, которые построили вокруг него свои продукты, придется поднимать цены.

Только мы все привыкли к ИИ, как тут же появился риск, что он станет только для богатых. 😕
Please open Telegram to view this post
VIEW IN TELEGRAM
😱7🌚4👾31
А нужна ли вам база данных?
Любой бизнес так или иначе генерирует и собирает самые разные данные, которые надо где-то хранить — в идеале так, чтобы еще и обеспечить к ним удобный доступ.Самое логичное решение этой задачи — развернуть базу данных.

А что если попробовать без нее?
По сути, данные в базе — это обычные файлы, с которыми вполне можно работать напрямую, без дополнительного слоя БДшной логики сверху. Вопрос только в том, будет ли это удобнее и быстрее? Ответ нашли ребята из DBPro — приложения по управлению базами данных.

Они протестировали разные способы найти данные внутри простых JSONL-файлов на трех датасетах — с 1000, 100 000 и 1 000 000 записей:
🔵Линейный поиск — каждый запрос читает весь файл целиком от первой до последней строки.
🔵Загрузка в память — при запуске приложения файл читается один раз, данные сохраняются в хэше, и поиск ведется по нему.
🔵Бинарный поиск по индексу — данные хранятся на диске и сортируются по Id, на основе чего и создается индекс.
🔵SQLite — собственно, классический вариант работы с данными через СУБД.

Вы уже, наверное, можете догадаться, что было в результатах, хотя бы частично: SQLite одинаково легко справляется что с 1000, что с 1 000 000 записей, а вот линейный поиск на больших датасетах позиции резко сдает. А вот то было неожиданно, так это то, что загрузка в память и бинарный поиск оказывались быстрее SQLite.

SQLite обрабатывала стабильные 25-26 тысяч запросов в секунду, бинарный поиск — до 45 тысяч, а поиск в памяти — до 169 тысяч. Этого не просто достаточно для большинства сайтов или приложений — многие и близко не подходят к такому объему.

Но надо учитывать, что эксперименте проводили на простых запросах, в которых не приходилось искать данные по нескольким полям сразу, объединять таблицы и применять другие интересные функции. То есть при всей простоте реализации и высокой производительности, способы применения ограничены проектами без сложной архитектуры, где не нужно работать с аналитикой.

🔜 В итоге эксперимент не столько убеждает срочно отказаться от использования БД, сколько подталкивает почаще мыслить нестандартно и смотреть критически даже на вещи, которые кажутся очевидными.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥3🤣2🏆2👾2😱1
С Днем труда, дорогие подписчики!
В честь праздника принесли вам тематический плагин Endless Toil («бесконечный труд»). Если запустить его с Codex, Claude или Cursor, он будет издавать страдальческие стенания по мере того, как ИИ продирается через ваш код.

Звук и правда душераздирающий и позволяет в полной мере прочувствовать всю тяжесть ИИ-труда.
😁20🔥2👌2🤣1
Периодическаяя таблица ИИ-стартапов
ИИ с нам уже достаточно долго, чтобы вокруг него выросла целая индустрия с разными направлениями — какие-то все еще бурно растут, а какие-то уже даже стабилизируются.

Это хорошо видно на визуализации, опубликованной на Tableau Public. Автор свел воедино данные об успехах и развитии ИИ-стартапов из нескольких категорйи за год, с февраля 2025 по февраль 2026.

Он выделил 4 большие группы ИИ-компаний:
🔵Базовый уровень — разрабатывают сами модели (OpenAI, Anthropic) и ИИ-инфраструктуру (Databricks).
🔵Горизонтальный уровень — создают инструменты для широкого списка задач, которые могут использоваться в разных сферах: от написания кода до генерации картинок и музыки.
🔵Вертикальный уровень — разрабатывают узкоспециализированные инструменты, которые применяются в медицине, юриспруденции, научных исследованиях и так далее.
🔵Передовые технологии — робототехника, кибербезопасность, умные голосовые помощники.

На инфографике можно отследить основные тренды. На базовом уровне все стабильно, узкоспециализированный ИИ уверенно набирает обороты, а те, кто делает агентов и инструменты для разработчиков, переживают взрывной рост. Последняя разношерстная категория «передовых» стартапов тоже быстро растет и даже обгоняет некоторых ветеранов».

А какие тренды на ИИ-рынке заметили вы?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥62👍2
Сделай сам: мини-курс по обучению ИИ с нуля
Лучший способ разобраться, как что-то работает — попробовать сделать это самому. С языковыми моделями это тоже работает.

🔜 На github выложили мини-курс, где автор предлагает собрать GPT своими руками, чтобы понять, как устроены современные LLM внутри. Идея проекта в том, что вместо использования готовых библиотек вроде Hugging Face или LangChain написать почти все основные части модели самостоятельно. Для успешного прохождения понадобится только знание Python — опыт работы с ИИ и машинным обучением не обязателен.

Курс состоит из шести уроков, за время которых вы напишете токенизатор, познакомьтесь с трансформерной архитектурой, выстроите цикл обучения и в конце концов получите модель, которая пишет стихи почти как Шекспир.
Please open Telegram to view this post
VIEW IN TELEGRAM
12❤‍🔥6🔥6
Шахматы, из которых убрали все лишнее
Шахматы — это, конечно, прекрасная игра, но не кажется ли вам, что в них слишком много всего? Все эти фигуры, доска огромная, ну куда это все?

Почему бы не отбросить всю эту мишуру и не оставить только самое главное: один ряд, три фигуры у каждого игрока, которые могут двигаться вперед или назад, восемь клеток. Получатся прекрасные в своей простоте одномерные шахматы.

🔜 У игрока есть ладья, король и конь. Последнему негде ходить буквой Г, но он может двигаться на две клетки вперед и перепрыгивать через чужие фигуры. Задача — поставить мат королю противника, за которого играет ИИ.

Единственный минус одномерных шахмат — возможных стратегий в них чуть-чуть поменьше, чем в обычных, но некоторая вариативность все же присутствует.

А если для вас это слишком просто, то напомним, что недавно писали про шахматы на SQL.
Please open Telegram to view this post
VIEW IN TELEGRAM
8❤‍🔥2😁1🌚1