LEFT JOIN
50.1K subscribers
914 photos
27 videos
6 files
1.14K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Неопознанная выдра «хочет присоединиться к встрече»
Голосовые ассистенты на основе ИИ, супер-разумные боты в Slack, генераторы презентаций — пандемия интеллектуальных продуктов и сервисов на основе нейросетей не останавливается на генерации текста и кода. И вот на свет появляется новый инструмент, Otter, на этот раз для того, чтобы облегчить проведение онлайн встреч и вооружить всех участников конспектами, аудио и визуальными материалами с созвонов и даже автоматическими отчетами, в которых будут резюмированы обговоренные темы, планы и задачи.

Для активации Otter необходимо дать доступ к своему Google или Microsoft календарю, чтобы ассистент смог присоединиться к вашим встречам в Zoom, Microsoft Teams или Google Meet. Шпионить за вашими разговорами прохвост может и в браузере, и в релевантных приложениях на iOS и Android.

Доступ к Otter представлен в 4 форматах: Pro, Business, Enterprise и бесплатной версии, а с подробностями безопасности всего сервиса можно подробно ознакомиться на сайте.
10🔥6
Конец прокрастинации — краткий пересказ
Недавно в канале FULL JOIN мы запустили рубрику с краткими пересказами основных тезисов докладов на темы аналитики, баз данных и инжиниринга и… нам жутко понравилось!
Теперь мы будем регулярно находить стоящие доклады и рассказывать о них, чтобы вы не терялись в бесконечном потоке информации и держали нос по ветру. Например, сейчас мы подыскиваем современные доклады про микросервисную архитектуру и рассказываем, где и зачем она применяется. А здесь мы в похожем формате будем делиться более общими, но все такими же стоящими выступлениями!

Переходим к теме доклада
Прокрастинация — проблема, знакомая каждому, но бороться с ней можно как успешно, так и совершенно безуспешно.
Как же все-таки побороть прокрастинацию? Об этом можно узнать из доклада Петра Людвига «Конец прокрастинации», ведь врага нужно знать в лицо, чтобы его победить.

Но если вам не хочется тратить целых полтора часа на доклад, то вот основные мысли:
🔹Каждая секунда, которая тратится на прокрастинацию потеряна навсегда — стоит периодически держать эту мысль в голове во время.
🔹Мир становится легче и доступнее, что в свою очередь создает проблему слишком широкого выбора действий — это можно только принять.
🔹Один из ключевых элементов, который необходим для победы над прокрастинацией — это умение перевести внешнюю мотивацию (например, горящий дедлайн) во внутреннюю (напимер, точку роста для себя) — а вот это уже один из ключиков к решению проблемы.

С одной стороны, это все просто как день, с другой стороны — все мы прокрастинируем, а значит иногда нам нужно услышать простые истины, вспомнить о них, сфокусироваться и стать чуточку лучше, не так ли?
Please open Telegram to view this post
VIEW IN TELEGRAM
👏227👍52🐳2
Джин, сбежавший из бутылки, или как языковые модели захватят мир 🧞‍♂️
Лоз Блейн, соавтор New Atlas, написал небольшую, но очень резонирующую статью, в которой, рассматривая прецедент создания исследовательским центром Стэндфордского института собственной языковой модели за каких-то 600$, ставит крайне актуальные вопросы о прогрессе, который уже не остановить.

С чего все началось?
Alpaca – это проект на основе LLaMA 7B, модели с открытым кодом от Meta. Ученые исследовательского центра натренировали ее с помощью всего лишь 52К инструкций, сгенерированных ИИ. Несмотря на простоту образовательного портфолио «альпаки» и скромности бюджета, вложенного в ее обучение, ее способности, судя по тестам, ничем не уступают ChatGPT.

И в чем проблема?
Автор статьи отмечает, что такая низкая «себестоимость» и доступность сотворения собственной языковой модели – это, с одной стороны, очень здорово, а с другой – попросту опасно. И дело скорее не в потенциальной катастрофе, которая может перевернуть мир офисных сотрудников, если ИИ перетянет одеялко профессиональных обязанностей в свою сторону, а в угрозе превращения языковых моделей в инструмент мошенников, спамеров и «авторитарных режимов» (прямая цитата).

К тому же, если многочисленные разработчики, окрыленные успехом ChatGPT, с конца прошлого года в поте лица подкручивают винтики своих ИИ-продуктов, чтобы успеть покорить цифровой Олимп в ближайшее время, то не является ли успех Alpaca предвестником скорого провала их коммерческих начинаний?

Впрочем, загнать джина обратно в бутылку уже не получится, поэтому нам остается только адаптироваться к новой реальности и изучать ML и DL.
👍49🔥105
GPT-4 генерировал, генерировал, да cгенерировал…новый язык программирования 🐍
Кратко: языковая модель сгенерировала язык программирования, который может (теоретически) использоваться для создания и обучения новых языковых моделей.

Подлиннее: TenetLang — это язык, полностью придуманный бета-версией ChatGPT-4. По словам Люка Бечтела, автора статьи и самой затеи, TenetLang похож на дитя любви Typescript и Python 💚

Потратив одну бессонную ночь и все еще продолжая допиливать язык, Люк верит, что у подобных авантюр могут быть весьма продуктивные результаты, ведь если языковая модель может править код и предлагать решения задач, то что мешает ей придумать идеальный язык программирования?

Конечно, идея создания новых языков с помощью GPT-4 и, вероятно, последующих за ней моделей, — это вектор исследования и экспериментов, который найдет своих последователей. Люк, тем не менее, не забывает и о существующих языках и задается вопросом, может ли GPT-4, например, усовершенствовать Python до такой степени, чтобы разработчики стали в 2 раза быстрее?
🤯69🔥21👍106👏6
Знаете SQL? Можете стать композитором!
Мы живем в очень интересное время, когда компьютерные программы способны создавать предметы искусства.
То, что нейронные сети могут создавать картины, поэмы и музыкальные композиции, уже стало для нас обыденностью. Но, что если мы вам скажем, что ClickHouse тоже умеет творить?

Совсем недавно разработчики этой замечательной СУБД смогли при помощи SQL-запросов создать mp4 файлы, которые можно послушать. Ознакомиться с проектом можно в репозитории GitHub.

Как это работает?
В репозитории есть несколько примеров запросов для создания музыки. Их структура сделана так, чтобы в результате получалась таблица с набором параметров звуковой дорожки. Громкость звука, частота звуковых волн разной формы (синусоидальная, прямоугольная, пилаобразная и треугольная), шумы различной формы и так далее.
Результат переводится в бинарный формат и подается в стандартный поток ввода программе aplay, которая воспринимает результат запроса, как будто это медиа файл CD формата, и проигрывает его.

Конечно, это очень упрощенный способ генерации звука, но все ограничения сводятся к разнообразию математических функций в ClickHouse. Однако, в будущем мы наверняка сможем создавать более сложные музыкальные композиции всего лишь при помощи SQL-запроса к одной очень-не-тормозящей-СУБД.
🤯22🔥42😱2👍1
Интересные новости из близкого мне мира аналитического консалтинга: известная канадская Montreal Analytics, проработавшая самостотяельно 3 года и внедряющая эти ваши Modern Data stack решения, была приобретена более крупной Datatonic, оперирующей на рынке UK и Европы преимущественно.
🔥6👍4😱2
Скучали? Это ваш любимый Data Heroes и мы начинаем третий сезон! 🚀

В нем мы будем много говорить о том, как построить карьеру в аналитике и развивать личный бренд. В пилотном выпуске сезона мы приготовили гайд о том, как человеку без опыта в аналитике можно примерить на себя профессию 👨‍💻

Наши эксперты — авторы онлайн-курсов, которые очень хорошо знакомы каждому аналитику, ведь именно с них тысячи настоящих мидлов и сеньоров начинали свой путь. Они ответят на самые важные вопросы:
▪️Как почувствовать себя в шкуре аналитика до того, как будут затрачены деньги и время на обучение?
▪️Какие важные софт-скиллы должны быть у аналитика?
▪️Как не ошибиться с курсом? На что обратить внимание при выборе?
▪️Кому точно не подойдет профессия аналитика?

И, как всегда, мы приготовили крутые советы для тех, кто только начинает свое погружение в аналитику! Скорее включайте подкаст и пробуйте себя в новой профессии! 👍

СПИКЕРЫ: Михаил Карпов (курс “Профессия аналитик”), Галина Озерова (курс “Интерактивный тренажер по SQL”), Сурен Погосян (курс “Марафон данных”), Павел Дубинин (курс “Основы работы с DataLens”)

БОНУС: Скидка 25% на полную версию курса “Профессия аналитик” от Product Star по промокоду "LEFTJOIN" — он будет суммироваться со всеми текущими скидками✌️

Слушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts, Google, Yandex, Overcast, Mave, Castbox, Telegram (↓)

#подкаст #DataHeroes
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥137👍5😱2
Audio
❤‍🔥15
Эффект ламы: как одна языковая модель, слитая в сеть, подхлестнула развитие индустрии 🦙
Пару недель назад мы уже писали об Alpaca — проекте Стэндфордского института на основе разработанной Meta AI модели Llama, которую кто-то слил на форум 4chan.

И вот, всего лишь за такое короткое время, другие укротители ИИ, воспользовавшись все той же моделью Llama, разработали и подарили миру множество других проектов с открытым кодом. Давайте-ка познакомимся с самыми яркими из них:

🔵 Vicuna — чат-бот на основе Llama, который почти идентичен по качеству ChatGPT;
🔵 Koala — версия Llama, донастроенная с помощью диалогов из интернета;
🔵 ColossalChat — клон ChatGPT, в обучении которого использовалось подкрепление на основе отзывов людей;
🔵 ChatLLaMA — фреймворк для создания идентичных ChatGPT ассистентов на основе своих данных;
🔵 FreedomGPT — модель, которую можно вот прям сейчас взять с github.

Кажется, или open source — это IT-пандемия 2023?
Please open Telegram to view this post
VIEW IN TELEGRAM
29🔥10👍7🤔5
«Все, что может провалиться, проваливается» — закрываем проект «FULL JOIN» строчками СБПЧ
Чуть меньше чем полгода назад мы с командой запустили закрытый канал FULL JOIN — аналитический контент по подписке, а неделю назад мы приняли решение его закрыть и поделиться этой историей с вами (не все же рассказывать о своих успехах! #bestfails).

Что случилось?
Всегда хочется понять, что пошло не так, чтобы в будущем не наделать таких ошибок, поэтому мы поразмышляли и пришли к ряду умозаключений.
Скорее всего, причин неуспеха несколько:
🔵 Неудачный выбор платформы — похоже, подобный проект стоило подавать не в закрытом Telegram-канале, а на другом ресурсе.
🔵 Отсутствие культуры получать контент по подписке в русскоговорящем сегменте аудитории.
🔵 Низкая вовлеченность читателей и частые отмены подписок — тут, скорее всего, дело в том, что мы даем сложный технический материал, в который нет времени или возможности погружаться, либо же тем, кто подписался, эти темы не близки и не интересны.
🔵 Подписчики не те, кем кажутся — изначально, канал создавался и анонсировался как хардскилловый, но, надеясь найти лайфхаки и полезные инсайты, на него подписывались начинающие специалисты. И остались разочарованы, ведь контент предполагал наличие базы и опыта в аналитике и инжиниринге.
🔵 Слишком высокие издержки на создание контента по сравнению с профитом от проекта — так бывает, но продолжать производить контент себе в убыток не хочется.

Что дальше?
🔵 Глядя на закрытый канал, мы с командой не стали сидеть сложа руки. Посмотрев на текущий проект и весь созданный контент, мы приняли решение показать его более широкой аудитории, а не списывать в утиль (там много красивого и полезного!).
🔵 Постепенно мы трансформируем созданный контент в более удачный информационный формат (расскажем, когда продумаем все детали!). А также мы начнем в скором времени выпускать статьи и гайды по аналитическим инструментам в блоге leftjoin.ru, с надеждой создать “Хабр” в мире данных и аналитики на базе LEFT JOIN.

🔜 Признавать свои провалы больно, но необходимо, ведь никому не хочется, чтобы они случались. Однако без ошибок и тактических просчетов не бывает больших успехов и роста.

👀 Зато, если меня когда-нибудь позовут на подкаст “Это провал”, я точно знаю, что буду им рассказывать!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥94👍3224😱7🤡3
111101111011110, GPT, прием! 👀
Есть любители математики? Для вас контент подъехал!

Андрей Карпатый, ныне разработчик в OреոΑӏ, а в прошлом директор по ИИ в Tesla, выложил в своем твиттере препримечательную заметку про малюсенькую модель GPT, которая использует всего два токена: 0/1.

Что имеем?
🔵 Секвенцию 111101111011110
🔵 50 итераций
🔵 Длина контекста: 3
🔵 PyTorch

Рассмотрев GPT как цепь Маркова с конечным числом состояний, Андрей пришел к ряду выводов, с которыми пригласил познакомиться всех любознательных. По его мнению, исследуя такие маленькие модели, можно лучше представить себе, как ИИ функционирует в динамике.
Please open Telegram to view this post
VIEW IN TELEGRAM
😈11👍7👀5🤡2👎1
«Lost at SQL»: игра для прокачки SQL 🎮
Считается, что самое лучшее обучение — на практике. Будь то наш «Data Марафон», бесплатные онлайн тренажеры или использование ChatGPT как персонального инструктора — любой способ освоить навыки, нужные для аналитика данных, будет работать, если вы вложите в него свое усердие и внимание.

Но среди всего богатства ресурсов и инструментов часто забывается еще один эффективный метод — игровой формат обучения, а ведь он тоже учит нас использовать новые знания в нетривиальных условиях и даже может быть более приятным, так как получение «ачивок» положительно сказывается на выработке дофамина, гормона удовольствия.

«Lost at SQL» от разработчика Робина Лорда — это браузерная игра, действие которой разворачивается на тонущей подводной лодке. Помимо абзацев, раскрывающих сюжетную линию, и самих задач, она включает развернутые описания решений и общие теоретические блоки.

Не «The Last of Us», но все равно достойный внимания инструмент для тех, кому нравится игровой формат обучения.
👍71🔥47👾18👌11
HEROES 3 — немного ностальгии по лучшей игре нулевых
Кажется, невозможно встретить человека старше 25, который не слышал бы об этой игре (хотя, если вы — именно такой человек — мы вам страшно завидуем, у вас все впереди!).
А если на словах «ифриты», «архангелы» и «архидьяволы» ваше воображение точно рисует образы магических существ и хочется вновь ощутить вкус победы, то читайте дальше.

Что такое VCMI?
Простыми словами, это ремейк Heroes of Might and Magic 3, то есть ребята переписывают всем известную игру (которая выходила лишь на Windows) на MacOS, iOS, Android и Linux.

🔵 Ребята используют оригинальные графические, звуковые и текстовые ресурсы Heroes 3 и создают новую игру, которая должна работать на 100% так же, как H3.
🔵 Новые версии ремейка появляются несколько раз в год, но текущая (вышедшая в конце 2022 и слегка доработанная) практически полностью воссоздает оригинал.
🔵 В VCMI все сделано с нуля — загрузка игровых файлов, прорисовка графики, ИИ, игровая механика и т.д.
🔵 Проект совершенно альтруистичный — ребятам на данный момент (даже при желании) нельзя задонатить (на сайте они честно пишут «we do not have any good idea how to spend potential money from donation»).

Краткий гайд по установке на Mac, если у вас уже чешутся руки нанять архангелов и начать бой
1. Заходите на сайт VCMI и выбираете нужную операционку
2. Скачиваете архив с последней версией
3. Разрешаете запуск программы в Системных настройках
4. Скачиваете данные оригинальной игры (тут кроется спорный момент относительно авторских прав на графику и звук, поэтому решение за вами!)
5. Запускаете игру

Если вам интересно, как разработчики адаптировали игру, то весь код лежит на GitHub в открытом доступе.

Делитесь в комментариях, какие замки или игровые мобы вам нравились больше всего?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4318😱13🤔2
SQL + Markdown = Evidence 🔥
Соскучились по новостям из мира SQL? Тогда держите!

С повсеместным внедрением Notion нам уже кажется утомительным держать несколько сервисов или инструментов одного сервиса (слышишь, Google?) в неудобно интегрируемом или полностью независимом друг от друга состоянии. А если говорить о BI, в частности, при создании отчетов на SQL!

Count, интерактивный редактор для SQL, уже нашел своих поклонников, а теперь ему наступает на пятки готовящийся к релизу продукт Evidence, козырная карта которого — это использование Markdown в дополнение к SQL.

Из плюшек:
1️⃣ возможность автоматизации текста, чтобы отчеты казались написанными вручную,
2️⃣ контроль версий,
3️⃣ разнообразие визуальных форматов.

Примеры можно посмотреть здесь. Как думаете, чего не хватает такому инструменту, чтобы покорить суровые сердца SQLщиков?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍66🔥15🤩61👎1
Как вести телеграм-канал так, чтобы вас читали? ❤️

Наверное, каждый из нас хоть раз задумывался о том, чтобы начать вести свой блог (возможно, кто-то уже начал!) И телеграм — прекрасная площадка, чтобы развивать и монетизировать свой контент. Но с чего начать? Как найти ту самую тему, о которой вы сможете писать годами, и не растерять мотивацию? 😕

Наши спикеры — авторы и эксперты телеграм-каналов. Они не понаслышке знают о том, как вести телеграм-канал, чтобы тебя читали, а не мьютили. В новом выпуске подкаста Data Heroes наши телеграм-звездочки ответят на ряд волнующих вопросов:

🔵 Как набрать аудиторию и по-настоящему заинтересовать её?
🔵 Как выделиться среди серой массы телеграм-каналов?
🔵 Как и когда можно начинать монетизировать канал?
🔵 Что делать, если под постом появились пальцы вниз и какашки?
🔵 Почему телеграм — крутая информационная платформа? Какие особенности у аудитории в телеграме?
🔵 Почему автору необходимо отыскать в себе нарциссическую субличность?

Давайте уже рассекретим все секреты Telegram-каналов? Если готовы, скорее включайте новый эпизод!

СПИКЕРЫ: Арина Семчугова (Setters), Роман Бунин (Reveal the Data), Эля Булочка (Вам в телеграм), Александр Бараков (Data Nature)

Cлушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts, Google, Yandex, Overcast, Mave, Castbox, Telegram (↓)

#подкаст #DataHeroes
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2613❤‍🔥6🤡5👍3
Audio
15🔥10👍8
Курс по созданию промптов для ChatGPT для разработчиков 🧠
На днях наткнулся на довольно прикольный и короткий курс.
Andrew Ng, американский ученый, исследователь машинного обучения и один из основателей Coursera, запустил бесплатный курс «ChatGPT Prompt Engineering for Developers» при сотрудничестве с OpenAI.

Курс состоит из серии небольших видео и ноутбуков Jupyter, в которых показываются примеры. Подойдет новичкам, так как знание Python почти не требуется. Но будет интересен и продвинутым инженерам, которые бы хотели использовать ChatGPT для разработки.

Используя OpenAI API, слушатели курса научатся строить свои собственные решения для, например, таких задач:

🔵резюмирование текста на основе отзывов клиентов;
🔵выделение тем при сентимент-анализе;
🔵трансформация: переводы и редактирование;
🔵генерация различных видов текста (составление писем и прочих средств вербальной коммуникации).

Кстати, отдельно нашел на github сами jupyter-книжки, так как в курсе мне их почему-то скачать не удалось.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥40👍169😱1
VALIOTTI ANALYTICS: WE ARE HIRING! 👀
Наша команда контента снова расширяется и мы ищем диджитал-специалиста с опытом в написании текстов.

Задачи предполагают написание текстов и нетворкинг на английском языке, а основной платформой, на которой придется работать, будет Twitter. Если у вас есть навыки и в том, и в другом и опыт работы в IT или digital-сфере, то вы нам нужны!

Полный текст вакансии мы выложили на HH.

Откликнуться можно на хедхантере или напрямую отправить свое резюме лиду команды @svetlashaa в телеграме.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍94👀3
Курсач прямиком из ChatGPT. А что, так можно было? 👨‍🎓
Пояснение для новобранцев канала: я сейчас учусь в магистратуре в Georgia Tech (США). И сегодня у меня есть неплохие новости для тех, кто сейчас корпеет над курсовыми, чтобы закрыть семестр.

Так как я не фанат теории вероятностей и матстата, да и к тому же всё это проходил, учась еще в СПбГУ, то курс ISYE6644 Simulation and Modeling for Engineering and Science мне показался максимально скучным. Но курсач-то сдавать надо!

Чертенок в футболке «I love ChatGPT» аккуратно поскреб меня по плечу и шепнул на ухо: «Симуляция blackjack».

Итого: 3 часа моего времени = готовая код-база, графики, работа, оформленная в LaTeX!

И вуаля! Мой результат: 88/90. В рецензии проверявший курсовую отметил, что я недостаточно раскрыл как управлять программой и сжато дал выводы. Но работа, в целом, ему понравилась.

Будущее has come! Нас ждут драматические изменения в обучении прямо здесь и сейчас 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍98💩58🔥14😱6🤡4
Аудитория канала продолжает расти и нам хочется узнать вас получше. Нам нужно буквально 5 минут вашего времени и несколько ответов на вопросы.

Сколько вам лет?
Anonymous Poll
1%
Меньше 18 лет
15%
18-24
49%
25-34
29%
35-44
6%
45 или больше
10