Интернет полон всевозможных схем и объяснений принципов работы LLM, но такую красивую 3D-визуализацию видим впервые. Она показывает, как модель с 85 000 параметров расставляет набор из 6 букв по алфавиту.
Кроме nano-gpt, на примере которой автор показывает алгоритм работы, по ссылке есть еще три 3D-модели — GPT-2 (small и XL) и GPT-3. Можно покрутить их и сравнить масштабы.
Please open Telegram to view this post
VIEW IN TELEGRAM
Как можно догадаться как минимум по названию канала, мы тут очень любим SQL и всегда рады увидеть людей, которые эти чувства разделяют.
Например, вот — коллега написал целую статью про свой любимый запрос. Случай он описал действительно любопытный. Не будем спойлерить, но для затравки покажем сам запрос:
SELECT count(*)
FROM one_thousand
INNER JOIN one_thousand ON random() < 0.5
Где
one_thousand — это таблица с одним столбцом с числами от 0 до 999.Как думаете, какой результат выдаст этот запрос? Ответ не так уж очевиден, как может показаться.
Зовем в комментарии — расскажите, догадались, какой будет результат? Или, может, готовы поделиться своим любимым SQL-запросом? Наверное, какой мы любим больше всего, догадаться несложно.
Please open Telegram to view this post
VIEW IN TELEGRAM
Хотим поделиться основательным лонгридом, который помогает разобраться в том, как устроены базы данных. Автор — программист Тони Соломоник — последовательно и наглядно, переходя от самой примитивной БД к более сложным, рассказывает о главных принципах их работы.
Тони написал этот текст после того, как осознал, что сам недостаточно разбирается в базах данных и их особенностях. Поиск в интернете не помог, поэтому он решил подойти к делу основательно.
Что там есть:
Please open Telegram to view this post
VIEW IN TELEGRAM
Кстати, хотите подробнее почитать про ACID? У нас есть про них целая статья!
Anonymous Poll
63%
Конечно, хотим!
13%
Я и так все знаю!
25%
А я просто хочу чекнуть результаты
Сегодня будет кратко. Так сказать — без лишних слов. 😏
Зарезервированные слова в языках программирования — это слова, которые нельзя использовать в качестве идентификаторов, то есть названий объектов, переменных, функций и так далее.
В SQL есть большой список слов, которые не могут выступать в качестве имен для объектов баз данных, таблиц, столбцов. Выучить их все целиком вряд ли получится и вряд ли необходимо, но лучше иметь под рукой шпаргалку — а то и две.
Если было полезно, не забудьте сохранить пост к себе!
Please open Telegram to view this post
VIEW IN TELEGRAM
Признаем, отсылка в заголовке несколько потеряла актуальность, но сегодня она оправданна.
Цвет — мощный инструмент управления вниманием. Он может помочь выделить главное и расставить акценты, а может сделать график абсолютно нечитабельным.
В блоге сервиса для визуализации данных DataWrapper, автор рассказала, как грамотно использовать цвет в своих графиках.
Для начала — закрасить все серым.
А потом:
Так постепенно оттенки серого заменят другие цвета, а график будет становиться все более информативным и классным.
Please open Telegram to view this post
VIEW IN TELEGRAM
В армии Древнего Рима специально назначенные люди — тессерарии — передавали солдатам от командования пароли на глиняных табличках. Пароль, который менялся каждый день, надо было очень постараться не забыть, чтобы не получить мечом по голове от караульного.
В течение последующих пары тысяч лет способы аутентификации усовершенствовались, стали надежнее и немного дружелюбнее к пользователю. По крайней мере, теперь у нас есть кнопка «Забыли пароль?»
История развития способов аутентификации — это история борьбы между безопасностью и комфортом. И если в Древнем Риме о последнем не особо заботились, то сейчас необходимость постоянно выдумывать, менять, запоминать или где-то хранить все более сложные пароли многих раздражает.
К такому выводу пришел автор одного субъективного, но логичного рейтинга методов подтверждения личности, к которым люди прибегали на протяжении веков. Да, веков — он начал с библейской Книги Судей и уже упомянутого Древнего Рима, а закончил современной многофакторной аутентификацией.
Сам он ждет наступления счастливого беспарольного будущего. А что думаете вы?
Пароли из минимум n символов с буквами, цифрами и спецсимволами — необходимость или пережиток?
Please open Telegram to view this post
VIEW IN TELEGRAM
Про Excel все только и говорят, какой это мощный инструмент и как много у него разных возможностей, о которых некоторые пользователи даже не подозревают.
Их и правда много, но иногда хочется просто по-человечески сказать: «Посчитай среднее в столбцах A и B, а потом найди корреляцию между двумя диапазонами», а не писать длинную сложную формулу. А потом еще разбираться, почему она выдала ошибку на этот раз.
И вот тут на помощь приходит искусственный интеллект в виде сервиса Excelly-AI. Он умеет составлять формулы по запросу, объяснять их значение, трансформировать формулы Excel в формат Google Sheets и обратно, писать код на VBA.
Бесплатно можно сгенерировать 5 формул в месяц, больше — только по подписке. Всем сомневающимся, стоит ли ее оформлять, команда сервиса предлагает посчитать, сколько денег он может сэкономить.
Правда, для расчета понадобится сначала выяснить, сколько часов в неделю ваши сотрудники тратят на поиск нужных формул в интернете. Не уверены, что много кто собирает подобные данные, но вдруг.
Please open Telegram to view this post
VIEW IN TELEGRAM
Как-то раз мы писали про приложение на Mac, которое во время нажатия на клавиши выдает через динамики щелчки механической клавиатуры. Вариант специально для тех, кому не нравится печатать на слишком тихих клавиатурах Apple.
Приложение бесплатное и доступное всем — поддерживает Windows, Mac и Linux.
Самое то, чтобы принести ноутбук в людное место, выкрутить звук на максимум и начать творить.
Please open Telegram to view this post
VIEW IN TELEGRAM
Уже даже Большому Брату следить за нами становится тяжеловато.
Bloomberg рассказал про нелегкие будни американских шпионов. Казалось бы, причем здесь данные?
Скажите ведь, звучит это все на удивление жизненно? Гора разрозненных данных из кучи источников, все по отдельным табличкам, и никто толком не понимает, где что лежит и как это собрать в кучу.
В следующий раз, когда столкнетесь с чем-то подобным, можете успокоить себя тем, что это проблема не уникальная, а общечеловеческая и не чуждая даже американской разведке.
Please open Telegram to view this post
VIEW IN TELEGRAM
Мы часто пишем про данные и аналитику в развлекательном ключе. Находим для вас интересные новости или статьи, делимся полезными приложениями и иногда постим мемы.
Но вообще-то аналитика — это серьезный инструмент, который помогает раскрыть потенциал бизнеса. И это не просто громкий рекламный слоган.
Мы много работаем с EdTech — и небольшими проектами, и международными онлайн-школами из разных стран. И на их примере видим, как правильно настроенная система аналитики меняет все.
P.S. Если знаете кого-то, кому это может интересно — расскажите им! Mожет быть, благодаря вам, какой-то EdTech-проект перейдет на наш любимый data-driven подход.
Please open Telegram to view this post
VIEW IN TELEGRAM
Этим вопросом задаются многие люди старше 30 лет, и наконец-то наука нашла ответ.
Авторы исследования взяли 1000 студентов американского вуза и спросили, за какую сумму те будут согласны на 4 недели деактивировать свои аккаунты в соцсетях. Они сравнили, как менялись ответы в зависимости от условий: если друзья опрошенных тоже уходили с этих сайтов и если они продолжали на них сидеть.
Вот так графики показали, что вынуждает людей листать бесконечную ленту с фотками и видео с котами — неумолимое давление со стороны окружения.
Please open Telegram to view this post
VIEW IN TELEGRAM
Но не людей, как Nokia, а данные.
Работать было бы проще, если бы всегда приходилось иметь дело с одним аккуратным, упорядоченным датасетом. Но нередко приходится разбираться, как объединить несколько таблиц в одну.
Делимся лонгридом, где автор рассматривает два способа — горизонтальный и вертикальный.
inner join, full join, left join, right join — для какой задачи подходит, автор рассказывает и показывает с картинками и примерами кода. И, кстати, делает это очень здорово и без диаграмм Венна. В итоге вы получите таблицу, которая увеличивается «горизонтально» — то есть столбцов у нее будет больше, чем у таблиц, на основе которых она была создана. Количество строк при этом может либо уменьшиться, либо тоже увеличиться.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
Преподаватель Бенджамин Брин, который нашел любопытное применение ChatGPT. Он использовал нейросеть как тренажер для своих студентов, где те моделировали ситуации из прошлого — например, из охваченного чумой Парижа. Они должны были проанализировать историческую достоверность симуляции и написать про это эссе.
Еще в сентябре Брин отметил рост заинтересованности в учебе со стороны студентов. А теперь у него накопилось достаточно данных, чтобы подтвердить свои слова статистикой.
Главной проблемой этого подхода так и остается точность симуляций. Хотя Брин верит, что этот недостаток можно будет со временем преодолеть.
Возможно, нам и не надо стремиться к идеальной точности. Главное достоинство нейросетей — в том, что они помогают подстегнуть воображение и по-новому взглянуть на знакомые темы. Они не замена привычным способам обучения, а просто новый инструмент для преподавателей, ученых и писателей.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🤡5
Пост для начинающих аналитиков, BI-специалистов и всех, что хочет подтянуть знание SQL. Делимся проверенными курсами и тренажерами, которые помогут освоить основы.
Надеемся, что было полезно.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2🥰2
Когда речь заходит про нейросети, большинство вспоминает про ChatGPT, Midjourney, Stable Diffusion, Sora и так далее.
У них функционал все более впечатляющий с каждой новой версией и одновременно понятный: генерация текстов, изображений и видео по запросу. Их уже используют в самых разных сферах — создают рекламные креативы, «прикручивают» к чат-ботам, пишут дипломы.
Но ИИ используется и для более узких, специализированных задач. Пример: TimeGPT — модель, которая анализирует временные ряды.
Анализ временных рядов используется, чтобы составить прогноз изменений, выявить тенденции и закономерности. Это непростая задача, которая решается с помощью сложных математических моделей. Неудивительно, что появилась ИИ-альтернатива, которая призвана сделать анализ временных рядов быстрым и доступным.
Ее предложила компания Nixtla
Подробнее про бенчмарк, а также саму модель и ее архитектуру они рассказали в своей работе на arxiv.org.
Сейчас TimeGPT находится в бете — нужно подать заявку, чтобы принять участие в тестировании. Но уже доступны несколько open source-инструментов, которые умеют предсказывать погоду и изменения экономических показателей.
Please open Telegram to view this post
VIEW IN TELEGRAM
Расскажите о себе!
Про себя и наши проекты мы рассказываем часто, а теперь хотим поближе познакомиться с вами. Ответьте, пожалуйста, на вопросы ниже — это поможет понять, кто нас читает и какой контент для вас будет наиболее полезным!
Сколько вам лет?
Про себя и наши проекты мы рассказываем часто, а теперь хотим поближе познакомиться с вами. Ответьте, пожалуйста, на вопросы ниже — это поможет понять, кто нас читает и какой контент для вас будет наиболее полезным!
Сколько вам лет?
Anonymous Poll
33%
Меньше 18
38%
18-24
16%
25-35
8%
36-45
5%
Больше 45
Охарактеризуйте себя
Anonymous Poll
15%
Переквалифицируюсь в IT-специалиста
4%
Junior-Data-аналитик/инженер
4%
Middle-Data-аналитик/инженер
1%
Senior-Data-аналитик/инженер
6%
Head of Data
6%
Маркетолог/SMM-менеджер
2%
Product/Project-менеджер
8%
Руководитель отдела
12%
Собственник компании
43%
Посмотреть результаты
Где вы сейчас живете?
Anonymous Poll
61%
Россия
7%
Украина
10%
Казахстан
3%
Беларусь
1%
Грузия
3%
Армения
1%
Сербия
1%
Турция
13%
Другое
Row Zero — новый облачный инструмент для работы с данными, который среди аналогов выделяется тем, что умеет быстро обрабатывать очень большие объемы данных.
Убедиться, насколько правдивы обещания разработчиков, можно прямо сейчас, бесплатно и без регистрации
Please open Telegram to view this post
VIEW IN TELEGRAM
Сложно это признавать, но SQL неидеален. Он может быть очень сложным, а запросы, как ни оптимизируй, иногда получаются ужасно громоздкими.
Некоторых это подталкивает к созданию альтернатив — более гибких и удобных языков запросов.
На сайте проекта можно потестить, как это работает, и найти ссылки на GitHub и блог разработчиков.
Please open Telegram to view this post
VIEW IN TELEGRAM