Data Secrets
78.8K subscribers
6.42K photos
665 videos
20 files
2.7K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Разрушаем мифы pandas: параметр inplace

Распространенное заблуждение: если менять датафрейм "на месте" (inplace = True), то код будет работать быстрее. Мы провели серию экспериментов и готовы разрушить этот миф. Результаты наверху. Выходит, что изменение на месте чаще всего работает медленнее. Но почему так?

Дело в том, что, вопреки расхожему мнению, большинство операций на месте НЕ предотвращают создание новой копии. Просто inplace возвращает копию по тому же адресу. Но помимо создания копии в этом случае Pandas выполняет некоторые дополнительные проверки, чтобы "убедиться", что DataFrame изменяется правильно. Иногда это может оказаться дорогостоящей операцией.

Вот и выходит: хотели ускорить код, а в итоге замедлили в 2 раза. Не рекомендуем.

😻 #python
Please open Telegram to view this post
VIEW IN TELEGRAM
👍58🤯11👌10😁1
Люк… я твой бэйзлайн

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁809❤‍🔥5👍1🤯1
Что почитать: Грокаем глубокое обучение

Наверное, каждый из нас хоть раз в жизни слышал об известной книге "Грокаем алгоритмы". А вы знали, что есть еще и "Грокаем глубокое обучение"?

Книга по всем законам хорошего тона в техно-литературе начинается с описания основ нейронных сетей и затем подробно рассматривает дополнительные уровни и архитектуры. Внутри:

– Теоретические основы глубокого обучения
– Приемы создания и обучения нейронных сетей
– Работа с естественным языком
– Федеративное обучение и работа с конфиденциальными данными

Сама книга вот. А еще мы нашли к ней дополнительные материалы и блокноты в этом репозитории. Советуем!

😻 #advice
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37🔥125🤯2
Любая LSTM – это своего рода RNN. Но не любая RNN – LSTM ☝️

Так в чем же разница и чем LSTM лучше RNN (про эту архитектуру мы говорили тут)? Разбираемся и рассказываем, как работает LSTM.

😻 #NN
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍255
Breaking news: институт технологических инноваций ОАЭ запустил огромную языковую модель Falcon

И огромная – это не просто слово. В Falcon 180B 180 млрд (!) параметров и она уже заняла первое место в лидерборде HuggingFace. До этого самой большой моделью была LLama-2 с 70 млрд. Есть базовая и чатовая версии.

Вот уж откуда не ждали…

🤗 Веса и код
🦾 Демо

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍38🔥129
9 сентября Сбер приглашает IT-специалистов поучаствовать в отборе: пройти все интервью, познакомиться с командой и, возможно, даже получить оффер.

Какими задачами занимаются DS-специалисты крупнейшего банка страны? 👇

✔️ Обучают все модели искусственного интеллекта: от классического ML до глубоких нейронных сетей.
✔️ Создают инновационные сервисы от систем принятия решений до компьютерного зрения и обработки естественного языка
✔️ Развивают блочное хранилище на Teradata и DataLake на Hadoop.
✔️ Работают на Python, Spark, SQL, Hadoop, GreenPlum.

За год команда разрабатывает и внедряет более 200 моделей для отделений банка, приложений, колл-центра, банкоматов и так далее, поэтому работа точно будет интересной и разнообразной.

Переходите по ссылке и регистрируйся на One Day Offer, чтобы получить оффер мечты! 💚
👍104🔥2🤯1
В стране DS жили-были два зверя: панда и скуль. И говорили они на разных языках....

От этого временами страдали все мирные жители этого прекрасного государства. Но однажды доблестные редакторы из замка Data Secrets сделали словарь, в котором собрали и перевели все самое важное с одного языка на другой. После этого все жили долго и счастливо и ставили на этот пост лайки. Конец!

😻 #python #SQL
Please open Telegram to view this post
VIEW IN TELEGRAM
103👍36🔥17😁6❤‍🔥3
Новый релевантный бельгийский ужастик AKA комедия для DS-ника

Сначала мы думали, что там покажут CUDA out of memory. Но потом оказалось, что не все так страшно: там просто нейросеть порабощает человечество. Тем не менее, фильм не рекомендуется к просмотрю людям со слабой психикой и торчфобией.

300 🔥 и админы на день превратятся в DS comedian: сходят на это в кино и сделают обзор

😻 #хаха
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2576😁4👍2❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Стартовал чемпионат мира по Excel

Да, вы не ослышались. Чемпионат мира по Excel. Он пройдет в Лас-Вегасе. Победитель получит 15 400 долларов (1,5 миллиона рублей). Участникам предстоит решать задачи за отведенное время, а комментаторам — восхищаться.

Главбух уже выдвигается в Вегас

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍66😁30🤯15🤔1🙈1
TheilSenRegressor – устойчивый к выбросам близнец регрессии

Линейная регрессия – основа основ машинного обучения. Она прекрасна и часто работает гораздо лучше более сложных алгоритмов. Но есть проблема: она не устойчива к выбросам. Даже несколько выбросов могут существенно навредить итоговому скору. Но есть решение – TheilSenRegressor. Рассказываем.

😻 #train
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍636🔥3🤯2
Яндекс показал YandexGPT 2. Что нового?

Вчера на Practical ML Conf Яндекс рассказал об обновлении своей нейросети. В 67% запросов новый GPT дает более качественный ответ чем предыдущая версия.

Обновленная нейросетка предлагает более интересные идеи и лучше обрабатывает запросы с несколькими условиями – может одновременно сократить текст, озаглавить, переформулировать предложения. Еще YandexGPT 2 неплохо рифмует, пишет код и подстраивается под заданный стиль.

Попробовать можно в навыке Алисы “Давай придумаем”, который есть
– в приложении Яндекса
– на Станции Яндекса
– на ya.ru

😻 #news
Please open Telegram to view this post
VIEW IN TELEGRAM
👍20😁521🔥1😐1
Вдохновились бельгийцами и их новым хоррором и решили устроить интерактив

Задание: замените название любого фильма словом «нейросеть». Мы начнём: «Гарри Поттер и дары нейросети».
👍207🕊4😁2
Минутка черной аналитики юмора

😻 #memes
Please open Telegram to view this post
VIEW IN TELEGRAM
😁100🔥8😨3😐2
А вы что-нибудь слышали про Ангилью?

Это такой небольшой остров в Карибском море. Его площадь чуть меньше площади Новгорода, там почти нет природных ресурсов, и живет Ангилья только за счет туристов.

Точнее, так было раньше. В конце прошлого века у острова появился национальный домен .ai. Понимаете, куда мы клоним? Начиная с 2009 года в зоне Ангильи появились Stability.ai, X.ai Илона Маска, Character.ai и многие другие стартапы и компании в области ИИ. И спрос продолжает расти.

По данным управляющего доменами острова, в 2017 Ангилья получила от регистрации сайтов миллион долларов, а в 2023 году, по предварительной оценке, доходы составят $25–30 млн.

Повезло, повезло

😻 #forfun
Please open Telegram to view this post
VIEW IN TELEGRAM
👍34🔥1121
Forwarded from XOR
Mojo🔥 - It’s finally here!

С момента запуска языка программирования Mojo 2 мая более 120 тыс. разработчиков зарегистрировались для использования Mojo Playground, а 19 тыс.+ разработчиков активно обсуждают Mojo до сих пор.

Позавчера разработчики объявили о следующем большом шаге в эволюции Mojo: Mojo теперь доступен для локальной загрузки. Ссылка для скачивания – https://developer.modular.com/. (Для тех, кто еще не слышал о новом языке, ссылка на пост).

@xor_journal
27👍12🔥4