Библиотека дата-сайентиста | Data Science, Machine learning, анализ данных, машинное обучение
18.7K subscribers
2.25K photos
113 videos
64 files
4.66K links
Все самое полезное для дата сайентиста в одном канале.

По рекламе: @proglib_adv

Курс по ML: https://clc.to/4hNluQ

Для обратной связи: @proglibrary_feeedback_bot

РКН: https://gosuslugi.ru/snet/67a5b03124c8ba6dcaa121c9
Download Telegram
🧑‍💻 Статьи для IT: как объяснять и распространять значимые идеи

Напоминаем, что у нас есть бесплатный курс для всех, кто хочет научиться интересно писать — о программировании и в целом.

Что: семь модулей, посвященных написанию, редактированию, иллюстрированию и распространению публикаций.

Для кого: для авторов, копирайтеров и просто программистов, которые хотят научиться интересно рассказывать о своих проектах.

👉Материалы регулярно дополняются, обновляются и корректируются. А еще мы отвечаем на все учебные вопросы в комментариях курса.
📊«Мои мысли о Python in Excel»

На «Хабре» опубликовали перевод поста автора книги O’Reilly Python for Excel. Он протестировал Python in Excel — новую функцию Microsoft, которая позволяет писать Python-код прямо в Excel.

Вот вкратце выводы разработчика:

▪️С новой функцией мы получили альтернативу языку формул Excel;
▪️Интеграция ячеек ноутбуков Jupyter внутри сетки Excel была ошибочным решением;
▪️Python in Excel не подходит ни для новичков в Python, ни для интерактивного анализа данных;
▪️На данный момент у функции слишком много ограничений (невозможно использовать собственные пакеты и нельзя подключаться к веб-API);

🔗 Читать статью целиком
5👍2
👪 Истоки линейной регрессии и загадка её названия

Линейную регрессию принято изучать одной из первых, когда речь заходит про машинное обучение. Однако эта модель полностью статистическая и появилась в науке давным-давно. 

🔹Регрессия пришла к нам из работ Сэра Фрэнсиса Гальтона, английского исследователя (а ещё основоположника учения евгеники), жившего в 19 веке. В ходе изысканий он обнаружил следующий феномен: «размер потомков не стремится к размеру родительских особей; он всегда стремится к среднему значению — становится меньше, если родители были большими, и больше, если родители были очень маленькими». 

Сначала Гальтон назвал это явление реверсией. Однако вскоре стало ясно, что происходит нечто иное, чем однонаправленный генетический процесс. Гальтон проанализировал взаимосвязь роста 930 детей со средним ростом их родителей и пришёл к выводу, что средний рост для тех и для других равен примерно 68,2 дюймам (173 см). Затем он рассмотрел ситуацию, в которой средний рост родителей находился в промежутке от 70 до 71 дюйма, а значит рост их детей соответствовал приблизительно 69,5 дюймам. Это означало, что рост детей отличался от среднего роста всех детей на меньшую величину, чем рост их родителей от среднего роста всех родителей. То есть происходила регрессия показателя. Отсюда, собственно, и пошёл известный нам термин.
👏16🔥5🥰21
👾 Сооснователь OpenAI запустил новую компанию — Safe Superintelligence Inc. (SSI)

Об этом Илья Суцкевер сообщил в X. В программном заявлении компании говорится, что «создание безопасного сверхинтеллекта — важнейшая техническая задача современности». И именно этим займутся в SSI.

Компания открыла офисы в Пало-Альто (Калифорния, США) и Тель-Авиве (Израиль). Сейчас она находится в поиске талантов.
🌚7
🚀 Meta* выпустила сразу 4 новых модели и датасет

Команда Meta Fundamental AI Research (FAIR) решила поделиться нескольими своими проектами. Все они доступны любому желающему.

🔹Meta Chameleon
Это семейство мультимодальных больших языковых моделей (LLM).

🔹Multi-Token Prediction
Модель, способная предсказывать сразу несколько токенов за раз.

🔹JASCO
Модель для генерации аудио. Может принимать на вход аккорды, ритмы и др.

🔹AudioSeal
Модель для добавления водяных знаков на сгенерированный аудиоконтент.

🔹PRISM
Датасет, содержащий предпочтения людей и их отзывы на беседы с 21 разными LLM.

🔗 Прочесть обо всё подробнее можно здесь

*организация, деятельность которой запрещена на территории РФ
4👍1
🚩🚩🚩 Что для вас красные флаги во время интервью/собеседования? Иными словами, какие вещи могут оттолкнуть вас от работодателя?

👇Пишите в комментариях👇

#интерактив
Forwarded from Библиотека программиста | программирование, кодинг, разработка
❤️🙏 Помните историю автора «Библиотеки программиста» Станислав Герасимов? Станислав — инвалид с детства. В статье он рассказывал, как получил диплом и строит карьеру в IT.

❗️ В обновленной статье читайте продолжение его истории. И самое главное: очень скоро он отправляется на операцию и ему нужна ваша помощь.
🙏5😁2🔥1
🤼‍♀️ «Я тебя с вертухи сломаю, если ещё раз заговоришь об ИИ»

Бывалый дата-сайентист поделился своим разочарованием от того, как сейчас обстоят дела в этой сфере.

Поэтому с глубочайшим сожалением должен объявить, что следующий человек, который начнёт говорить мне о реализации ИИ, получит от меня сеанс живительных процедур над позвоночником; иными словами, я сломаю ему нафиг шею.


Автор считает, что:
▪️в сфере много мошенничества;
▪️многие люди слишком сильно верят в ИИ и не понимают, как он работает;
▪️вокруг ИИ много хайпа.

👉 В подробностях можно прочитать в переводе поста на «Хабре»
🔗 Ссылка на оригинал
🌚8😁5👍3
#️⃣🔢 Логические и математические задачи с собеседований

Мы подготовили нетривиальные задачи математического и логического характера с собеседований, чтобы помочь вам лучше подготовиться к следующим вызовам. В статье вы найдете задачи, которые нередко встречаются на интервью и могут стать настоящим испытанием даже для опытных разработчиков.

🔗 Читать статью
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
👌 Deep Learning на пальцах

Это бесплатный курс по глубокому обучению, который читает исследователь MIT Семён Козлов. В том же объёме курс читается и для магистрантов Новосибирского Государственного Университета, а также студентов CS центра Новосибирска.

Хоть он проходил в мае, на сайте доступны видеолекции, слайды, а также задания по курсу. Вот темы, которые он охватывает:

▪️Python, numpy, notebooks
▪️Нейронные сети
▪️PyTorch и подробности
▪️Введение в NLP, компьютерное зрение, распознавание речи и обучение с подкреплением.

🔗 Ссылка на материалы
👍11
Forwarded from Библиотека программиста | программирование, кодинг, разработка
💡 Кем работать в IT, если ты гуманитарий: 10 альтернативных профессий

Думаете, что IT — это только для технарей? Мы развеем этот миф и расскажем о 10 профессиях, которые идеально подойдут гуманитариям.

🔗 Читать статью
🔗 Зеркало
👍4
🤖 Напоминаем, что у нас есть еженедельная email-рассылка, посвященная последним новостям и тенденциям в мире искусственного интеллекта.

В ней:
● Новости о прорывных исследованиях в области машинного обучения и нейросетей
● Материалы о применении ИИ в разных сферах
● Статьи об этических аспектах развития технологий
● Подборки лучших онлайн-курсов и лекций по машинному обучению
● Обзоры инструментов и библиотек для разработки нейронных сетей
● Ссылки на репозитории с открытым исходным кодом ИИ-проектов
● Фильмы, сериалы и книги

👉Подписаться👈
🔥1
👀 Работа с YOLOV8. Детекция, сегментация, трекинг объектов, а также подготовка собственного датасета и обучение

На «Хабре» опубликовали туториал для новичков. В нём рассказывается, как:

▫️как установить YOLO и начать детекцию объектов на фото;
▫️как детектировать объекты в видеопотоке;
▫️как проводить сегментацию изображения;
▫️как использовать YOLO для задачи классификации;
▫️как создать собственный датасет.

🔗 Читать статью
🎉9👍2
🎓 Продвинутый SQL: секреты профессионалов

Рассказываем о сложных стратегиях оптимизации запросов, продвинутых типах соединений и тонкостях использования SELECT.

Читать статью

#туториал
👍9👏3
data-analyst.pdf
106.1 KB
📊 Дорожная карта аналитика данных

На roadmap.sh появилась дорожная карта аналитика данных. Она позволит сориентироваться в профессии и построить план её освоения.

🔗 Ссылка на интерактивный вариант карты
6👍3🎉2🥱1🌚1
Это #дайджест для всех, кто работает с искусственным интеллектом

👾 TokenCost
Это библиотека для простого подсчёта токенов при работе с большими языковыми моделями.

👾 Почему модель не работает?
Это перевод статьи о распространённой проблеме: на обучении модель выглядит хорошо, но на реальных данных отрабатывает плохо.

👾 Анализ производительности моделей YOLOv8
Автор делал замеры производительности и точности работы моделей YOLOv8 на разных устройствах с различными оптимизациями и без них.

👾 Transcendence: Generative Models Can Outperform The Experts That Train Them
Интересная статья про то, что если модель обучить на ходах «слабых игроков», то она будет играть лучше, чем лучшие шахматисты датасета.

👾 NVIDIA Warp
Это Python-фреймворк, компилирующий обычные функции в эффективный код ядра, который может выполняться как на CPU, так и на GPU.
🔥4👍1
Привет, друзья! 👋
Мы готовим статью о типичных ошибках начинающих разработчиков. И нам очень нужна ваша помощь! 🙏
Поделитесь своим опытом и мнением в комментариях:
С какими сложностями вы сталкивались в начале своего пути в разработке?
Какие ошибки допускали и как их исправляли?
Что помогло вам быстрее расти профессионально?
Самые интересные и полезные советы мы обязательно включим в статью, а их авторов упомянем в публикации! 😊
🔥2
👾 Дуэт для старта в Data Science

Когда все казалось потерянным и надежда на карьеру в DS и аналитики исчезала. Он часами изучал возможности, но так и не находил выхода.

Но появилась она, с предложением, которое изменит всё…

...до 30 июня курс по математике за полцены и курс по Machine Learning в подарок

🛍14 990 ₽ (вместо 29 990 ₽)🛍

Что ждёт вас на курсе:

⭐️Полугодовая программа от преподавателей ВМК МГУ

⭐️47 видеолекций и 150 практических заданий

⭐️Бессрочный доступ ко всем материалам курса

⭐️Развернутая обратная связь по всем домашним заданиям и ссылки на полезные дополнительные материалы

🫶 Воспользуйтесь шансом, чтобы начать свой путь в Data Science – https://proglib.io/w/13f7fde5
Please open Telegram to view this post
VIEW IN TELEGRAM
😁1