Data Scientist | IT
1.94K subscribers
652 photos
3 videos
1 file
708 links
Добро пожаловать в клуб.

Полезные материалы из мира DS & ML на регулярной основе.

По всем вопросам: @godinmedia
Download Telegram
Расширенные функции Apache Flink

#почитать

Что такое rich-функции в Apache Flink, зачем они нужны, чем отличаются от обыкновенных UDF и как с ними работать: простой пример на PyFlink с запуском в Google Colab.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Реактивно быстрое введение в машинное обучение для чайников

#почитать

Хорошая статья для первого знакомства с темой


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2
📚 Друзья, для тех, кто хочет ознакомиться с большим количеством книг по тестированию, есть отличный телеграм-канал — Библиотека QA

Совместно с Библиотекой QA мы подготовили бриллиантовую 💎 подборку книг для обучения тестированию. Все эти книги можно бесплатно скачать у ребят на канале:

💎 "Тестирование программного обеспечения. Основы" Захаров В.В.
Обзор базовых понятий и методик тестирования программного обеспечения, подходящий для студентов и начинающих специалистов в области ИТ.

💎 "Эффективное тестирование" на русском Maurício Aniche
Практическое пособие по улучшению процессов тестирования с использованием различных техник, включая тестирование на основе данных и автоматизацию.

💎 "Тестирование DOT COM" Роман Савин
Практическое руководство по тестированию веб-приложений, в котором автор делится своим опытом и методами выявления и устранения багов.

💎 «Тестирование программного обеспечения. Базовый курс» Святослав Куликов
Введение в основы тестирования программного обеспечения, охватывающее ключевые концепции, методы и инструменты для начинающих тестировщиков.

💎 «Как тестируют в Google» Джефф Каролло, Джеймс Уиттакер, Джейсон Арбон
Описание уникальных подходов и практик тестирования, применяемых в Google, с акцентом на автоматизацию, масштабируемость и инновации.

💎 "Сам себе тестировщик. Пошаговое руководство по тестированию ПО" Чхави Радж Досадж
Пошаговое руководство, предназначенное для тех, кто хочет начать карьеру в тестировании программного обеспечения, с множеством примеров и практических советов.


🐞 Подписывайтесь на Библиотеку QA
👍52🔥1
Я тебя с вертухи сломаю, если ещё раз заговоришь об ИИ

#почитать

Лично я получил формальное образование дата-саентиста, даже выиграв в высококонкурентном конкурсе по машинному обучению в одном из лучших университетов Австралии и написав магистерскую, для которой создал в MATLAB с нуля собственные библиотеки. Я не гений в этой сфере, но, очевидно, лучше большинства конкурентов, то есть практиков вроде меня; я не могу, сидя в пещере, создавать собственные библиотеки на C, но умею читать учебники, реализовывать готовые решения на языках высокого уровня и использовать библиотеки, написанные элитными организациями.

Поэтому с глубочайшим сожалением должен объявить, что следующий человек, который начнёт говорить мне о реализации ИИ, получит от меня сеанс живительных процедур над позвоночником; иными словами, я сломаю ему нафиг шею.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Пятничное. "Netflix знает о нас все"

#почитать

Одним из наиболее значительных достижений в рамках Netflix Prize стало широкое использование методов матричной факторизации, а также машин Больцмана. Эти методы позволяли моделировать скрытые (латентные) факторы, которые определяют предпочтения пользователей и характеристики фильмов. Буквально, Netflix попыталась залезть в когнитивные привычки зрителей.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
▫️ Advanced Colab - How to go Beyond the Basics

#посмотреть

Some of the more advanced features in Google Colab and to customize it.

Смотреть на YouTube 15 минут
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Бизнес-аналитик — канал для тех, кто уже работает или хочет работать в бизнес-анализе.

Если вам кажется, что
◾️бизнес-анализ это просто
◾️писать user stories просто
◾️клиент понимает, как устроена разработка

подписывайтесь на канал и мы развеем эти мифы. Плюс ко всему, там вы найдете кучу полезных статей и видео по теме.

Подписаться можно по ссылке: @business_analyst_ru
👍6🔥1
LLMops: что есть, кроме ChatGPT, и как это развернуть

#почитать

В статье вас ждёт: обзор LLM-моделей, техники работы с ними через призму MLOps, разбор лицензий и требований к железу. А так же трюки с квантизацией и файн-тюнингом «на сладкое».

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥61
Можно ли научить нейросеть определять иронию (да, вполне)

#почитать

Акустический и паралингвистический анализ показал, что все хорошо распознанные иронические и неироничные высказывания в эксперименте с аудио были синхронизированы с одним из жестов. Направление жеста в 100% случаев соответствовало направлению движения тона как в ироничных, так и в неироничных высказываниях. Вершина жеста совпала с началом ядра (интонационного центра). Большинство правильно оцененных иронических высказываний сопровождались движением головы, примерно в трети случаев наблюдалась дополнительная огубленность. Например, при произнесении гласного «а» или «и» губы округлялись, как при произнесении «у», чуть реже с интонационным центром совпадали движения руками или глазами. Интересно, что подобное совпадение было характерно и для актерской речи без иронии. Главным же отличием иронической мимики и жестикуляции стала ее комплексность – т.е. одновременная реализация нескольких движений. В нейтральной речи такие совпадения наблюдались гораздо реже.

Другим интересным фактом было то, что направление движения жестикулятора в большинстве исследованных отрывков, как ироничных, так и неироничных, совпадало с направлением движения тона – мелодической кривой. Например, актер или актриса одновременно с падением тона опускали руку вниз, опускали взгляд, делали кивок головой и т.д.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍1
Как я стал специалистом по машинному обучению. Open AI и Dota 2

#почитать

Инвестор и разработчик ПО, один из основателей и президент компании OpenAI. Начал свою карьеру в компании Stripe в 2010 году и стал ее CTO в 2013 году. Покинул Stripe в 2015 году, чтобы стать соучредителем OpenAI.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2
Метрики оценки качества моделей и анализ ошибок в ML. Подробно

#почитать

Рассмотрены популярные метрики для задач классификации, регрессии и кластеризации, а также инструмент для анализа ошибки модели, известный как bias-variance decomposition. Помимо этого, для большей части метрик будут представлены ручные расчёты и реализация с нуля на Python, а в конце вы сможете найти дополнительные источники для более глубокого ознакомления.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥2
🔥 Бриллиантовая подборка книг по Agile, которую мы составили совместно с каналом @pm_lib — кликайте по ссылкам, забирайте себе и читайте! А еще — подписывайтесь на @pm_lib. Там регулярно выкладвают свежие книги по Project- и Product-менеджменту на русском языке!

💎 Чистый Agile. Основы гибкости (2020) — Роберт Мартин
Роберт Мартин в своей книге объясняет основные принципы и практики Agile, которые помогают командам достичь гибкости и эффективности в разработке программного обеспечения.

💎 Agile-менеджмент. Лидерство и управление командами (2018) — Юрген Аппело
Эта книга раскрывает принципы Agile-менеджмента, фокусируясь на лидерстве и эффективном управлении командами, чтобы повысить их продуктивность и мотивацию.

💎 Постигая Agile. Ценности, принципы, методологии (2018) — Эндрю Стеллман, Дженнифер Грин
Книга охватывает ключевые аспекты Agile, включая его ценности, принципы и методологии, предлагая читателям глубокое понимание гибких подходов к управлению проектами.

💎 Agile для всех. Создание быстрой, гибкой, клиентоориентированной компании (2019) — Мэтт Лемей
Мэтт Лемей делится стратегиями, как сделать компанию более гибкой и ориентированной на клиента, применяя Agile подходы во всех аспектах бизнеса.

💎 12 шагов к гибкому бизнесу (2019) — Гайдн Шонесси, Фин Голдинг
Авторы предлагают пошаговое руководство по внедрению Agile в бизнес-процессы, чтобы компании могли быстрее адаптироваться к изменениям и повышать свою конкурентоспособность.

💎 Эпоха Agile. Как умные компании меняются и достигают результатов (2019) — Стивен Деннинг
Стивен Деннинг исследует, как успешные компании применяют Agile принципы для достижения высоких результатов и устойчивого роста в условиях быстро меняющегося рынка.
🔥5👍2
Неочевидное ML

#почитать

Казалось бы, нам всем так прожужжали уши аббревиатурой «ИИ», что с ней всё уже очевидно.

Но весь хайп последних лет крутится вокруг нескольких сценариев: «нарисуй картинку», «напиши код», «ответь на вопрос».

И по-моему, сейчас самое интересное — это менее заезженные применения. Окей, стало можно одним промптом нарисовать капибару верхом на драконе, это мы поняли. А вот чем нейросети могут помочь инженерам, редакторам или неслышащим людям? До чего дошёл прогресс, в чём сложности, как их преодолевают?


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
Машинное обучение в браузере

#почитать

Как ускорить вычисления машинного обучения веб приложения с помощью WASM, WebGL или WebGPU.

Когда фронтенд‑разработчик слышит о машинном обучении в браузере, первое, что приходит ему на ум, это вопрос: «Как это может быть применено? Мы же работаем в браузере на JS, который, как известно, медленный (по сравнению с компилируемыми языками)».

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥21
Популярные алгоритмы машинного обучения. Теоретические основы и реализация с нуля на Python

#почитать

Обучение с учителем:

1) Линейная регрессия и её модификации
2) Логистическая и Softmax-регрессии
3) Линейный дискриминантный анализ (LDA)
4) Наивный байесовский классификатор
5) Метод опорных векторов (SVM)
6) Метод K-ближайших соседей (KNN)
7) Дерево решений (CART)
8) Бэггинг и случайный лес
9) Алгоритмы AdaBoost (SAMME & R2)
10) Градиентный бустинг и его модификации
11) Стекинг и блендинг

Обучение без учителя:

12) Метод главных компонент (PCA)
13) Популярные алгоритмы кластеризации

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥1
Как написать своего нейросотрудника

#почитать

Конечно, прекрасно подключить API от OpenAI и разыграть своего руководителя новым консультантом… Но подобные чат-боты не могут ориентироваться в данных компании и предоставлять адекватные ответы. Можно хотя бы не рассчитывать на увольнение:)

В чем отличие модифицированного чат-бота, нейросотрудника от обычного окошка с GPT 4.0? — он может ориентироваться в нужной вам информации лучше: составлять подборки резюме для дальнейшего анализа живым HR-ом, общаться с клиентами скриптами, даже подбирать контент-план на основе данных о компании и помогать расписывать ТЗ для сотрудников.

В этой работе мы попробуем написать своего простого нейросотрудника, а точнее HR-менеджера. Начнем с теоретической части про векторные базы данных и обучение, закончим практикой.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
Reformer на TRAX

#почитать

В классической архитектуре Transformer механизм внимания работает со сложностью, которая масштабируется квадратично с увеличением длины последовательности.

Это происходит потому, что каждый токен в последовательности должен вычислять оценки внимания со всеми другими токенами, что приводит к плотной матрице внимания, размер которой растет с квадратом длины последовательности – мрак для вычислительных способностей наших TPU и GPU.


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
🍓7
Друзья, сегодня рекомендуем отличный канал с материалами по бизнес- и системному анализу!

😇 аналитик от бога — лучший канал для аналитиков от создателей сайта systemanalysis.ru

Что отличает нас от других каналов по системному анализу:

▪️мы — создатели systemanalysis.ru и канала Тестировщик от бога — одного из самых крупных телеграм-каналов по тестированию;
▪️мы пишем свои материалы: составили дорожную карту развития бизнес- и системных аналитиков, в которой собрали все, что надо знать для успешной работы;
▪️мы не постим ленту из хабра — все материалы, которые мы пишем или отбираем, мега-полезные. Перейдите в канал и убедитесь в этом сами.
▪️и многое-многое другое

Подписывайся на аналитика от бога и узнай уже наконец разницу между product roadmap-ом и спецификацией требований 😇
👍6
Пятница. "Как ошибка ChatGPT стоила нам $10 000"

#почитать

В начале я хотел бы сказать, что описанные в статье практики очень плохи и неправильны (с тех пор мы добавили надёжные юнит-тесты и интеграционные тесты, а также систему алертов/логирования), что их следует избегать и в первую очередь это человеческие ошибки, которые задним умом кажутся очевидными.

Описанные в статье события произошли в условиях сильного дефицита времени на очень ранних этапах работы компании (первые несколько недель). По большей мере я публикую это как забавную историю с уникальными условиями, связанными с воспроизводимостью бага в продакшене (тоже из-за нашей собственной глупости).


Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Идеи улучшения точности, удобства и скорости языковых моделей

#почитать

Я не специалист, и это список моих идей для улучшения работы языковых моделей. К сожалению хорошо проверить это не имею возможности. Нигде не встречал таких идей. Интересно узнать мнения о них.

Читать
Please open Telegram to view this post
VIEW IN TELEGRAM
👍61🔥1
👨‍💼 Project-менеджмент | IT — один из немногих каналов по управлению проектами в IT в телеграм. Для всех проджект-менеджеров и тех, кто хочет ими стать.

Почему проджект-менеджмент — классный старт в айти:
— хорошо подходит гуманитариям (если вы думали, что в IT работают только технари — вы ошибались)
— куча сфер применения
— спрос на PM-ов в России и в мире не упадет в ближайшие десятилетия

Почему надо подписаться на канал по проджект-менеджменту?
— свежие полезные статьи и видео по теме
— еженедельная подборка последних новостей, видео и обучающих материалов
— обзоры рынка зарплат и вакансий
— регулярные тематические обсуждения

Подписаться на @projectmanager_it
👍5