77% программистов положительно оценивают перспективы ИИ в разработке.
70% уже используют или планируют использовать ИИ-ассистентов.
92% разработчиков в США используют ИИ-инструменты для работы и дома.
70% считают владение ИИ конкурентным преимуществом на рынке труда.
ИИ ускоряет разработку на 55% и повышает производительность на 30%.
ИИ-ассистенты помогают справляться с эмоциональным выгоранием и укрепляют командную работу.
ИИ освобождает разработчиков от рутинных задач, позволяя им сосредоточиться на обратной связи и новых навыках.
ИИ сокращает расходы бизнеса за счет автоматизации рутинных задач.
ИИ помогает в сравнении технических требований и проверке документации.
ИИ создает прототипы сайтов и улучшает существующие проекты.
Нейросети пишут код по текстовому описанию и переводят код между языками программирования.
ИИ анализирует ошибки и автоматизирует тестирование ПО.
ИИ управляет проектами, оптимизирует бюджет и предоставляет шаблоны документации.
Copilot — лидер рынка, подходит для автодополнения кода и других задач.
Tabnine — нейросеть, обучающаяся стилю программирования пользователя.
GigaChat, Kandinsky, GigaCode — универсальные модели от "Сбера", работающие на русском языке.Snyk Code — нейросеть для поиска уязвимостей в коде.
Documatic — бот для генерации документации к коду.
No-Code и Low-Code — подходы к разработке без написания кода или с минимальным программированием.
Зарубежные платформы, такие как Airtable, Bubble, Glide, Adalo, популярны для создания приложений по принципам "ноукод".
В России есть свои разработки, например, Albato и Directual.
ИИ-ассистенты становятся незаменимыми помощниками для разработчиков.
ChatGPT стал самым быстрорастущим приложением, что свидетельствует о популярности ИИ.
ИИ-технологии активно внедряются в разработку, но не заменят полностью человеческий труд.
https://habr.com/ru/companies/sberbank/articles/765864/
#articles #analysis #model #nlp #redactor
Please open Telegram to view this post
VIEW IN TELEGRAM
Хабр
70 % программистов пользуются ИИ-ассистентами. Скоро код будут писать алгоритмы?
Проведенный в июне 2022 года опрос на платформе Stack Overflow показал, что 77 % программистов положительно оценивают перспективы искусственного интеллекта в разработке, а 70 % уже применяют...
https://www.youtube.com/watch?v=gGx2GpP1638 - музычки вам в ленту, топовой ))
YouTube
Dub Techno Album // Outskirts
This is the follow-up album to Nightscape. It's made with the same hardware and software as Nightscape but it hits differently.
Download https://jamesfredrickson.bandcamp.com/album/outskirts
Spotify https://open.spotify.com/album/3dWwPOLjjNZLaYWZ1vIru1…
Download https://jamesfredrickson.bandcamp.com/album/outskirts
Spotify https://open.spotify.com/album/3dWwPOLjjNZLaYWZ1vIru1…
1. http://Framedrop.gg - Инструмент для создания клипов AI
2. http://Chatdoc.com - ChatGPT для документов
3. http://Boomy.com - Генерация музыки AI
4. http://Tldv.io - AI для митингов
5. http://Lovo.ai - Генератор голоса AI
6. http://Chapple.ai :
Универсальная программа для создания контента
7. http://Kickresume.com - AI Резюме билдер
8. http://Vizologi.com - Инструмент для бизнес-планирования
9. http://Cohesive.so - Генератор контента AI
10. http://Stockimg.ai - Генератор AI-дизайна
11. http://Pictorial.ai - Дизайн фотографий
12. http://Vizologi.com - Бизнес-ассистент
13. http://Stockimg.ai - Стоковые изображения
14. http://Phrasee.co - Email-маркетинг
15. Пошаговые объяснение любой темы : http://tango.us
16 . Автоматизация задач : http://bardeen.ai
2. http://Chatdoc.com - ChatGPT для документов
3. http://Boomy.com - Генерация музыки AI
4. http://Tldv.io - AI для митингов
5. http://Lovo.ai - Генератор голоса AI
6. http://Chapple.ai :
Универсальная программа для создания контента
7. http://Kickresume.com - AI Резюме билдер
8. http://Vizologi.com - Инструмент для бизнес-планирования
9. http://Cohesive.so - Генератор контента AI
10. http://Stockimg.ai - Генератор AI-дизайна
11. http://Pictorial.ai - Дизайн фотографий
12. http://Vizologi.com - Бизнес-ассистент
13. http://Stockimg.ai - Стоковые изображения
14. http://Phrasee.co - Email-маркетинг
15. Пошаговые объяснение любой темы : http://tango.us
16 . Автоматизация задач : http://bardeen.ai
🔥3
tapnet — ИИ алгоритм, отслеживающий движение объектов на видео.
Его можно применять в робототехнике, 3D-реконструкции, создании видео и многих других областях.
⤷ Ссылка на проект
Его можно применять в робототехнике, 3D-реконструкции, создании видео и многих других областях.
⤷ Ссылка на проект
GitHub
GitHub - google-deepmind/tapnet: Tracking Any Point (TAP)
Tracking Any Point (TAP). Contribute to google-deepmind/tapnet development by creating an account on GitHub.
☝🏻ChatGPT-4 прошёл тест Тьюринга, обманув испытуемых в 54% случаев
Ученые из Калифорнийского университета в Сан-Диего пригласили 500 случайных людей пообщаться с четырьмя собеседниками — среди них были GPT-4, GPT-3.5, ELIZA (прабабушка GPT) и один настоящий человек.
ИИ было приказано вести себя как человек, относиться к тесту с осторожностью и делать опечатки.
Результат:
▫️ В 54% случаев люди увидели в GPT-4 родственную душу;
▫️ 33% людей ошибочно приняли реальных людей за ИИ;
▫️ GPT-3.5 был идентифицирован как человеческий в 50% случаев;
▫️ Даже ELIZA получила скромный рейтинг «человечности» в 22%.
Исследование ещё ожидает рецензирования, и его результаты следует воспринимать с осторожностью.
Ученые из Калифорнийского университета в Сан-Диего пригласили 500 случайных людей пообщаться с четырьмя собеседниками — среди них были GPT-4, GPT-3.5, ELIZA (прабабушка GPT) и один настоящий человек.
ИИ было приказано вести себя как человек, относиться к тесту с осторожностью и делать опечатки.
Результат:
▫️ В 54% случаев люди увидели в GPT-4 родственную душу;
▫️ 33% людей ошибочно приняли реальных людей за ИИ;
▫️ GPT-3.5 был идентифицирован как человеческий в 50% случаев;
▫️ Даже ELIZA получила скромный рейтинг «человечности» в 22%.
Исследование ещё ожидает рецензирования, и его результаты следует воспринимать с осторожностью.
Telegram
Чёрный Треугольник
Все мои каналы:
https://t.me/black_triangle_tg/7888
@ustugovva - менеджер по рекламе
Канал на бирже: https://telega.in/c/black_triangle_tg/
РКН: https://www.gosuslugi.ru/snet/6771c9aa1e4e233a71a37a02
https://t.me/black_triangle_tg/7888
@ustugovva - менеджер по рекламе
Канал на бирже: https://telega.in/c/black_triangle_tg/
РКН: https://www.gosuslugi.ru/snet/6771c9aa1e4e233a71a37a02
Пишем курс для Московского Университета Техноллгоии и Управления. Сегодня перевалили за 22 лекции. Очень плотно идет, видимо пора начинать записывать кружочки. На писанину уже нет сил ))
🔥2
🔄🔄🔄Читаем статьи за Вас №12:
🗣Определение и применение когортного анализа
Когортный анализ используется для анализа действий клиентов на веб-сайтах и в интернет-сервисах.
Сегменты целевой аудитории объединяются в группы по общим характеристикам и временным периодам.
Анализ позволяет оценить эффективность рекламных кампаний и определить сезонность продаж.
🗣Примеры использования когортного анализа
Анализ эффективности рекламы: когортный анализ помогает точно оценить эффективность рекламных кампаний, учитывая время принятия решения о покупке.
Поиск и удержание лояльных клиентов: анализ поведения пользователей во времени позволяет определить наиболее эффективные каналы привлечения и удержания клиентов.
Прогнозирование и увеличение LTV: когортный анализ позволяет прогнозировать пожизненную ценность клиентов и сравнивать стоимость их привлечения по разным каналам.
Проведение A/B тестирования: анализ когорт помогает в долгосрочном прогнозировании результатов A/B тестирования.
Анализ эффективности мобильного приложения: когортный анализ используется для оценки уровня возврата пользователей и эффективности рекламных каналов в мобильных приложениях.
🗣Применение в различных сферах
Формирование портрета целевого клиента: анализ данных из разных когорт помогает создать точный портрет целевой аудитории.
Повышение конверсии: когортный анализ дополняет сплит-тестирование, предоставляя более точные данные о поведении и предпочтениях клиентов.
SaaS: анализ когорт используется для оптимизации цикла продаж в облачных сервисах, включая отслеживание доходов и расходов.
🗣Ключевые показатели когортного анализа
Контрольная точка: сумма покупки, после которой клиенты становятся постоянными.
Каналы привлечения: определение наиболее эффективных источников привлечения новых клиентов.
Переход пользователей с пробной версии на платную: анализ перехода пользователей с пробной версии продукта на платную.
🗣Основы когортного анализа
Когортный анализ помогает определить, какие клиенты становятся платными.
Повторные покупки указывают на готовность клиента платить за продукт.
Аналитик должен определить целевые показатели и выбрать значимые метрики.
🗣Необходимые параметры для анализа
Признак формирования когорты: первое посещение, покупка, установка и т.д.
Размер когорты: временной интервал, например, день, неделя, месяц.
Отчетный период: время исследования поведения групп.
Анализируемый ключевой показатель: ROI, Retention Rate и другие.
🗣Использование Google Analytics для когортного анализа
Google Analytics подходит для новичков и находится в стадии бета-тестирования.
Ограничения: формирование когорт только по первому посещению, один анализ на показатель, стандартный размер когорты, ограниченный выбор отчетного периода.
После окончания бета-тестирования функционал расширится.
Визуализация анализируемого показателя и сводная таблица данных доступны в Google Analytics.
🗣Альтернативные сервисы для когортного анализа
AppsFlyer: гибкие настройки, возможность включения нескольких фильтров.
AppMetrica и Adjust: для анализа возврата новых пользователей.
Kissmetrics: возможность формирования когорты по двум признакам, группировка по разным параметрам.
🗣Использование Google Sheets для создания отчетов
Сводная таблица в Google Sheets позволяет быстро создать когортный отчет.
Необходимо собрать исходные данные в нужном формате и применить условное форматирование.
🗣Значение когортного анализа для аналитика
Когортный анализ предоставляет ценную информацию для развития продукта.
Не требует специальных инструментов или знаний, большинство систем аналитики автоматизируют процесс.
При отсутствии специализированных систем аналитик может использовать Google Sheets и сводные таблицы для создания отчетов.
https://habr.com/ru/companies/productstar/articles/509410/
#articles #analysis #model #nlp #redactor
🗣Определение и применение когортного анализа
Когортный анализ используется для анализа действий клиентов на веб-сайтах и в интернет-сервисах.
Сегменты целевой аудитории объединяются в группы по общим характеристикам и временным периодам.
Анализ позволяет оценить эффективность рекламных кампаний и определить сезонность продаж.
🗣Примеры использования когортного анализа
Анализ эффективности рекламы: когортный анализ помогает точно оценить эффективность рекламных кампаний, учитывая время принятия решения о покупке.
Поиск и удержание лояльных клиентов: анализ поведения пользователей во времени позволяет определить наиболее эффективные каналы привлечения и удержания клиентов.
Прогнозирование и увеличение LTV: когортный анализ позволяет прогнозировать пожизненную ценность клиентов и сравнивать стоимость их привлечения по разным каналам.
Проведение A/B тестирования: анализ когорт помогает в долгосрочном прогнозировании результатов A/B тестирования.
Анализ эффективности мобильного приложения: когортный анализ используется для оценки уровня возврата пользователей и эффективности рекламных каналов в мобильных приложениях.
🗣Применение в различных сферах
Формирование портрета целевого клиента: анализ данных из разных когорт помогает создать точный портрет целевой аудитории.
Повышение конверсии: когортный анализ дополняет сплит-тестирование, предоставляя более точные данные о поведении и предпочтениях клиентов.
SaaS: анализ когорт используется для оптимизации цикла продаж в облачных сервисах, включая отслеживание доходов и расходов.
🗣Ключевые показатели когортного анализа
Контрольная точка: сумма покупки, после которой клиенты становятся постоянными.
Каналы привлечения: определение наиболее эффективных источников привлечения новых клиентов.
Переход пользователей с пробной версии на платную: анализ перехода пользователей с пробной версии продукта на платную.
🗣Основы когортного анализа
Когортный анализ помогает определить, какие клиенты становятся платными.
Повторные покупки указывают на готовность клиента платить за продукт.
Аналитик должен определить целевые показатели и выбрать значимые метрики.
🗣Необходимые параметры для анализа
Признак формирования когорты: первое посещение, покупка, установка и т.д.
Размер когорты: временной интервал, например, день, неделя, месяц.
Отчетный период: время исследования поведения групп.
Анализируемый ключевой показатель: ROI, Retention Rate и другие.
🗣Использование Google Analytics для когортного анализа
Google Analytics подходит для новичков и находится в стадии бета-тестирования.
Ограничения: формирование когорт только по первому посещению, один анализ на показатель, стандартный размер когорты, ограниченный выбор отчетного периода.
После окончания бета-тестирования функционал расширится.
Визуализация анализируемого показателя и сводная таблица данных доступны в Google Analytics.
🗣Альтернативные сервисы для когортного анализа
AppsFlyer: гибкие настройки, возможность включения нескольких фильтров.
AppMetrica и Adjust: для анализа возврата новых пользователей.
Kissmetrics: возможность формирования когорты по двум признакам, группировка по разным параметрам.
🗣Использование Google Sheets для создания отчетов
Сводная таблица в Google Sheets позволяет быстро создать когортный отчет.
Необходимо собрать исходные данные в нужном формате и применить условное форматирование.
🗣Значение когортного анализа для аналитика
Когортный анализ предоставляет ценную информацию для развития продукта.
Не требует специальных инструментов или знаний, большинство систем аналитики автоматизируют процесс.
При отсутствии специализированных систем аналитик может использовать Google Sheets и сводные таблицы для создания отчетов.
https://habr.com/ru/companies/productstar/articles/509410/
#articles #analysis #model #nlp #redactor
🔄🔄🔄Читаем статьи за Вас №13:
📚Анализ корреляций в ценах на товары
Автор статьи использовал MatLab, но не упомянул уровень значимости корреляций.
В статье рассматривается использование R для анализа данных о ценах на товары.
Распределение цен на товары отличается от нормального, что делает невозможным использование коэффициента корреляции Пирсона.
Тест Спирмена используется для поиска непараметрических корреляций.
📚Результаты корреляционного анализа
В корреляционной матрице обнаружены статистически значимые взаимосвязи.
Значения коэффициентов корреляции rho не превышают 0.3, указывая на слабую силу связей.
Колебания цен на один товар могут влиять на цены других товаров не более чем на 10%.
📚Общий вывод
Автор подчеркивает важность понимания статистической значимости при анализе данных.
Статья призывает к осторожному подходу при интерпретации результатов корреляционного анализа.
https://habr.com/ru/articles/241967/
#articles #analysis #model #nlp #redactor
📚Анализ корреляций в ценах на товары
Автор статьи использовал MatLab, но не упомянул уровень значимости корреляций.
В статье рассматривается использование R для анализа данных о ценах на товары.
Распределение цен на товары отличается от нормального, что делает невозможным использование коэффициента корреляции Пирсона.
Тест Спирмена используется для поиска непараметрических корреляций.
📚Результаты корреляционного анализа
В корреляционной матрице обнаружены статистически значимые взаимосвязи.
Значения коэффициентов корреляции rho не превышают 0.3, указывая на слабую силу связей.
Колебания цен на один товар могут влиять на цены других товаров не более чем на 10%.
📚Общий вывод
Автор подчеркивает важность понимания статистической значимости при анализе данных.
Статья призывает к осторожному подходу при интерпретации результатов корреляционного анализа.
https://habr.com/ru/articles/241967/
#articles #analysis #model #nlp #redactor
🔄🔄🔄Читаем статьи за Вас №14:
📚Основы анализа данных
Анализ данных включает методы и приложения, не имеющие четкого ответа на каждый объект.
Нейросети, распознающие цифры, могут давать разные результаты на разных входных данных.
Алгоритмы машинного обучения формируют недетерминистические алгоритмы на основе данных.
📚Методы и эвристики машинного обучения
Машинное обучение использует обучающую выборку для автоматического подбора решающей функции.
Фичеселект (feature selection) и препроцессинг необходимы для приведения данных в форму, подходящую для алгоритмов.
Алгоритмы с учителем требуют опыта и подготовки для правильного применения.
📚Задачи машинного обучения
Задачи машинного обучения делятся на классификацию, регрессию и логистическую регрессию.
Классификация требует сопоставления объектов с классами, регрессия — предсказания количественных характеристик, логистическая регрессия сочетает оба типа задач.
📚Выбор метрики и валидация
Метрика качества оценивает качество предсказаний алгоритма.
Валидация алгоритма проводится на валидационной выборке, отделенной от обучающей.
Цикл развития проекта
Изучение задачи и источников данных.
Математическая формулировка и выбор метрик.
Написание пайплайна для обучения и тестирования.
Разработка эвристики или алгоритма машинного обучения.
Улучшение качества алгоритма и метрик, привлечение дополнительных данных.
📚Заключительный комментарий
Автор обсудит конкретные алгоритмы для задач классификации, регрессии и логистической регрессии в следующей статье.
Статья заканчивается призывом к читателям поддержать автора для ускорения публикации следующей статьи.
https://habr.com/ru/articles/352812/
#articles #analysis #model #eda
📚Основы анализа данных
Анализ данных включает методы и приложения, не имеющие четкого ответа на каждый объект.
Нейросети, распознающие цифры, могут давать разные результаты на разных входных данных.
Алгоритмы машинного обучения формируют недетерминистические алгоритмы на основе данных.
📚Методы и эвристики машинного обучения
Машинное обучение использует обучающую выборку для автоматического подбора решающей функции.
Фичеселект (feature selection) и препроцессинг необходимы для приведения данных в форму, подходящую для алгоритмов.
Алгоритмы с учителем требуют опыта и подготовки для правильного применения.
📚Задачи машинного обучения
Задачи машинного обучения делятся на классификацию, регрессию и логистическую регрессию.
Классификация требует сопоставления объектов с классами, регрессия — предсказания количественных характеристик, логистическая регрессия сочетает оба типа задач.
📚Выбор метрики и валидация
Метрика качества оценивает качество предсказаний алгоритма.
Валидация алгоритма проводится на валидационной выборке, отделенной от обучающей.
Цикл развития проекта
Изучение задачи и источников данных.
Математическая формулировка и выбор метрик.
Написание пайплайна для обучения и тестирования.
Разработка эвристики или алгоритма машинного обучения.
Улучшение качества алгоритма и метрик, привлечение дополнительных данных.
📚Заключительный комментарий
Автор обсудит конкретные алгоритмы для задач классификации, регрессии и логистической регрессии в следующей статье.
Статья заканчивается призывом к читателям поддержать автора для ускорения публикации следующей статьи.
https://habr.com/ru/articles/352812/
#articles #analysis #model #eda
Хабр
Анализ данных — основы и терминология
В этой статье я бы хотел обсудить базовые принципы построения практического проекта по (т. н. «интеллектуальному») анализу данных, а также зафиксировать необходимую терминологию, в том числе...
📚Анализ результатов опроса клиентского опыта
Опрос проведен с использованием 10-балльной шкалы, где 1 означает неудовлетворенность, а 10 - полную удовлетворенность.
Вопросы разделены на основные и уточняющие блоки, включая общую удовлетворенность, вероятность рекомендации и повторной покупки.
📚Проблемы при интерпретации результатов
Сложности в понимании, как улучшить общую удовлетворенность продуктом.
Необходимость связать общую удовлетворенность с другими аспектами деятельности.
Необходимость выявления факторов, оказывающих наибольшее влияние на общую удовлетворенность.
📚Применение факторного анализа
Факторный анализ позволяет увидеть степень влияния различных аспектов и сформировать группы тесно связанных параметров.
Исходный набор данных анализируется на аномальные ответы и корреляции между вопросами.
Проводится проверка данных на возможность проведения факторного анализа с использованием критериев Бартлетта и Кайзера-Мейера-Олкина.
📚Определение количества факторов
Определяется количество групп вопросов, результаты которых схожи между собой.
Вычисляется корреляционная матрица между вопросами и полученными факторами.
Выделяются 6 факторов с собственным значением больше 1.
📚Интерпретация и анализ результатов
Результаты переносятся в Excel для удобства расчетов.
Средний балл для каждого вопроса и фактора рассчитывается с учетом корреляций выше 0.5.
Проводится сравнение среднего балла по всем вопросам и факторам для подтверждения корректности анализа.
На основе полученных данных строятся гипотезы, которые могут быть проверены на качественных исследованиях.
https://habr.com/ru/articles/687338/
#articles #analysis #model #eda
Опрос проведен с использованием 10-балльной шкалы, где 1 означает неудовлетворенность, а 10 - полную удовлетворенность.
Вопросы разделены на основные и уточняющие блоки, включая общую удовлетворенность, вероятность рекомендации и повторной покупки.
📚Проблемы при интерпретации результатов
Сложности в понимании, как улучшить общую удовлетворенность продуктом.
Необходимость связать общую удовлетворенность с другими аспектами деятельности.
Необходимость выявления факторов, оказывающих наибольшее влияние на общую удовлетворенность.
📚Применение факторного анализа
Факторный анализ позволяет увидеть степень влияния различных аспектов и сформировать группы тесно связанных параметров.
Исходный набор данных анализируется на аномальные ответы и корреляции между вопросами.
Проводится проверка данных на возможность проведения факторного анализа с использованием критериев Бартлетта и Кайзера-Мейера-Олкина.
📚Определение количества факторов
Определяется количество групп вопросов, результаты которых схожи между собой.
Вычисляется корреляционная матрица между вопросами и полученными факторами.
Выделяются 6 факторов с собственным значением больше 1.
📚Интерпретация и анализ результатов
Результаты переносятся в Excel для удобства расчетов.
Средний балл для каждого вопроса и фактора рассчитывается с учетом корреляций выше 0.5.
Проводится сравнение среднего балла по всем вопросам и факторам для подтверждения корректности анализа.
На основе полученных данных строятся гипотезы, которые могут быть проверены на качественных исследованиях.
https://habr.com/ru/articles/687338/
#articles #analysis #model #eda
🔄🔄🔄Читаем статьи за Вас №16:
📚Основы анализа данных с помощью pandas
Для понимания данных необходимо знать диапазоны значений, типы переменных и количество пропущенных значений.
pandas предоставляет инструменты для разведочного анализа, но часто требуется начать с общих функций, таких как df.describe().
📚Использование pandas-profiling для быстрого анализа
Автор статьи ищет способы быстрого и эффективного разведочного анализа данных и находит pandas-profiling.
pandas-profiling генерирует подробный HTML-отчет, содержащий основные сведения о данных и предупреждения для дальнейшего анализа.
📚Пример использования на наборе данных Titanic
pandas-profiling особенно полезен для данных, которые еще не очищены и требуют дальнейшей обработки.
В статье демонстрируется, как использовать pandas-profiling для получения описательной статистики и визуализации распределения переменных.
📚Анализ переменных с помощью pandas-profiling
Отчет pandas-profiling содержит сведения о каждой переменной, включая диаграммы распределения.
Для числовых переменных выводятся показатели описательной статистики и количество пропущенных значений.
Для категориальных переменных предоставляются число классов вместо среднего, минимума и максимума.
📚Корреляционный анализ и пример данных
В отчете pandas-profiling выводятся корреляционные матрицы Пирсона и Спирмена, а также пример данных из начала набора данных.
Автор не рекомендует полагаться на последний раздел отчета, а предлагает использовать df.sample() для случайного выбора данных.
📚Итоги использования pandas-profiling
pandas-profiling предоставляет полезные возможности для быстрого общего представления о данных и создания отчетов.
Для детальной работы с данными необходимо вручную учитывать их особенности.
📚Дополнительные ресурсы
В статье упоминается возможность просмотра полного анализа данных в Jupyter-блокноте и ссылка на соответствующий код в GitHub-репозитории.
Читателей просят поделиться своим опытом начала анализа новых наборов данных.
https://habr.com/ru/companies/ruvds/articles/451478/
#articles #analysis #model #eda
📚Основы анализа данных с помощью pandas
Для понимания данных необходимо знать диапазоны значений, типы переменных и количество пропущенных значений.
pandas предоставляет инструменты для разведочного анализа, но часто требуется начать с общих функций, таких как df.describe().
📚Использование pandas-profiling для быстрого анализа
Автор статьи ищет способы быстрого и эффективного разведочного анализа данных и находит pandas-profiling.
pandas-profiling генерирует подробный HTML-отчет, содержащий основные сведения о данных и предупреждения для дальнейшего анализа.
📚Пример использования на наборе данных Titanic
pandas-profiling особенно полезен для данных, которые еще не очищены и требуют дальнейшей обработки.
В статье демонстрируется, как использовать pandas-profiling для получения описательной статистики и визуализации распределения переменных.
📚Анализ переменных с помощью pandas-profiling
Отчет pandas-profiling содержит сведения о каждой переменной, включая диаграммы распределения.
Для числовых переменных выводятся показатели описательной статистики и количество пропущенных значений.
Для категориальных переменных предоставляются число классов вместо среднего, минимума и максимума.
📚Корреляционный анализ и пример данных
В отчете pandas-profiling выводятся корреляционные матрицы Пирсона и Спирмена, а также пример данных из начала набора данных.
Автор не рекомендует полагаться на последний раздел отчета, а предлагает использовать df.sample() для случайного выбора данных.
📚Итоги использования pandas-profiling
pandas-profiling предоставляет полезные возможности для быстрого общего представления о данных и создания отчетов.
Для детальной работы с данными необходимо вручную учитывать их особенности.
📚Дополнительные ресурсы
В статье упоминается возможность просмотра полного анализа данных в Jupyter-блокноте и ссылка на соответствующий код в GitHub-репозитории.
Читателей просят поделиться своим опытом начала анализа новых наборов данных.
https://habr.com/ru/companies/ruvds/articles/451478/
#articles #analysis #model #eda
👍2
Буду здесь и вероятно возможно даже выступать, но пока не знаю. Сейчас готовится мощный материал и буду думать. Конечно же иду туда со своим брендом и как сотрудник Финансового университета.
https://www.isprasopen.ru/#Registration
https://www.isprasopen.ru/#Registration
🔥3
https://vc.ru/ai/1503733-sem-altman-vek-intellekta-perevod - перевод статьи Альтамана, он выступил с новым заявлением.
vc.ru
Сэм Альтман: Век интеллекта (перевод)
Перевод на русский язык манифеста от главы OpenAI Сэма Альтмана о будущем ИИ.
https://habr.com/ru/companies/sberbank/articles/845388/ - моя новая статья для Сбера, небольшая, и даже весьма шуточная, но тем не менее очень актуальная.
Хабр
Шифруй то, шифруй это, или LLM под замком
Здравствуйте, уважаемые читатели Хабра. Чем больше я погружаюсь в LLM, тем больше укрепляюсь во мнении, что сейчас они (LLM) заняли если не самое важное, то уж точно одно...