Machine Learning | Нейронные сети, ИИ, Big Data
7.54K subscribers
630 photos
48 videos
14 files
736 links
Всё о Machine Learning простым языком.

Сотрудничество: @max_excel
Download Telegram
🏋️‍♀️ Я нашёл 213 уязвимостей безопасности в кодовой базе при помощи GPT-3

Краткая сводка: GPT-3 обнаружила 213 уязвимостей безопасности в git-репозитории. Для сравнения: один из лучших коммерческих инструментов на рынке (разработанный респектабельной компанией, которая занимается кибербезопасностью) нашёл лишь 99 проблем; впрочем, этот инструмент предоставляет контекст в более структурированном формате.

Machine Learning
Gemini 2.5 Pro возглавил все ИИ-бенчмарки: Google возвращает корону технологического лидера

Google вернулся в гонку ИИ с триумфом: их Gemini 2.5 Pro возглавил все авторитетные рейтинги моделей и получил восторженные отзывы экспертов. Компания интегрирует лучший в мире ИИ в свои сервисы с миллиардной аудиторией, создавая преимущество, которое нельзя купить за деньги — экосистему, где искусственный интеллект становится неотъемлемой частью повседневных инструментов.

Machine Learning
GPT наконец перестал выдумывать факты и действительно понимает, что находит в интернете?

В течение последних двух с половиной лет функцией, которую автор больше всего хотел получить от LLM, была способность выполнять исследовательские задачи на основе поиска от его имени. Мы увидели первые проблески этого ещё в начале 2023 года с Perplexity, а затем с Microsoft Bing на основе GPT-4. С тех пор множество людей пытались решить эту проблему, в частности Google Gemini и ChatGPT Search.

Machine Learning
Media is too big
VIEW IN TELEGRAM
Машинное обучение для чайников

В этом ролике автор дает подробные ответы на следующие вопросы:
• Что такое машинное обучение
• Для чего используется
• Классы задач машинного обучения
• Что такое обучение с учителем
• Что такое обучение без учителя
• Что такое задача регрессии
• Что такое задача классификации
• Что такое задача кластеризации
• Что такое задача уменьшения размерности
• Что такое задача выявления аномалий
• Что такое нейронная сеть
• Что можно делать с помощью нейронных сетей
• Возможен ли сценарий "Терминатора"
• Интересные факты и лайфхаки о нейронных сетях
• Что нужно знать для начала изучения машинного обучения
• Курсы по машинному обучению

Смотреть это видео на youtube: youtu.be/yQPRzVB4Zpk

Machine Learning
Я тебя с вертухи сломаю, если ещё раз заговоришь об ИИ

Последние инновации в сфере ИИ, наиболее примечательными из которых стали проекты наподобие GPT-4, очевидно, могут иметь далеко идущие последствия для общества: от утопического избавления от монотонного труда до антиутопического ущерба для работы художников в капиталистическом обществе, а также до экзистенциальных угроз самому человечеству.

Machine Learning
😉 Как дообучить LLaMA бесплатно и без программирования: как создать тупого друга

В статье будет мало терминов, тут автор простым языком расскажет как вы можете обучить большую языковую модель.

Machine Learning
RecSys R&D команда из Яндекса разработала новую рекомендательную систему на базе больших генеративных моделей

ARGUS (AutoRegressive Generative User Sequential modeling) — новое поколение рекомендательных моделей, которые способны предсказывать потребности пользователей и их отклик, а также находить сложные взаимосвязи между событиями. Это значительно повышает точность и качество рекомендаций. Алгоритмы анализируют агрегированные и обезличенные данные. Подобные системы сейчас внедрены всего у нескольких компаний в мире, включая Google и Netflix.

Архитектура Argus — двухбашенная модель, для которой, в отличие от target-aware постановки ранжирования в HSTU, можно в оффлайне пересчитывать векторы для миллионов пользователей и айтемов. Для оценки качества используется global temporal split, а на этапе предобучения смотрят прежде всего на значения функции потерь для задач next item prediction и feedback prediction. На этом же этапе сравнивают продовый градиентный бустинг, обученный на новых данных, с версией этого бустинга, в которую входит признак от ARGUS. И вместо абсолютных значений приводят относительный прирост метрики

Первыми новую модель интегрировали в Яндекс Музыку. В рекомендации сервиса внедрили модель с длиной истории 8192 (в терминах события в жизни пользователя). Это прецедентный случай внедрения модели подобных масштабов с такой длинной истории музыкальных рекомендаций. По статистике стриминга, слушатели Моей волны стали лайкать впервые услышанные треки на 20% чаще, а разнообразие рекомендаций возросло на 14%. При этом, генеративные нейросети в рекомендациях позволяют учитывать предпочтения пользователей не раз в сутки, а в режиме реального времени, что выводит качество персонализации на новый уровень.

Следом за Яндекс Музыкой, технологию интегрировали в Маркет. Со временем на рекомендательные алгоритмы нового поколения перейдут и другие сервисы компании.
Особенности индийского автострахования — какие insurtech-стартапы и технологии меняют его облик

В этом материале автор расскажет о примечательных индийских компаниях, развивающих системы ИИ и технологии компьютерного зрения, чтобы сделать страховые полисы доступными для широкой аудитории — от водителей электроскутеров до жителей сельских районов.

Machine Learning
Маленький data-science для большого бизнеса

История о том, как команда школьников занималась разработкой сервиса геоаналитики для бизнеса.

Machine Learning
👷 Строим пайплайн в sсikit-learn — пошаговое руководство

В тексте упоминается scikit-learn — одна из самых популярных Python-библиотек для классического машинного обучения. Кроме большого числа алгоритмов машинного обучения, с помощью scikit-learn можно строить пайплайны.

Machine Learning
🔥 Туториалы от Hugging Face

Это просто бомба! Тут в одном месте собраны материалы для всех основных задач в NLP, CV и Audio (см. картинку). Здесь есть примеры, видео с объяснениями, предобученные модели и даже датасеты.

Machine Learning
🗞 Анализ временных рядов, применение нейросетей

В этой статье автор описывает некоторые основные понятия в теории анализа временных рядов, классические статистические алгоритмы прогнозирования, а также рассматривает применение моделей глубоких нейросетей для таких задач.

Machine Learning
🧩 Budibase

Low-code-платформа с открытым исходным кодом, объединяющая все необходимое для создания внутренних инструментов и пользовательских бизнес-приложений, включая дашборды, административные панели, приложения для утверждения и клиентские порталы.

Low-code-платформы, такие как Budibase, позволяют разработчикам создавать и поставлять внутренние инструменты и CRUD-приложения в кратчайшие сроки.

Machine Learning
🙂 Жизненный цикл ML-модели

Будем называть ML-моделью объект, возвращающий прогноз для входящего набора признаков. Пусть для простоты это будет модель бинарной классификации.

В этой статье автор расскажет вам, как разрабатываются устойчивые ML-модели в суровых условиях изменчивого мира.

Machine Learning
🧵 3 инструмента для отслеживания и визуализации выполнения вашего кода Python

Эта статья предоставит вам инструменты, чтобы сделать легко решаемыми некоторые распостраненные ошибки.

Machine Learning
Лучшие инструменты на основе GPT, которые могут помочь в написании и оптимизации кода для Python

Эти инструменты предлагают различные функции, от автоматического дополнения кода до генерации кода из инструкций на естественном языке, и могут значительно упростить и ускорить разработку на Python. Выбор определенного инструмента зависит от ваших конкретных потребностей и предпочтений в работе.

Machine Learning
🕶 Data-driven рост с помощью науки о данных и машинного обучения

Ведущие игроки на вашем рынке уже используют науку о данных и машинное обучение в частности для принятия более эффективных решений в области маркетинга, продаж и успешного обслуживания клиентов. Еще не поздно воспользоваться этой возможностью - технологические компании могут ускорить свой рост, приняв пять ведущих практик.

Machine Learning
🤷‍♂️ Проблемы качества промышленных данных (временных рядов)

Большую часть работы по созданию моделей составляет работа с промышленными данными. В условиях стремительного роста объема информации важным аспектом становится качество таких данных. В то же время такие проблемы, как выбросы, пропуски, изменение частоты дискретизации, шум, искажают результаты или делают невозможным практическое использование данных для машинного обучения.

В этой статье автор разберет часто встречающиеся проблемы в промышленных данных типа временных рядов.

Machine Learning
🔒 ML-задача на 30 минут: гадаем по cookie

Вопрос звучит так: сможем ли мы по цифровым следам пользователя (на каких сайтах с каких IP он сидел, сколько раз заходил, какое у него устройство) понять, кто этот пользователь?

Machine Learning
🐋 Как распознать образы с помощью TensorFlow?

Целью работы является распознавание боковых зубов (маляров) на рентгеновских снимках с использованием нейронной сети. Для реализации цели необходимо выполнить несколько следующих этапов. Данные этапы составляют процесс настройки, обучения, тестирования нейронной сети с использованием TensorFlow.

Machine Learning
🤟 Оценка структуры кредитного портфеля с помощью R.

В ходе обсуждений возникла «маленькая» задачка — построить динамику структуры кредитного портфеля (динамика кредитной карты, например). Есть важная специфика — необходимо применять метод FIFO для погашения займов. Т.е. при погашении первыми должны гаситься самые ранние займы. Это накладывает определенные требования на расчет статуса каждого отдельного займа и определения его даты погашения.

Machine Learning