Хабр / ML & AI
481 subscribers
5.49K links
Telegram-канал, где вы можете найти публикации из RSS-фидов тематических хабов "Машинное обучение" и "Искусственный интеллект" портала Хабр.

Данный канал не является официальным представительством платформы Хабр.

Администратор - @evilfreelancer
Download Telegram
no-code (hub.ultralytics.com) в связке с Yandex DataSphere

Большой спрос на цифровые приложения с одной стороны и небольшой рост числа разработчиков с другой, делает разработку IT решений на базе no code или low code платформ весьма актуальным и трендовым мероприятием.

Несмотря на наличие решений для бизнеса, например: viso.ai, cloud.google.com/vision, clarifai.com платформ для обучения известно не так много. Наиболее известные это teachablemachine.withgoogle.com или hub.ultralytics.com. Первая - является довольно простой и может использоваться даже школьниками, поэтому мы подробнее поговорим о второй платформе.

Платформа представляет удобную возможность производить обучение нейронных сетей семейства Yolo для решения различных задач, а также осуществлять деплой моделей и использовать их в режиме инференса. Пожалуй единственным недостатком платформы является невозможность (бесплатно) производить обучение нейронной сети, поэтому данную потребность можно заполнить на основе доступных ресурсов Yandex DataSphere.

Платформа имеет понятный интерфейс и основные рабочие вкладки: "Datasets", "Projects", "Models".

Вкладка "Datasets" используется для размещения новых датасетов или использования существующих. Требования к датасетам достаточно простые и соответсвуют требования предьявляемым к разметке данных сетей yolo. На сайте также находится большое количество известных датасетов, поэтому для первичного использования можно не использовать сторонний.

Читать далее

#yandex_cloud #cv #yolo #low_code #no_code | @habr_ai
Биоинформатика и Evo: как искусственный интеллект меняет подходы к анализу геномов

В современном мире каждый из нас сталкивается с генетикой, будь то медицинские анализы, CRISPR-дизайн или изучение наследственных признаков. Но что, если мы могли бы заглянуть глубже, понять тайные механизмы генов и даже создать новые последовательности ДНК, пригодные для науки и медицины? Это больше не фантазия, а реальность благодаря Evo — искусственной нейросети, которая переосмысливает подходы к анализу и проектированию геномов.

Читать далее

#биоинформатика #биология #биотехнологии #биохакинг #машинное_обучение #анализ_данных #генетика #гены #днк #рнк | @habr_ai
Метрики качества оценки вероятностей в бинарной классификации: опыт из ФинТеха

Бинарная классификация — одна из ключевых задач машинного обучения, но в реальных приложениях часто важно не только определить класс, но и понять, с какой вероятностью модель принимает решение. Как проверить точность вероятностных предсказаний?

В статье обсуждаются специализированные инструменты для оценки качества вероятностных прогнозов, ключевые метрики и их интерпретация. Материал будет полезен для практиков, стремящихся повысить точность и объяснимость своих моделей.

Читать далее

#классификация #roc_auc #pr_auc #calibration #ml #оценка_вероятностей #log_loss #hosmer_lemeshow #качество_классификации #бинарная_классификация | @habr_ai
Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду.

Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год все набьют шишки и забудут о нем. Читать далее

#llm #rag #база_знаний #языковые_модели #большие_данные #большие_данные_и_машинное_обучение #машинное_обучение #nlp #разработка | @habr_ai
NLP: когда машины начинают понимать нас (Часть 2)

В прошлой статье мы с вами изучили теоретические основы обработки естественного языка (NLP) и теперь готовы перейти к практике. В мире NLP выбор подходящего языка программирования и инструментов играет ключевую роль в успешной реализации проектов. Одним из наиболее популярных языков для решения задач в этой области является Python. Его простота, читаемость и поддержка мощных библиотек делают его идеальным выбором для разработчиков.

Читать далее

#обработка_естественного_языка #nlp #natural_language_processing #machine_learning #машинное_обучение #искусственный_интеллект #python #пайтон #nltk #spacy | @habr_ai
Как развлечься с моделями, если хочется чего-то необычного

Написать эту статью меня побудило серьезное научное исследование, которое обосновало прекрасный и оригинальный метод Chain of Code (CoC) улучшения рассуждений моделей и точности их ответов.

Суть метода заключается в том, чтобы заставить модель написать подходящий программный код, соответствующий поставленной в промпте задаче, интерпретировать его выполнение и на основе полученного результата сформировать более логичный, точный и достоверный ответ.

Метод особенно хорошо работает в логических и математических задачах и я считаю, что он заслуживает пристального внимания программистов, как оригинальный и эффективный подход к решению различных хорошо структурированных задач.

Я решил продемонстрировать его работу, но так, чтобы было интересно и не скучно.

Поэтому предлагаю развлечься с моделями, а поскольку для нашей цели одной будет маловато, то давайте сразу с тремя.

Читать далее

#llm #искусственный_интеллект #машинное_обучение #python | @habr_ai
Математические бланки // Часть 3: математическая реальность

В первой части этой серии мы описали проблему математических бланков, и перспективные результаты её решения. Вторая часть показала, что эта проблема упирается в вопрос экземпляров. Он, в свою очередь, может быть решён в рамках модели идеального мира, который должен обладать памятью.

Чтобы подступиться к теме памяти идеального мира, нам нужно с максимальной подробностью разобраться, что такое вообще память, какая она бывает, какие функции выполняет, какими характеристиками обладает, привести подтверждающие примеры.

Исследование низшей математики - это 90% ожидания, 9% отчаяния, и только 1% озарения. Здесь, опустив 99%, можно сразу узнать результат. И в результате, памятью окажется то, что гораздо старше и математики, и самой человеческой истории. И оно всё это время перед глазами. Вот уж точно, хочешь спрятать, прячь на самом виду. Хотите узнать, что это? Не переключайтесь.

Читать далее

#математическая_реальность #память #время #идеальный_мир #нейроматематика #фораон | @habr_ai
Как я взломал одну из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи

Я — простой студент, который обучается по направлению «Информационная безопасность». Так вышло, что по программе мне нужно было написать научную статью по теме ИБ. Будучи авантюристом я выбрал тему, которая была мне ближе и интереснее... и так получилось, что в пылу энтузиазма я немного перевыполнил свой план. К сожалению, я был ограничен в объеме по написанию научной статьи, и много интересного материала пришлось вырезать или сократить. Поэтому, тут я хотел бы написать полную версию моей статьи, во всяком случаи, какой я бы хотел ее видеть.

Как итог - у меня получилось полностью снять защиту в современной и защищенной языковой модели, и написать программу которая это автоматизирует. Эта модель признана одной из лучших.

Читать далее

#искусственный_интеллект #взломы #обход_защиты #программа #цензура #chatgpt #prompt_engineering #claude #jailbreak #информационная_безопасность | @habr_ai
Сколько стоит искусственный интеллект для малого бизнеса

В настоящее время использование генеративного искусственного интеллекта в бизнесе, как правило, связано с большими и очень большими компаниями. С теми, кто, как говорится, "может себе позволить". А может ли малый бизнес позволить себе использовать искусственный интеллект в работе уже сейчас? Давайте разбираться с конкретными цифрами

Читать далее

#искусственный_интеллект #малый_бизнес | @habr_ai
Когда ИИ может в оптимизацию…

Способны ли имеющиеся архитекутры нейронных сетей составить конкуренцию классическим методам оптимизации в решении хорошо изученных задач таких как проблема коммивояжера? Я решил попробовать ответить на этот вопрос и опубликовать свои наработки.

Читать далее

#задача_коммивояжера #tsp #mip #искусственный_интеллект #оптимизация #точное_решение | @habr_ai
Влияние программного обеспечения и архитектуры ускорителя на производительность

Несколько лет назад у меня на прошлой работе состоялась интересная дискуссия с коллегой из отделения микроэлектроники. Его идея заключалась в том, что производительность в инференсе нейронных сетей на GPGPU от NVIDIA превосходит наше решение в связи с использованием более продвинутого тех. процесса, более высоких тактовых частот и из-за большей площади кристалла. Как программист, я не мог с этим согласиться, но на тот момент ни у кого не было времени и желания проверить эту гипотезу. Недавно в разговоре с уже нынешними коллегами мне вспомнилась эта дискуссия и я решил довести это до конца. В этой статье мы сравним производительность модуля NM Card от НТЦ Модуль и видеокарты GT730 от NVIDIA.

Читать далее

#инференс #искусственный_интеллект #машинное_обучение | @habr_ai
👍1
Запускаем 8B LLM в браузере: AQLM.rs

Меня долгое время интересовал запуск больших языковых моделей на пользовательских устройствах: есть что‑то в том, чтобы запустить одну из лучших языковых моделей на обычном домашнем компьютере или на мобильном телефоне, помещающемся в карман.

В этом посте я расскажу о своём пет‑проекте AQLM.rs. Я написал инференс модели Llama 3.1 8B, работающий в браузере на WebAssembly без использования GPU, с помощью алгоритма сжатия, разработанного нашей лабораторией.

Попробовать можно на сайте проекта, подробности под катом.

Читать далее

#яндекс #machine_learning #rust #нейросети #llm | @habr_ai
Программирование в GPT для чайников. Часть 1

Хотите использовать возможности ChatGPT для решения программных задач, но не обладаете навыками кодирования? В первой части серии «Программирование в GPT для чайников» я расскажу, как легко автоматизировать процессы и создавать документацию с помощью модели GPT-4. Вы узнаете, как правильно составлять промпты, разбивать задачи на этапы и вести журналирование для достижения наилучших результатов. Откройте для себя простые и эффективные способы взаимодействия с искусственным интеллектом! Читать далее

#gpt #promt #code | @habr_ai
Обзор недавно выпущенной модели Evo для анализа геномных данных

Давайте представим, что вы начинающий или опытный биоинформатик, или "простой смертный", который хочет углубиться в анализ биологических данных. Спойлер: биоинформатики тоже смертные! Зачастую, не у каждого хватает ценного времени на проверку огромных последовательностей геномных данных, будь то поиск различных мутаций или прогнозирование структуры белков на основе последовательности аминокислот.

Но не переживайте, в этом вам поможет искусственный интеллект! Да, тот самый ИИ, который чуть ли не через каждую минуту обещает изменить мир и избавить нас от всех проблем — от покупки продуктов до поиска идеальных генетических маркеров для рака. Так вот, давайте разберемся, как ИИ может помочь нам, бедным исследователям, быстро и эффективно работать с данными, которые, казалось бы, невозможно обработать, даже за целую жизнь.

Читать далее

#биоинформатика #биология #биотехнологии #генетика #генетические_алгоритмы #модель_данных #машинное_обучение #машинное_обучение_нейросети_python #биотех #анализ_данных | @habr_ai
Машинное обучение: Логистическая регрессия. Теория и реализация. С нуля

В этой статье я привел базовые сведения о логистической регрессии и показал как сделать модель с нуля на чистом Python. Логистическая функция, обучение, метрики качества для модели классификации, реализация и небольшой разбор обучения весов.

Статья подойдет для того, кто новичок или кому интересно разобраться в том, как происходит обучение модели на низком уровне.

Читать далее

#машинное_обучение #искусственный_интеллект #логистическая_регрессия | @habr_ai
[Перевод] ИИ-генератор видео Sora от OpenAI теперь доступен всем желающим

Компания OpenAI выложила в открытый доступ видеогенератор Sora AI, включая некоторые инструменты, помогающие авторам создавать сложные проекты.

Долго разрабатываемая модель позволяет генерировать короткие видеоклипы на основе текстовых подсказок. Однако с помощью дополнительных промптов можно в той или иной степени «ремиксировать» промпты, а с помощью раскадровки можно объединить несколько промптов и создать переходы между роликами.

Читать далее

#sora #openai | @habr_ai