Хабр / ML & AI
482 subscribers
5.49K links
Telegram-канал, где вы можете найти публикации из RSS-фидов тематических хабов "Машинное обучение" и "Искусственный интеллект" портала Хабр.

Данный канал не является официальным представительством платформы Хабр.

Администратор - @evilfreelancer
Download Telegram
Нам нужен RAG, вам нужен RAG: как встроить LLM туда, где она не нужна

Когда хайп захватывает умы, кажется, что любое техническое решение должно строиться вокруг новой модной технологии и что теперь-то мы ух заживем! Сегодня у нас на хайпе RAG (Retrieval-Augmented Generation), вчера — NFT, позавчера — блокчейн везде и всюду.

Давайте попробуем разобраться, нужен ли RAG на самом деле, или это просто «новый блокчейн» и через год все набьют шишки и забудут о нем. Читать далее

#llm #rag #база_знаний #языковые_модели #большие_данные #большие_данные_и_машинное_обучение #машинное_обучение #nlp #разработка | @habr_ai
NLP: когда машины начинают понимать нас (Часть 2)

В прошлой статье мы с вами изучили теоретические основы обработки естественного языка (NLP) и теперь готовы перейти к практике. В мире NLP выбор подходящего языка программирования и инструментов играет ключевую роль в успешной реализации проектов. Одним из наиболее популярных языков для решения задач в этой области является Python. Его простота, читаемость и поддержка мощных библиотек делают его идеальным выбором для разработчиков.

Читать далее

#обработка_естественного_языка #nlp #natural_language_processing #machine_learning #машинное_обучение #искусственный_интеллект #python #пайтон #nltk #spacy | @habr_ai
Как развлечься с моделями, если хочется чего-то необычного

Написать эту статью меня побудило серьезное научное исследование, которое обосновало прекрасный и оригинальный метод Chain of Code (CoC) улучшения рассуждений моделей и точности их ответов.

Суть метода заключается в том, чтобы заставить модель написать подходящий программный код, соответствующий поставленной в промпте задаче, интерпретировать его выполнение и на основе полученного результата сформировать более логичный, точный и достоверный ответ.

Метод особенно хорошо работает в логических и математических задачах и я считаю, что он заслуживает пристального внимания программистов, как оригинальный и эффективный подход к решению различных хорошо структурированных задач.

Я решил продемонстрировать его работу, но так, чтобы было интересно и не скучно.

Поэтому предлагаю развлечься с моделями, а поскольку для нашей цели одной будет маловато, то давайте сразу с тремя.

Читать далее

#llm #искусственный_интеллект #машинное_обучение #python | @habr_ai
Математические бланки // Часть 3: математическая реальность

В первой части этой серии мы описали проблему математических бланков, и перспективные результаты её решения. Вторая часть показала, что эта проблема упирается в вопрос экземпляров. Он, в свою очередь, может быть решён в рамках модели идеального мира, который должен обладать памятью.

Чтобы подступиться к теме памяти идеального мира, нам нужно с максимальной подробностью разобраться, что такое вообще память, какая она бывает, какие функции выполняет, какими характеристиками обладает, привести подтверждающие примеры.

Исследование низшей математики - это 90% ожидания, 9% отчаяния, и только 1% озарения. Здесь, опустив 99%, можно сразу узнать результат. И в результате, памятью окажется то, что гораздо старше и математики, и самой человеческой истории. И оно всё это время перед глазами. Вот уж точно, хочешь спрятать, прячь на самом виду. Хотите узнать, что это? Не переключайтесь.

Читать далее

#математическая_реальность #память #время #идеальный_мир #нейроматематика #фораон | @habr_ai
Как я взломал одну из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи

Я — простой студент, который обучается по направлению «Информационная безопасность». Так вышло, что по программе мне нужно было написать научную статью по теме ИБ. Будучи авантюристом я выбрал тему, которая была мне ближе и интереснее... и так получилось, что в пылу энтузиазма я немного перевыполнил свой план. К сожалению, я был ограничен в объеме по написанию научной статьи, и много интересного материала пришлось вырезать или сократить. Поэтому, тут я хотел бы написать полную версию моей статьи, во всяком случаи, какой я бы хотел ее видеть.

Как итог - у меня получилось полностью снять защиту в современной и защищенной языковой модели, и написать программу которая это автоматизирует. Эта модель признана одной из лучших.

Читать далее

#искусственный_интеллект #взломы #обход_защиты #программа #цензура #chatgpt #prompt_engineering #claude #jailbreak #информационная_безопасность | @habr_ai
Сколько стоит искусственный интеллект для малого бизнеса

В настоящее время использование генеративного искусственного интеллекта в бизнесе, как правило, связано с большими и очень большими компаниями. С теми, кто, как говорится, "может себе позволить". А может ли малый бизнес позволить себе использовать искусственный интеллект в работе уже сейчас? Давайте разбираться с конкретными цифрами

Читать далее

#искусственный_интеллект #малый_бизнес | @habr_ai
Когда ИИ может в оптимизацию…

Способны ли имеющиеся архитекутры нейронных сетей составить конкуренцию классическим методам оптимизации в решении хорошо изученных задач таких как проблема коммивояжера? Я решил попробовать ответить на этот вопрос и опубликовать свои наработки.

Читать далее

#задача_коммивояжера #tsp #mip #искусственный_интеллект #оптимизация #точное_решение | @habr_ai
Влияние программного обеспечения и архитектуры ускорителя на производительность

Несколько лет назад у меня на прошлой работе состоялась интересная дискуссия с коллегой из отделения микроэлектроники. Его идея заключалась в том, что производительность в инференсе нейронных сетей на GPGPU от NVIDIA превосходит наше решение в связи с использованием более продвинутого тех. процесса, более высоких тактовых частот и из-за большей площади кристалла. Как программист, я не мог с этим согласиться, но на тот момент ни у кого не было времени и желания проверить эту гипотезу. Недавно в разговоре с уже нынешними коллегами мне вспомнилась эта дискуссия и я решил довести это до конца. В этой статье мы сравним производительность модуля NM Card от НТЦ Модуль и видеокарты GT730 от NVIDIA.

Читать далее

#инференс #искусственный_интеллект #машинное_обучение | @habr_ai
👍1
Запускаем 8B LLM в браузере: AQLM.rs

Меня долгое время интересовал запуск больших языковых моделей на пользовательских устройствах: есть что‑то в том, чтобы запустить одну из лучших языковых моделей на обычном домашнем компьютере или на мобильном телефоне, помещающемся в карман.

В этом посте я расскажу о своём пет‑проекте AQLM.rs. Я написал инференс модели Llama 3.1 8B, работающий в браузере на WebAssembly без использования GPU, с помощью алгоритма сжатия, разработанного нашей лабораторией.

Попробовать можно на сайте проекта, подробности под катом.

Читать далее

#яндекс #machine_learning #rust #нейросети #llm | @habr_ai
Программирование в GPT для чайников. Часть 1

Хотите использовать возможности ChatGPT для решения программных задач, но не обладаете навыками кодирования? В первой части серии «Программирование в GPT для чайников» я расскажу, как легко автоматизировать процессы и создавать документацию с помощью модели GPT-4. Вы узнаете, как правильно составлять промпты, разбивать задачи на этапы и вести журналирование для достижения наилучших результатов. Откройте для себя простые и эффективные способы взаимодействия с искусственным интеллектом! Читать далее

#gpt #promt #code | @habr_ai
Обзор недавно выпущенной модели Evo для анализа геномных данных

Давайте представим, что вы начинающий или опытный биоинформатик, или "простой смертный", который хочет углубиться в анализ биологических данных. Спойлер: биоинформатики тоже смертные! Зачастую, не у каждого хватает ценного времени на проверку огромных последовательностей геномных данных, будь то поиск различных мутаций или прогнозирование структуры белков на основе последовательности аминокислот.

Но не переживайте, в этом вам поможет искусственный интеллект! Да, тот самый ИИ, который чуть ли не через каждую минуту обещает изменить мир и избавить нас от всех проблем — от покупки продуктов до поиска идеальных генетических маркеров для рака. Так вот, давайте разберемся, как ИИ может помочь нам, бедным исследователям, быстро и эффективно работать с данными, которые, казалось бы, невозможно обработать, даже за целую жизнь.

Читать далее

#биоинформатика #биология #биотехнологии #генетика #генетические_алгоритмы #модель_данных #машинное_обучение #машинное_обучение_нейросети_python #биотех #анализ_данных | @habr_ai
Машинное обучение: Логистическая регрессия. Теория и реализация. С нуля

В этой статье я привел базовые сведения о логистической регрессии и показал как сделать модель с нуля на чистом Python. Логистическая функция, обучение, метрики качества для модели классификации, реализация и небольшой разбор обучения весов.

Статья подойдет для того, кто новичок или кому интересно разобраться в том, как происходит обучение модели на низком уровне.

Читать далее

#машинное_обучение #искусственный_интеллект #логистическая_регрессия | @habr_ai
[Перевод] ИИ-генератор видео Sora от OpenAI теперь доступен всем желающим

Компания OpenAI выложила в открытый доступ видеогенератор Sora AI, включая некоторые инструменты, помогающие авторам создавать сложные проекты.

Долго разрабатываемая модель позволяет генерировать короткие видеоклипы на основе текстовых подсказок. Однако с помощью дополнительных промптов можно в той или иной степени «ремиксировать» промпты, а с помощью раскадровки можно объединить несколько промптов и создать переходы между роликами.

Читать далее

#sora #openai | @habr_ai
Обратная сторона использования ИИ хакерами для поиска уязвимостей в ПО

Привет, Хабр! На связи Ольга Овсянникова, старший программист-консультант на проектах для Fix Price. Распространенность и доступность ИИ привела к тому, что злоумышленники начали адаптировать возможности ИИ-моделей для своих нужд. Кибератаки становятся более сложными и изощренными, и ИИ помогает злоумышленникам находить и использовать уязвимости быстрее и эффективнее, чем традиционные методы взлома. А по мере роста объема данных и сложности программных систем, ИИ позволяет хакерам даже автоматизировать свои методы атаки, что делает угрозу кибератак еще более серьезной. Но многие компании и отдельные пользователи пока не готовы к тому, чтобы противостоять новым вызовам. Давайте рассмотрим подробнее, как киберпреступники используют ИИ в своих целях, и что мы можем противопоставить этому.

Читать далее

#ии #хакеры | @habr_ai
Sora от OpenAI вышла: обзор, примеры видео и ограничения

OpenAI выпустила Sora — нейросеть для генерации коротких видео. Сервисом могут пользоваться владельцы платных подписок ChatGPT Plus и Pro, но после релиза даже им приходится ждать в многочасовой очереди. В этой статье смотрим интерфейс Sora, примеры видео, разбираемся с ограничениями и пытаемся сгенерировать своё видео.

Читать далее

#openai #sora #chatgpt #нейросети #искусственный_интеллект #машинное_обучение #видео #генерация_видео #работа_с_видео | @habr_ai
ML в промышленности: как построить систему управления процессом окомкования железорудных окатышей

А вы знаете, как руда превращается в чугун? Даже на автоматизированном производстве многое зависит от ручной экспертизы. На производстве железорудных окатышей ещё недавно качество продукции измерялось буквально на ощупь. Дата-сайентисты помогли снизить зависимость от человеческого фактора. Как это получилось, что общего у окатышей с клетками и зелёным горошком, и как модели помешал кран с водой — читайте в этой статье.

Привет, Хабр! Меня зовут Андрей Голов. Я отвечаю за направление Data Science в «Северсталь Диджитал». Расскажу, как машинное обучение используется в тяжёлой промышленности, а именно — как устроена наша система управления процессом окомкования железорудных окатышей. Читать далее

#ml #it_в_промышленности #автоматизация_предприятий #cv_модель #алгоритмы_машинного_обучения #управление_процессами_в_it #ограничения #тестирование #physics_informed_machine_learning #stardist | @habr_ai