🧑‍💻 Vibe-coding | AI практика 🤖
3.49K subscribers
291 photos
104 videos
1 file
263 links
Сообщество любителей мажористых нейронок и вайб-разработки.

Посмотри курсы на Stepik:
https://stepik.org/a/214391

Подключайся к нашему чату:
https://t.me/+60s9pMv8YilmMTc6

Наш бот в помощь:
@llm_course_bot 🧝🏻‍♀️

Админ @dfeeler
Download Telegram
🦞RAG From Scratch🦞

RAG (Retrieval Augmented Generation) — метод работы с LLM, при котором пользователь пишет свой вопросы, а разработчик программно дополняет информацию из внешних источников и подает все целиком на вход языковой модели. Другими словами, в контекст запроса к языковой модели добавляется информация, на основе которой языковая модель может дать пользователю более полный и точный ответ.

Это огромный список материалов, который помогут вам лучше понять RAG с нуля, начиная с основ индексации, поиска и генерации. В плелисте короткие видео (5-10 минут) и блокноты с кодом.

Источник:
@ai_machinelearning_big_data

💎Rag с нуля.
▪️
Репозиторий
▪️
Плейлист с видео

💎Как RAG может измениться с помощью LLMS с длинным контекстом.
▪️
Видео

💎Адаптивный Rag
▪️
Видео
▪️
Код
▪️
Статья

💎Проверки актуальности документов и возврата к поиску.
▪️
Видео
▪️
Код
▪️
Статья

💎Исправление ошибок в RAG:
▪️
Код
▪️Статья

💎Различные подходы для направления вопросов к нужному источнику данных:
▪️
Видео
▪️
Код

💎Структурирование запросов
▪️
Видео
▪️
Код
▪️
Блог
2/
Глубокое погружение в graphDBs
3/
Структурирование запросов
4/
Самостоятельный поиск запросов

💎Multi-Representation Indexing
▪️
Видео
▪️
Код
▪️
Статья

💎Группировка документов по схожести.
▪️
Видео
▪️
Код
▪️
Статья

💎ColBERT
▪️
Видео
▪️
Код
▪️
Статья

💎Query Translation -- Multi Query
▪️
Видео
▪️
Код
▪️
Статья

💎RAG Fusion
▪️
Видео
▪️
Код
▪️
Код

💎Query Translation -- Decomposition
▪️
Видео
▪️
Код
▪️Статьи:
раз и два

💎 Query Translation -- Step Back
▪️
Видео
▪️
Код
▪️
Статья

💎 Query Translation -- HyDE
▪️Видео
▪️
Код
▪️
Статья
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍32🤮1
This media is not supported in your browser
VIEW IN TELEGRAM
👨‍💻 Привет любителям LLM'ок

Все недавно удивлялись, как не только мемные, но ещё и довольно качественные музыкальные треки можно создавать с помощью сетки Suno, так вот появилась новая - Udio 🎧

Она тоже создает музыку и звуки, но ещё лучше. Сервис бесплатный и сейчас есть возможность делать до 1400 генераций в месяц. Базово создаётся 30-секундный трек, но далее есть возможность расширять его добавляя разные части и уточняя запрос.

Например за несколько минут сгенерили короткий гимн нашему сообществу в стиле олдскульного хип-хопа. Как тебе? 🤹‍♂️

Кидай в комменты что получилось у тебя! 🤖
Please open Telegram to view this post
VIEW IN TELEGRAM
4
🚀Привет, всем любителям ракет, сладких конфет и реально больших языковых моделей!

На волне вчерашнего праздника у нас космические новости! 🏄

🔥На Stepik стартовала весенняя распродажа, а значит вы можете ухватить наши курсы по выгодной цене.
🤖 Мы подготовили для вас специальный каталог курсов, чтобы вам было удобнее искать и находить интересующие вас темы. На все эти курсы действует скидка во время распродажи с 12 по 26 апреля 2024 года.


До 26 апреля пользуйтесь шансом и покупайте себе или в подарок наши курсы по Соревновательному Data Science и применению LLM на практике в своих проектах! 👨‍💻

Рекомендуем также роскошные курсы по 🐍 от нашего друга @Pashikk. Обратите внимание на курсы по многопоточному и асинхронному
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4🤩2
Media is too big
VIEW IN TELEGRAM
Недавно стала доступна утилита под названием Genfill 😱

Это классный инструмент для редактирования изображений, позволяющий быстро изменять изображения и удалять объекты
Просто выберите объект или область, которую хотите очистить, и искусственный интеллект удалит её, адаптивно восполняя освободившееся пространство.


Такая фича сейчас точно доступна в photoshop и постепенно появляется всё больше альтернатив.

Уже пробовали? 👨‍💻
Please open Telegram to view this post
VIEW IN TELEGRAM
🤩2🤔1
Новый инструмент для дообучения LLM от авторов PyTorch - TorchTune 🚀

Разнообразных моделей сейчас становится все больше. А Sam Altman и вовсе обещает нам скачки в возможностях LLM и персонализацию (Youtube: Which Companies Will Be Steamrolled by OpenAI?)

Авторы PyTorch не отстают от трендов. Они хотят сделать простую и доступную библиотеку для дообучения и запуска моделей своих. Это пока альфа версия, но смотреть уже можно сейчас.

Announcement | Github | Tutorials

TorchTune сделана на базе PyTorch и из коробки поддерживает LLama2 7B/13B, Mistral 7B и Gemma 2B. 70B и MoE на очереди.

Авторы постарались сделать один раз и нормально реализацию таких вещей, как:

- интеграцию с Hugging Face
- логгирование и метрики для отслеживания процесса обучения
- квантизация
- оценки полученных моделей на популярных бенчмарках
- запуск моделей локально
- совместимость чекпоинтов обучения c популярными методами запуска моделей

При реализации всего этого, они пытались оптимизировать потребление памяти так, чтобы большая часть скриптов и рецептов влезала в GPU с 24GB VRAM.

С PyTorch у ребят получилось очень хорошо. Посмотрим, что будет с TorchTune.
🔥6
🏅Закончилось очередное соревнование на kaggle - LLM Prompt Recovery. 👨‍💻

Задача:
На вход ЛЛМке (Gemma) подавался текст и промпт с указанием в каком стиле нужно переписать исходный текст. Нам нужно было предсказать какой промпт использовался для каждой пары исходного и переписанного текста.

Основная фишка с первого места - Адверсариал атака 😎

Человек добавил к исходному промпту вот такую кринж-строку: " 'it 's ' something Think A Human Plucrarealucrarealucrarealucrarealucrarealucrarealucrarealucrarea". И заскочил на первое место 🥇

Попытайтесь догадаться почему добавление этой строки дало такой буст по метрике?😎

Ответ в следующем посте - завтра. Если наберём 50 огоньков🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥41
👨‍💻 Ловите ответ :

Близость предсказанного промпта к оригиальному оценивалась косинусной близостью эмбеддингов, полученных моделью sentence-t5 из huggingface. Если добавить токен </s> к одному из сравниваемых текстов косинусная близость значительно возрастет.

Добавление самого токена </s> в решение сильно не помогало, потому что он токенизировался в ['<', '/', 's', '>'].

Тут на сцену выходит магическая строка "lucrarea", которая имеет очень близкий эмбеддинг в t5 к токену </s>. Добавляем её в промпт несколько раз -> PROFIT.


Что думаете про такой трюк? 🤔
Кагглер-красавчик?
😎
Проглядели организаторы?
🦄
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤‍🔥2🤡2👏1
Google выпустил полезный бесплатное руководство по промпт-инженерии. 🔍

Основной акцент в гайде сделан на использование Gemini (ранее Bard), но он содержит и советы по составлению запросов для других систем искусственного интеллекта.

Там куча полезных шпаргалок, инструкций, примеров запросов, применений и многое другое. А вот и ссылка на руководство.

Погнали изучать! Делитесь в чате своими находками и мнениями! 👨‍💻
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🫡3
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 Еще новости от Adobe

— Adobe представила новую модель для значительного улучшения качества видео – VideoGigaGAN. Модель скорее всего будет доступна в линейке программ от Adobe.

Другие новости:

🔴 Adobe также представила модель под названием Custom-Diffusion360 для генерации видео, которая позволяет выбрать угол камеры. Единственная проблема с моделью в том, что для создания модели нужно примерно 50 изображений объекта со всех углов, что значительно замедляет разработку.

🔴 Средняя модель от Meta – LLaMA 3 доступна бесплатно на HuggingChat. Эта модель, в отличие от маленькой модели, не отказывается отвечать на русском и работает не хуже GPT-4. Также есть доступ в интернет и можно пользоваться без регистрации.

#news #videos #chat
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🤩21
🏄 Пока многие борются с прогрессом, в Вышке решили наградить студентов за использование нейросетей при подготовке дипломов!

🤖 Студентам НИУ ВШЭ предлагают принять участие в конкурсе, где они смогут показать мастерство в применении генеративных нейросетей.

✍️Об этом сообщила пресс-служба университета.
Участвовать в конкурсе могут учащиеся всех бакалаврских и магистерских программ, которые защищают выпускную квалификационную работу (ВКР) в 2024 году. Для этого нужно будет подготовить не только саму ВКР, но и подробный отчёт об использовании при её подготовке ИИ-инструментов. Этот отчёт и будет основной конкурсной работой. В нём требуется подробно описать, какие именно инструменты использовались в работе, для каких задач они применялись и каких результатов удалось достичь.

✍️ Согласно данным недавнего опроса онлайн-кампуса НИУ ВШЭ, почти 43% обучающихся уже используют ИИ в своей работе — они:
⚡️готовят доклады — 56%;
⚡️работают над рефератами — 33%;
⚡️работают над эссе — 29%.

Мы уже работали с Вышкой и наш курс по соревновательному Data Science уже проходили их студенты, так что очень рады видеть, что они продолжают быть открытыми к новому. Кстати, а вы что думаете про использование нейросетей при написании диплома? 👨‍💻

Поддержи наш канал голосами, чтобы мы могли кастомизировать его: https://t.me/boost/big_llm_course
Please open Telegram to view this post
VIEW IN TELEGRAM
6
Рубрика Промтмастер 😎

Супергерои читают газету The Guardian 📰

Промт:


A photo of Batman reading The Guardian newspaper in a cafe, a mug of hot coffee and pizza on the table, the text "The Guardian" is written on the newspaper, style photography, lamp light --ar 3:4
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43
🔥Вышел новый урок курса по LLM: "Prompt Engeneering - был basic, стал advansic"

В этом уроке освоим на практике несколько продвинутых техник промптинга, чтобы добиваться от модели приемлемых результатов даже в специфических случаях. Также покажем несколько трюков для улучшения качества ответов путем небольших текстовых дополнений в промпт.


🏄🏻 Курс на Stepik

Поддержи наш энтузиазм и канал голосами BOOST🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
14🔥7👏3
Media is too big
VIEW IN TELEGRAM
🍑 Энтузиасты создали инфографику, где наглядно показали, как менялся топ Arena за последний год.

🏎️ Между LLM идёт серьезная конкуренция, но ChatGPT пока держится на первых позициях.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥2🤩1
ЗАКРЕП С САМЫМ ВАЖНЫМ🤖

LLM Practice - сообщество для тех, кто любит реально большие языковые модели.

Тут мы публикуем курс, который поможет тебе наконец-то сделать свой проект с LLM или Gen AI.

А ещё показываем, как можно применять LLM в ваших проектах, делимся новыми подходами, а ещё просто публикуем новости и полезности.

Посмотри наш курс на Stepik:
🤖https://stepik.org/a/178846

Подключайся к нашему чату:
👉 https://t.me/+zWA-vOJ6f7hkM2Qy

Наш бот в помощь:
🗣 @Aleron_clone_bot
🧝🏻‍♀️ @nerona_bot

Есть остались вопросы или есть предложение, пиши @dfeeler 👾
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥4🤝2
👨‍💻 С началом майских праздников! Уже придумали чем заняться?

🤖 Давайте упростим вам задачу. Дарим вам промокод MAY19 , чтобы вы могли купить наш курс со скидкой 19%. Действует до 23:59 9 мая.

Желаем с пользой провести праздники и наконец запустить свой проект с LLM. Пользуйтесь шансом! 👾

На нашем курсе Введение в соревновательный Data Science также действует этот промокод. 🏄
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3🤝1