Всем привет!
Добавили в курс обновленные видео про fine-tuning языковых моделей на примере LLAMA 3.1
🤗 Подготовка датасета в нужном формате
🦙 Запуска файнтюнинга
Добавили в курс обновленные видео про fine-tuning языковых моделей на примере LLAMA 3.1
🤗 Подготовка датасета в нужном формате
🦙 Запуска файнтюнинга
👍12🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
Привет, LLM-монстры! 😈
🎁 Розыгрыш МЕРЧА для студентов курса состоится в эту пятницу 27.09 в 16:30 - будет прямой эфир на этом канале!
Помимо розыгрыша, можно будет задать вопросы и пообщаться с авторами.
Так же разыграем приз среди онлайн зрителей СТРИМА!🔥
И ТОЛЬКО во время трансляции будет доступен вкусный промокод на покупку курса. 🤑
Напоминаем, условия очень простые:
- пройди курс до любого сертификата
- оставь отзыв о курсе на Stepik
Успеваете? Футболки, ремуверы и миллионы токенов ждут своих хозяев!😇
P.S.: Пока в розыгрыше только 30 участников на 20 призов - шансы очень БОЛЬШИЕ!
🎁 Розыгрыш МЕРЧА для студентов курса состоится в эту пятницу 27.09 в 16:30 - будет прямой эфир на этом канале!
Помимо розыгрыша, можно будет задать вопросы и пообщаться с авторами.
Так же разыграем приз среди онлайн зрителей СТРИМА!🔥
И ТОЛЬКО во время трансляции будет доступен вкусный промокод на покупку курса. 🤑
Напоминаем, условия очень простые:
- пройди курс до любого сертификата
- оставь отзыв о курсе на Stepik
Успеваете? Футболки, ремуверы и миллионы токенов ждут своих хозяев!😇
P.S.: Пока в розыгрыше только 30 участников на 20 призов - шансы очень БОЛЬШИЕ!
Псс, LLM-master, знаешь, что на картинке? 🤔
Мы тоже не знали, пока не начали проверять проект, сданный студенткой курса Марией Изофатовой - @slemary_taro_bot
А что? Финальный проект не обязательно должен быть заточен под коммерческие рельсы, а вполне может быть таким "Хобби-ботом". Хотя при желании, и сюда можно монетизацию прикрутить (расклады за 💵).
Бот может гадать на будущее, объяснять карты, делать расклады как на картинке и объяснять, что они означают.
На наш взгляд, боту не хватает визуала, ведь Таро - это, в первую очередь, визуальная история. И по UI есть, что доработать - менюшки красивые, интерфейс перевести.
Но, в целом, идея интересная и уже реализована в виде работающего бота. Может кто-то тоже увлекается (или сам гадалка🔮 ) и захочет помочь Марии доработать функционал.
P.S: Пишите в комментариях как вам проект Марии, и как называется расклад Таро с картинки.
P.P.S.: Можно спросить у бота повезёт завтра в розыгрыше мерча или нет!😇
Мы тоже не знали, пока не начали проверять проект, сданный студенткой курса Марией Изофатовой - @slemary_taro_bot
А что? Финальный проект не обязательно должен быть заточен под коммерческие рельсы, а вполне может быть таким "Хобби-ботом". Хотя при желании, и сюда можно монетизацию прикрутить (расклады за 💵).
Бот может гадать на будущее, объяснять карты, делать расклады как на картинке и объяснять, что они означают.
На наш взгляд, боту не хватает визуала, ведь Таро - это, в первую очередь, визуальная история. И по UI есть, что доработать - менюшки красивые, интерфейс перевести.
Но, в целом, идея интересная и уже реализована в виде работающего бота. Может кто-то тоже увлекается (
P.S: Пишите в комментариях как вам проект Марии, и как называется расклад Таро с картинки.
P.P.S.: Можно спросить у бота повезёт завтра в розыгрыше мерча или нет!😇
❤11👍4
This media is not supported in your browser
VIEW IN TELEGRAM
👍2❤1
"Ну, там с этим мужиком из Мстителей, и в конце все умерли..."
Знакомая ситуация?
Закрыть эту боль попытался в своём итоговом проекте студент курса Александр Пособило (@Sanchez_Z_Z_z_Z). И надо признать, это у него отлично получилось - оценили на 30 из 30.🔥
Это первый проект, где используются агенты (целая банда) и ансамбль ретриверов (код). Плюс отличное оформленный README - можно брать за образец!
Сервис "Movie Search ChatBot" задеплоен на Streamlit, можно ползоваться - мы долго пытались сломать каверзными вопросами - не получилось. Помимо поиска, может рассказать о чем фильм по названию, сделать подборку в любимом жанре, собрать топ с любимым актером или режиссером.🚀
В общем, проект из разряда - "давно над таким думал, но руки никак не дойдут." А Александр взял и сделал, классная идея и реализация - ботом действительно интересно и залипательно пользоваться!
Напишите в комментариях, какой фильм вам помог вспомнить этот бот и поддержите автора 👍 и ⭐️
Знакомая ситуация?
Закрыть эту боль попытался в своём итоговом проекте студент курса Александр Пособило (@Sanchez_Z_Z_z_Z). И надо признать, это у него отлично получилось - оценили на 30 из 30.🔥
Это первый проект, где используются агенты (целая банда) и ансамбль ретриверов (код). Плюс отличное оформленный README - можно брать за образец!
Сервис "Movie Search ChatBot" задеплоен на Streamlit, можно ползоваться - мы долго пытались сломать каверзными вопросами - не получилось. Помимо поиска, может рассказать о чем фильм по названию, сделать подборку в любимом жанре, собрать топ с любимым актером или режиссером.🚀
В общем, проект из разряда - "давно над таким думал, но руки никак не дойдут." А Александр взял и сделал, классная идея и реализация - ботом действительно интересно и залипательно пользоваться!
Напишите в комментариях, какой фильм вам помог вспомнить этот бот и поддержите автора 👍 и ⭐️
Спонтанный секретный промик на 45% на наш LLM курс от Сэма Альтмана.
Действует час!
Забирайте промокод LASTSEPDAY
Update: закрыто
Действует час!
Забирайте промокод LASTSEPDAY
Update: закрыто
👏5👍4❤1🤔1
Ловите пушковый видос
Это будет самой лучшей инвестицией вашего времени за весь год. Очень круто! Неужели мы проспали, а будущее уже наступило?!
Видос
С вас комментарий с вопросом!
Это будет самой лучшей инвестицией вашего времени за весь год. Очень круто! Неужели мы проспали, а будущее уже наступило?!
Видос
С вас комментарий с вопросом!
YouTube
Делаем web приложение без кода. Сайт с Таро прогнозами. Replit Agent
Снова пишем приложение без кода. Делаем сайт с карточками Таро для прогнозов.
Бэкенд на Flask и фронтенд на Java Script, но это все не важно, писать код мы не будет. Мы будем промптить! Это ChatGPT под капотом? Не только!
Еще больше разборов в телеграм…
Бэкенд на Flask и фронтенд на Java Script, но это все не важно, писать код мы не будет. Мы будем промптить! Это ChatGPT под капотом? Не только!
Еще больше разборов в телеграм…
🧑💻 Vibe-coding | AI практика 🤖
Ребят, накидайте идей Мы сейчас финалим стикер пак для LLM курса. Что добавить или исправить? Кидайте свои креативы в комменты)
Все? Отправляем в печать? Или будут правки от вас?
Media is too big
VIEW IN TELEGRAM
Еще одна мощная штука для фанатов Jupyter Notebook
🧠 Codeium можно как расширение установить в среду и повысить эффективность работы в несколько раз. Кайф?
🔛 Если накидайте бустов, то пришлем пример, как автокомплитить код для обучения transformer’ов по фолдам для любого датасета.
🧠 Codeium можно как расширение установить в среду и повысить эффективность работы в несколько раз. Кайф?
🔛 Если накидайте бустов, то пришлем пример, как автокомплитить код для обучения transformer’ов по фолдам для любого датасета.
👍14
Привет, это Андрей Богомолов.
Выпустился c Матфака Вышки, был СТО в ИИ-стартапе NLogic, а сейчас сооснователь в GenAI Lab, и в канале рассказываю, как мы внедряем генеративный ИИ в энтерпрайз
Не собираем подборки лучших промптов для контент-плана, но рассказываем о методах оценки точности RAG и нюансах разворачивали open-source LLM в контуре.
Делаем контент для разработчиков, продактов и всех, кто планирует или уже внедряет генеративный ИИ в свои процессы. Например, завтра в лайве расскажем, как сделали RAG-бота с интеграцией с БД интернет-магазина для консультации клиентов.
Подпишись, чтобы узнать больше про внедрение GenAI: @genailab
Выпустился c Матфака Вышки, был СТО в ИИ-стартапе NLogic, а сейчас сооснователь в GenAI Lab, и в канале рассказываю, как мы внедряем генеративный ИИ в энтерпрайз
Не собираем подборки лучших промптов для контент-плана, но рассказываем о методах оценки точности RAG и нюансах разворачивали open-source LLM в контуре.
Делаем контент для разработчиков, продактов и всех, кто планирует или уже внедряет генеративный ИИ в свои процессы. Например, завтра в лайве расскажем, как сделали RAG-бота с интеграцией с БД интернет-магазина для консультации клиентов.
Подпишись, чтобы узнать больше про внедрение GenAI: @genailab
👍3👏3⚡2👎2🗿1
Google украл вашу стартап идею: paper to podcast
Революция в чтении статей. Google анонсировал Paper to Podcast, инновационное решение, которое превращает научные статьи в увлекательные подкасты!
Гугл создал продукт, который позволяет загрузить статью и автоматически превратить ее в подкаст с двумя ролями: один задаёт вопросы, а другой отвечает. Это теперь реальность с Paper to Podcast.
Гугл понимает, что водителям, любителям походов и фитнеса, как и многим другим, не хватает подкастов, которые анализируют последние статьи, пока они на ходу. С Paper2Podcast теперь можно наслаждаться активностями на свежем воздухе, оставаясь в курсе стремительного прогресса в ИИ.
Попробовать можно по ссылке. (зарегистрируйтесь и подождите немного, чтобы получить доступ)
Революция в чтении статей. Google анонсировал Paper to Podcast, инновационное решение, которое превращает научные статьи в увлекательные подкасты!
Гугл создал продукт, который позволяет загрузить статью и автоматически превратить ее в подкаст с двумя ролями: один задаёт вопросы, а другой отвечает. Это теперь реальность с Paper to Podcast.
Гугл понимает, что водителям, любителям походов и фитнеса, как и многим другим, не хватает подкастов, которые анализируют последние статьи, пока они на ходу. С Paper2Podcast теперь можно наслаждаться активностями на свежем воздухе, оставаясь в курсе стремительного прогресса в ИИ.
Попробовать можно по ссылке. (зарегистрируйтесь и подождите немного, чтобы получить доступ)
GraphRAG теперь Open source!
GraphRAG от Microsoft использует большие языковые модели для создания подробных графов знаний из текстовых документов, помогая выполнять сложные запросы к данным.
Этот инструмент превосходит традиционный RAG, предлагая комплексный структурированный поиск информации.
GraphRAG можно легко развернуть в Azure с помощью предоставленного ускорителя решений.
👨💻 Блог
🐙 GitHub
GraphRAG от Microsoft использует большие языковые модели для создания подробных графов знаний из текстовых документов, помогая выполнять сложные запросы к данным.
Этот инструмент превосходит традиционный RAG, предлагая комплексный структурированный поиск информации.
GraphRAG можно легко развернуть в Azure с помощью предоставленного ускорителя решений.
🐙 GitHub
Please open Telegram to view this post
VIEW IN TELEGRAM
Нас отметили! 🏆
На Хабре завершился "Автоген-челлендж" по результатам которого наш гайд по тюнингу LAMA занял первое место🥇, а Алерон получил звание "Главного Автогенщика" 🏋.
Этот гайд является одним из ноутбуков урока по файнтюнингу LLM.
Приятно получать признание за проделанную работу.😇
Уже успели пройти этот урок?
На Хабре завершился "Автоген-челлендж" по результатам которого наш гайд по тюнингу LAMA занял первое место🥇, а Алерон получил звание "Главного Автогенщика" 🏋.
Этот гайд является одним из ноутбуков урока по файнтюнингу LLM.
Приятно получать признание за проделанную работу.😇
Уже успели пройти этот урок?
В полку проектов на 30 из 30 прибыло! 🦾
На этот раз отличную идею представил и реализовал студент курса Владислав Вирясов.
"Мечта любой хозяйки 😁" - AI Cooking Assistent (код).
Сервис реализован в виде веб-приложения на Streamlit, может помочь с поиском картинки неизвестного блюда и его рецептурой, предложить рецепт по имеющемуся набору ингридиентов.
Под капотом много наворотов:
- RAG система на базе 40 000 рецептов
- Ипользование LAMA 3.1 70B
- Router Chain с агентами
- Whisper для работы с голосовым вводом
Осталось добавить память для хранения контекста диалога с ассистентом и будет просто 🚀
В общем, Владислав постарался на славу - очень круто!🔥
P.S: Пишите в комментариях, как вам проект Владислава и поддержите автора 👍
На этот раз отличную идею представил и реализовал студент курса Владислав Вирясов.
"Мечта любой хозяйки 😁" - AI Cooking Assistent (код).
Сервис реализован в виде веб-приложения на Streamlit, может помочь с поиском картинки неизвестного блюда и его рецептурой, предложить рецепт по имеющемуся набору ингридиентов.
Под капотом много наворотов:
- RAG система на базе 40 000 рецептов
- Ипользование LAMA 3.1 70B
- Router Chain с агентами
- Whisper для работы с голосовым вводом
Осталось добавить память для хранения контекста диалога с ассистентом и будет просто 🚀
В общем, Владислав постарался на славу - очень круто!🔥
P.S: Пишите в комментариях, как вам проект Владислава и поддержите автора 👍
👍13🤩2❤1
🧙 На этой раз уже не сайт, а про телеграм бот без кодинга и конструкторов, все на AI
🎥 Ссылка на видео
🚀 С вас буст, если кайфуете от таких разборов
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10👎2 2😁1🗿1
Forwarded from do...while...ai (Gregory is typing...)
Ода Structured Output
Хочу показать уличную магию, которая изменила мою жизнь. Не так давно OpenAI расширила поддержку structured output в своём API: это когда вы LLM показываете схему данных в виде Pydantic объекта, а на выходе получаете готовый распарсенный и заполненный Dict. Этакий json_output "на стероидах".
Демонстрировать на gpt-4o было бы слишком банально, там всё работает из коробки. А я усложню задачу, и сделаю тоже самое на локальном сервере llama.cpp, в котором работает квантизованная модель Qwen 2.5 7B с квантизацией q4_k_m (потому что у меня слабенький M1 Pro с 16 гигами оперативки, и я пока не купил себе M4 Ultra) .
Итак, задача будет следующая: извлечь ключевые сущности из текста
И получить на выходе объект Dict, в котором разложены сущности и атрибуты.
Ниже привожу полностью рабочий код:
Результат — в первом комменте.
Небольшая "пояснительная бригада" по дизайну схемы данных: мы определяем атомарные Pydantic классы, которые потом объединяем в один результирующий класс. Описание того, что положить в конкретный объект пишем в поле
Самое крутое, что в одной схеме данных можно объединить парсинг данных, рассуждения и принятие решения. Вы просто определяете три мембера у Pydantic класса: первый — это класс, куда нужно попарсить данные, второй — поле
Через structured output можно делать скоринг данных, чеклисты по большому документу (например, вытаскивание финансовых показателей), и многое другое. Это ли не чудо!
Да, не забудьте обновить openai библиотеку до 1.52.0+.
Для внеклассного чтения пара доп. ссылок по structured output:
💎 https://platform.openai.com/docs/guides/structured-outputs
💎 https://openai.com/index/introducing-structured-outputs-in-the-api/
В комментах — результат скрипта и бонус-трек.
Openai
OpenAI Platform
Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform.
Хочу показать уличную магию, которая изменила мою жизнь. Не так давно OpenAI расширила поддержку structured output в своём API: это когда вы LLM показываете схему данных в виде Pydantic объекта, а на выходе получаете готовый распарсенный и заполненный Dict. Этакий json_output "на стероидах".
Демонстрировать на gpt-4o было бы слишком банально, там всё работает из коробки. А я усложню задачу, и сделаю тоже самое на локальном сервере llama.cpp, в котором работает квантизованная модель Qwen 2.5 7B с квантизацией q4_k_m (потому что у меня слабенький M1 Pro с 16 гигами оперативки, и я пока не купил себе M4 Ultra) .
Итак, задача будет следующая: извлечь ключевые сущности из текста
"Жили у бабуси два веселых гуся. Один - серый, а другой - белый. Два веселых гуся."
И получить на выходе объект Dict, в котором разложены сущности и атрибуты.
Ниже привожу полностью рабочий код:
from openai import OpenAI
from typing import List, Optional, Dict
from pydantic import BaseModel, Field
# use your favorite inference server
client = OpenAI(
base_url="http://localhost:8000/v1",
api_key="not-needed"
)
input_text = "Жили у бабуси два веселых гуся. Один - серый, а другой - белый. Два веселых гуся."
# define the data schema
class Attribute(BaseModel):
name: str = Field(..., description="Name of the attribute")
value: str = Field(..., description="Value of the attribute")
class Creature(BaseModel):
name: Optional[str] = Field(None, description="Name of the identified creatures")
attributes: Optional[List[Dict[str, str]]] = Field(None, description="List of attribute key-value pairs")
class ExtractedCreatures(BaseModel):
entities_and_attributes: List[Creature] = Field(default_factory=list, description="List of extracted creatures")
# command the model to extract data using the data schema
messages = [
{"role": "system", "content": """
Extract all creatures and their characteristics from the user text according to the specified schema.
"""},
{"role": "user", "content": input_text}
]
print("Executing...")
completion=client.beta.chat.completions.parse(
model="not-needed",
temperature=0.1,
messages=messages,
response_format=ExtractedCreatures
)
print("Result:")
# get the results as a dictionary
parsed_dict = completion.choices[0].message.parsed
# output the results as a JSON string
print(parsed_dict.model_dump_json(indent=2, exclude_none=True))
Результат — в первом комменте.
Небольшая "пояснительная бригада" по дизайну схемы данных: мы определяем атомарные Pydantic классы, которые потом объединяем в один результирующий класс. Описание того, что положить в конкретный объект пишем в поле
description
. Если поле необязательное — ставим ему Optional
. Если нужен выбор по типу enum, то ставим полю тип Literal
и явно перечисляем допустимые значения (модель сама разберется и поставит нужное). Если нужен составной объект типа массива или словаря, объявляем их как List
и Dict
соответственно. Системный промпт — микроскопический.Самое крутое, что в одной схеме данных можно объединить парсинг данных, рассуждения и принятие решения. Вы просто определяете три мембера у Pydantic класса: первый — это класс, куда нужно попарсить данные, второй — поле
reasoning: str = Field(..., description="Chain of thoughts and reasoning")
, сюда модель напишет свои рассуждения, а третье поле result: str = (..., description="Place 'Yes' or 'No' here")
. Через structured output можно делать скоринг данных, чеклисты по большому документу (например, вытаскивание финансовых показателей), и многое другое. Это ли не чудо!
Да, не забудьте обновить openai библиотеку до 1.52.0+.
Для внеклассного чтения пара доп. ссылок по structured output:
💎 https://platform.openai.com/docs/guides/structured-outputs
💎 https://openai.com/index/introducing-structured-outputs-in-the-api/
В комментах — результат скрипта и бонус-трек.
Openai
OpenAI Platform
Explore developer resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's platform.
❤5