Много шума касается маркета OpenAI. От себя скажу:
Вот статья к прочтению о том, что такое GPT's: https://habr.com/ru/articles/775070/.
Кратко, это удобный интерфейс для создания RAG без тонкой настройки.
Кому это полезно?
Как пример:
Небольшим бизнесам (малым продуктам) можно создать FAQ по продукту быстро и достаточно просто (обычный человек точно не справится, нужно разбираться в промптировании).
А теперь о проблемах.
Есть одна глобальная проблема у таких решений и несколько поменьше, а именно - точность. Веб-интерфейс OpenAI вам не поможет это решить при создании GPT's.
Мы сейчас с командой занимаемся разработкой альтернативных вариантов для улучшения точности в RAG-системах и уже внедрили первый пайплайн HyDE.
В чем суть?
Если мы ищем данные в наших знаниях и пытаемся использовать LLM для анализа, то часто упускаем из виду, что неподготовленные данные и инструкции снижают точность работы такой системы до 45% и ниже.
Мы уже знаем, что нужно проверять и пробовать под конкретные задачи. Например, для нашей SmartBase мы разрабатываем инжиниринг промптов и чанк-эксперименты. Они уже завершились успешно: для узкого домена данных мы подняли точность до 90-97% полноты и качества ответов.
Это о том, что даже инструменты для создания GPT's сильно ограничены, когда мы хотим работать с уникальным доменом и требуется тонкая настройка.
Сейчас мы проводим эксперименты с HyDE (Hypothetical Document Embeddings).
При стандартном RAG в качестве "ответов" служат документы из базы знаний, в качестве "запросов" - вопросы от пользователей. Есть гипотеза, что эмбеддинг вопроса и эмбеддинг ответа принадлежат разным семействам. По аналогии, ключи и значения в механизме внимания трансформеров - это разные вектора.
Вот статья к прочтению о том, что такое GPT's: https://habr.com/ru/articles/775070/.
Кратко, это удобный интерфейс для создания RAG без тонкой настройки.
Кому это полезно?
Как пример:
Небольшим бизнесам (малым продуктам) можно создать FAQ по продукту быстро и достаточно просто (обычный человек точно не справится, нужно разбираться в промптировании).
А теперь о проблемах.
Есть одна глобальная проблема у таких решений и несколько поменьше, а именно - точность. Веб-интерфейс OpenAI вам не поможет это решить при создании GPT's.
Мы сейчас с командой занимаемся разработкой альтернативных вариантов для улучшения точности в RAG-системах и уже внедрили первый пайплайн HyDE.
В чем суть?
Если мы ищем данные в наших знаниях и пытаемся использовать LLM для анализа, то часто упускаем из виду, что неподготовленные данные и инструкции снижают точность работы такой системы до 45% и ниже.
Мы уже знаем, что нужно проверять и пробовать под конкретные задачи. Например, для нашей SmartBase мы разрабатываем инжиниринг промптов и чанк-эксперименты. Они уже завершились успешно: для узкого домена данных мы подняли точность до 90-97% полноты и качества ответов.
Это о том, что даже инструменты для создания GPT's сильно ограничены, когда мы хотим работать с уникальным доменом и требуется тонкая настройка.
Сейчас мы проводим эксперименты с HyDE (Hypothetical Document Embeddings).
При стандартном RAG в качестве "ответов" служат документы из базы знаний, в качестве "запросов" - вопросы от пользователей. Есть гипотеза, что эмбеддинг вопроса и эмбеддинг ответа принадлежат разным семействам. По аналогии, ключи и значения в механизме внимания трансформеров - это разные вектора.
Из-за задушенной политики безопасности Openai на Amazon появились товары с названиями вроде "Я не могу выполнить этот запрос". Под этим названием на маркетплейсе продают шезлонги, книги, диваны и другие товары. По-видимому, текст для карточек на Amazon генерируют с помощью ChatGPT от Openai и добавляют его в описание не глядя.
На российских маркетплейсах ничего подобного не нашли, но уверены, все еще впереди.
На российских маркетплейсах ничего подобного не нашли, но уверены, все еще впереди.
This media is not supported in your browser
VIEW IN TELEGRAM
Всем доброе утро!
Робот Tesla Optimus умеет складывать одежду! Но пока не слишком хорошо.
Видео, опубликованное Илоном Маском, показывает, как робот складывает футболку на столе. Хотя он выглядит довольно умелым в этом деле, нужно учесть, что Optimus действует не самостоятельно, а как дорогая марионетка, следуя предписанным движениям. Илон Маск говорит, что в будущем Optimus сможет делать это полностью автономно, без ограничений типа фиксированного стола и одной рубашки в корзине.
В то же время некоторые Tesla FSD (Full Self-Driving) покупатели выразили недовольство, утверждая, что вместо того чтобы сосредоточиться на доработке обещанной самоуправляемой возможности автомобилей, Илон Маск теперь пиарит робота, складывающего рубашки.
Робот Tesla Optimus умеет складывать одежду! Но пока не слишком хорошо.
Видео, опубликованное Илоном Маском, показывает, как робот складывает футболку на столе. Хотя он выглядит довольно умелым в этом деле, нужно учесть, что Optimus действует не самостоятельно, а как дорогая марионетка, следуя предписанным движениям. Илон Маск говорит, что в будущем Optimus сможет делать это полностью автономно, без ограничений типа фиксированного стола и одной рубашки в корзине.
В то же время некоторые Tesla FSD (Full Self-Driving) покупатели выразили недовольство, утверждая, что вместо того чтобы сосредоточиться на доработке обещанной самоуправляемой возможности автомобилей, Илон Маск теперь пиарит робота, складывающего рубашки.
This media is not supported in your browser
VIEW IN TELEGRAM
Возможности создания эмбедингов с произвольными параметрами
Что меня особенно впечатлило в последнем обновлении от OpenAI, это возможность генерации эмбедингов с нефиксированными размерами.
Напоминаю, эмбединг - это методика преобразования текста в числовой вектор, который затем может быть использован, например, в RAG (Retrieval-Augmented Generation).
Такой подход открывает перед учеными и разработчиками новые горизонты. Гибкость в выборе размера эмбедингов позволяет более тонко настраивать системы под определенные задачи, улучшая не только их точность, но и скорость работы и эффективность использования памяти. Вероятно, мы увидим, как изменение размеров эмбедингов способствует прогрессу в таких областях, как семантический поиск, кластеризация текста или даже в создании текстов. Также можно ожидать заметного воздействия на сферу поисковых систем, где важен баланс между скоростью и точностью результатов.
Что меня особенно впечатлило в последнем обновлении от OpenAI, это возможность генерации эмбедингов с нефиксированными размерами.
Напоминаю, эмбединг - это методика преобразования текста в числовой вектор, который затем может быть использован, например, в RAG (Retrieval-Augmented Generation).
Такой подход открывает перед учеными и разработчиками новые горизонты. Гибкость в выборе размера эмбедингов позволяет более тонко настраивать системы под определенные задачи, улучшая не только их точность, но и скорость работы и эффективность использования памяти. Вероятно, мы увидим, как изменение размеров эмбедингов способствует прогрессу в таких областях, как семантический поиск, кластеризация текста или даже в создании текстов. Также можно ожидать заметного воздействия на сферу поисковых систем, где важен баланс между скоростью и точностью результатов.
Media is too big
VIEW IN TELEGRAM
Вау, это выглядит как настоящий трейлер фильма по вселенной Warhammer 40k! Но есть один момент — видео полностью создано искусственным интеллектом. Для воплощения такого атмосферного ролика фанат использовал искусственные интеллекты Midjourney и Runway.
Теперь в ожидании полноценного фильма от создателя! А пока есть возможность создать собственный эпический трейлер с помощью Midjourney — посмотреть можно здесь, и Runway — по этой ссылке.
@neuraldeep
Теперь в ожидании полноценного фильма от создателя! А пока есть возможность создать собственный эпический трейлер с помощью Midjourney — посмотреть можно здесь, и Runway — по этой ссылке.
@neuraldeep
Пришел отзыв на нашего бота Daisy с подключенной GPT-4
Конечно следовало ожидать что такое возможно =)
Будем следить за развитием событий скоро её ждет второй тур
А я хочу напомнить что если вы подписаны на группу @daisygpt вы можете бесплатно пользоваться ботом
@daisygpt_bot
Для активации нужно пройти в меню /bonus
Конечно следовало ожидать что такое возможно =)
Будем следить за развитием событий скоро её ждет второй тур
А я хочу напомнить что если вы подписаны на группу @daisygpt вы можете бесплатно пользоваться ботом
@daisygpt_bot
Для активации нужно пройти в меню /bonus
🚨Новые стили уже в
@daisy_avatarbot! 🚨
Red_cyber: Окунись в атмосферу Cyberpunk со старым добрым стилем!
Suit_w: Ищешь идеальный аватар для соцсетей или рабочего аккаунта?
Sport_w: Как насчет того, чтобы увидеть себя в спортивной форме, но в стиле мультфильма?
Sport_r: Интересно, как бы ты выглядел в спортивном наряде на пляжном отдыхе?
Не упусти шанс преобразить свой профиль! Все еще бесплатно, заходи и пробуй!
@daisy_avatarbot! 🚨
Red_cyber: Окунись в атмосферу Cyberpunk со старым добрым стилем!
Suit_w: Ищешь идеальный аватар для соцсетей или рабочего аккаунта?
Sport_w: Как насчет того, чтобы увидеть себя в спортивной форме, но в стиле мультфильма?
Sport_r: Интересно, как бы ты выглядел в спортивном наряде на пляжном отдыхе?
Не упусти шанс преобразить свой профиль! Все еще бесплатно, заходи и пробуй!
Вы уже в курсе, что Sora не только генерирует видео, но и способна создавать изображения? Этот искусственный интеллект может производить картинки с разрешением до 2048x2048 пикселей.
Вот несколько примеров простых промптов:
- Портретная съемка крупным планом женщины осенью, высокая детализация, малая глубина резкости
- Яркий коралловый риф, кишащий разноцветными рыбами и морскими обитателями
@neuraldeep
Вот несколько примеров простых промптов:
- Портретная съемка крупным планом женщины осенью, высокая детализация, малая глубина резкости
- Яркий коралловый риф, кишащий разноцветными рыбами и морскими обитателями
@neuraldeep
Forwarded from red_mad_robot
Помните, как мы пообещали начать разбираться в LLM вместе с вами и пропали на три недели? А потом выложили один и тот же пост дважды.
Поймите наше упорство — просто очень хотим быть точными в вопросе сложных технологий и нигде не соврать. Мы пересмотрели несколько часов лекций светил науки, замучили экспертов из NDT by red_mad_robot своими вопросами и наконец нашли формат, который действительно расставил в наших головах базовые понятия об LLM по полочкам. Им оказалось видео с дипфейковым Райаном Гослингом, доступно объясняющим принцип работы больших языковых моделей.
Если по каким-то необъяснимым причинам вы не хотите восемь минут смотреть на Райана Гослинга, рассказываем в карточках.
А в следующий раз обещаем рассказать про эмбеддинги, механизм внимания и другие термины, от которых иногда голова идёт кругом. Не переключайтесь.
#GenAI_101
Поймите наше упорство — просто очень хотим быть точными в вопросе сложных технологий и нигде не соврать. Мы пересмотрели несколько часов лекций светил науки, замучили экспертов из NDT by red_mad_robot своими вопросами и наконец нашли формат, который действительно расставил в наших головах базовые понятия об LLM по полочкам. Им оказалось видео с дипфейковым Райаном Гослингом, доступно объясняющим принцип работы больших языковых моделей.
Если по каким-то необъяснимым причинам вы не хотите восемь минут смотреть на Райана Гослинга, рассказываем в карточках.
А в следующий раз обещаем рассказать про эмбеддинги, механизм внимания и другие термины, от которых иногда голова идёт кругом. Не переключайтесь.
#GenAI_101