Github Copilot Теперь Бесплатный
Как пересел на курсор, перестал читать release notes к вскоду, а зря. Оказывается, в декабре они выпустили бесплатный тариф для копилота. Уверен, что хуже курсора (как минимум нагрузка на сервера будет выше), но попробовать стоит, особенно если 20$/месяц вас останавливали.
Если вы в РФ, скорее всего, ничего не выйдет. Но я думаю есть альтернативы. Если попадется, обязательно напишу
Как пересел на курсор, перестал читать release notes к вскоду, а зря. Оказывается, в декабре они выпустили бесплатный тариф для копилота. Уверен, что хуже курсора (как минимум нагрузка на сервера будет выше), но попробовать стоит, особенно если 20$/месяц вас останавливали.
Если вы в РФ, скорее всего, ничего не выйдет. Но я думаю есть альтернативы. Если попадется, обязательно напишу
Visualstudio
Announcing a free GitHub Copilot for VS Code
Announcing a free plan for GitHub Copilot in Visual Studio Code.
Как работают LLM? Объясняет основатель OpenAI
Вышла видяшка на 3 часа от Андрея Карпатого, сооснователя OpenAI и ныне директора по ИИ в Tesla. Обещает объяснить как устроены нейронки, чтобы у вас была правильная интуиция при работе с ними. Причем, объяснить обещает без матана. Будем смотреть?
Вышла видяшка на 3 часа от Андрея Карпатого, сооснователя OpenAI и ныне директора по ИИ в Tesla. Обещает объяснить как устроены нейронки, чтобы у вас была правильная интуиция при работе с ними. Причем, объяснить обещает без матана. Будем смотреть?
YouTube
Deep Dive into LLMs like ChatGPT
This is a general audience deep dive into the Large Language Model (LLM) AI technology that powers ChatGPT and related products. It is covers the full training stack of how the models are developed, along with mental models of how to think about their "psychology"…
AI Coder 🦾
Cursor, после того, как я попробовал что-то еще
Попробовал бесплатный GitHub Copilot 😭
Perplexity добавили deep-research как в ChatGPT PRO, только там это стоит 200$, а тут бесплатно. Интересно, как оно по качеству?
AI Coder 🦾
Как работают LLM? Объясняет основатель OpenAI Вышла видяшка на 3 часа от Андрея Карпатого, сооснователя OpenAI и ныне директора по ИИ в Tesla. Обещает объяснить как устроены нейронки, чтобы у вас была правильная интуиция при работе с ними. Причем, объяснить…
Почему LLM галлюционируют?
На скриншоте Андрей Карпатый заставляет модель галлюцинировать, говоря “не используй инструменты”, из-за чего ChatGPT не может сходить в интернет и посмотреть, кто же такой Орсон Ковач. При этом мы знаем, что в обучающих данных этой информации нет.
Он объясняет это так - языковая модель это огромная формула, которая вычисляет вероятности следующих токенов, на основе статисики из своего training set, и для нее по-умолчанию нет разницы между вопросом, который предполагает знание какого-то факта и вопросом, ответ на который надо придумать. Иными словами, она “не знает”, что она чего-то не знает.
В последнем ChatGPT, видимо, добавили дополнительный шаг чтобы перед отправкой запроса в модель поисходило обогащение контекста (RAG) через интернет, поэтому хитрый Карпатый приказал не жульничать. В итоге модель, как и ожидалось, выдала полную отсебятину.
На скриншоте Андрей Карпатый заставляет модель галлюцинировать, говоря “не используй инструменты”, из-за чего ChatGPT не может сходить в интернет и посмотреть, кто же такой Орсон Ковач. При этом мы знаем, что в обучающих данных этой информации нет.
Он объясняет это так - языковая модель это огромная формула, которая вычисляет вероятности следующих токенов, на основе статисики из своего training set, и для нее по-умолчанию нет разницы между вопросом, который предполагает знание какого-то факта и вопросом, ответ на который надо придумать. Иными словами, она “не знает”, что она чего-то не знает.
В последнем ChatGPT, видимо, добавили дополнительный шаг чтобы перед отправкой запроса в модель поисходило обогащение контекста (RAG) через интернет, поэтому хитрый Карпатый приказал не жульничать. В итоге модель, как и ожидалось, выдала полную отсебятину.
Бесплатный DeepSearch и Reasoning круче чем в OpenAI
Если кто пропустил, то релизнулась последняя моделька от xAI (компания Маска), там бесплатно доступны “размышление” и “глубокий рисерч”. Я тестирую прямо сейчас и первое впечатление позитивное, по слухам в интернете тоже работает хорошо. У бесплатной версии наверняка есть лимиты, ибо также предлагается SuperGrok за 30$ в месяц (дороже, чем OpenAI Plus, но намного дешевле чем PRO). Затестим?
https://grok.com/
—-
Upd: 5 рисёрчей в день на фришке
Если кто пропустил, то релизнулась последняя моделька от xAI (компания Маска), там бесплатно доступны “размышление” и “глубокий рисерч”. Я тестирую прямо сейчас и первое впечатление позитивное, по слухам в интернете тоже работает хорошо. У бесплатной версии наверняка есть лимиты, ибо также предлагается SuperGrok за 30$ в месяц (дороже, чем OpenAI Plus, но намного дешевле чем PRO). Затестим?
https://grok.com/
—-
Upd: 5 рисёрчей в день на фришке
Пусть ChatGPT видит нашими глазами и подсказывает 👀
Бывает сидишь, делаешь что-то, и что-то непонятно. Хочется, чтобы бы рядом сидел кто-то, кто разбирается и у кого можно просто взять и спросить.
Вот, например, на криптобирже Bybit меня заинтереосвал инструмент пассивного дохода “Dual Asset”, но я понятия не имею, что это.
Раньше в таких ситуациях я делал скриншот, переключался в ChatGPT и заливал его туда, затем писал свой вопрос и, наконец, получал ответ. И, знаете, что? Оказывается, все это время можно было намного проще!
Надо чтобы ChatGPT Desktop был установлен на вашем компьютере! Скачать можно тут
1. Открываем окно быстрого доступа к ChatGPT (
2. Нажимаем
3. Выбираем нужное нам окно (в моем случае это окно со страничкой биржи Bybit)
4. Пишем свой вопрос
Вуаля! Теперь мы знаем, что такое Dual Asset. (Спойлер: это рисковая штука)
И да, я знаю, что Bybit недавно взломали
Бывает сидишь, делаешь что-то, и что-то непонятно. Хочется, чтобы бы рядом сидел кто-то, кто разбирается и у кого можно просто взять и спросить.
Вот, например, на криптобирже Bybit меня заинтереосвал инструмент пассивного дохода “Dual Asset”, но я понятия не имею, что это.
Раньше в таких ситуациях я делал скриншот, переключался в ChatGPT и заливал его туда, затем писал свой вопрос и, наконец, получал ответ. И, знаете, что? Оказывается, все это время можно было намного проще!
Надо чтобы ChatGPT Desktop был установлен на вашем компьютере! Скачать можно тут
1. Открываем окно быстрого доступа к ChatGPT (
Cmd+O
на маке)2. Нажимаем
+
и выбираем take screenshot
3. Выбираем нужное нам окно (в моем случае это окно со страничкой биржи Bybit)
4. Пишем свой вопрос
Вуаля! Теперь мы знаем, что такое Dual Asset. (Спойлер: это рисковая штука)
И да, я знаю, что Bybit недавно взломали
Cursor обновился
1️⃣ В новой версии убрали отдельные окна чата и композера, теперь все в одном месте
2️⃣ Больше не надо специально тегать
3️⃣ Улучшили поддержку
4️⃣ В менюшке появился Bug Finder, на большом количестве изменений стоит как чугунный мост, вангую что оно того не стоит, а вот на маленьком с быстрой моделькой надо потестить
5️⃣ Еще всякие мелочи
Кайф!
1️⃣ В новой версии убрали отдельные окна чата и композера, теперь все в одном месте
2️⃣ Больше не надо специально тегать
@Web
, курсор сам понимает, когда надо сходить в интернет3️⃣ Улучшили поддержку
.cursorignore
и добавили .cursorindexignore
чтоб тонко настраивать индексирование4️⃣ В менюшке появился Bug Finder, на большом количестве изменений стоит как чугунный мост, вангую что оно того не стоит, а вот на маленьком с быстрой моделькой надо потестить
5️⃣ Еще всякие мелочи
Кайф!
Пусть ИИ читает логи в CI вместо вас
Раньше, когда CI/CD падал, приходилось лезть в логи и искать причину. Любой программист знает, это занятие не из приятных. Хорошо писать логи умеют единицы, обычно полезная информация тонет в куче мусора. Но прогресс не стоит на месте!
Встроенный (и бесплатный) copilot прямо на сайте гитхаба можно попросить прочесть логи и объяснить причину тряски. Можно даже початиться с ним, если совсем одиноко.
Раньше, когда CI/CD падал, приходилось лезть в логи и искать причину. Любой программист знает, это занятие не из приятных. Хорошо писать логи умеют единицы, обычно полезная информация тонет в куче мусора. Но прогресс не стоит на месте!
Встроенный (и бесплатный) copilot прямо на сайте гитхаба можно попросить прочесть логи и объяснить причину тряски. Можно даже початиться с ним, если совсем одиноко.
Нам Осталось 2 Года?
Компании вроде OpenAI и Anthropic пророчат нам ИИ на уровне (очень умного и усердного) человека уже через пару лет! Речь идет об автономных агентах, которые способы пользоваться любыми человеческими интерфейсами, как цифровыми так и (через роботов) аналоговыми.
Стоит ли им верить? С одной стороны, их слова нужно делить пополам, ведь им выгодно, чтобы мы верили. К тому же, есть много технологий, которые вроде вот-вот появятся, да все никак: холодный ядерный синтез, эффективные квантовые вычисления и проч.
С другой, гонка ИИ-вооружений чертовски реальна, а конкуренция и бабло всегда двигали прогресс вперед.
Так или иначе, лично мне кажется рациональным отталкиваться от того, что Super-AGI может появится в любой момент, хоть завтра. Как говорится, хочешь мира - готовься к войне.
Эти новости поднимают вопрос - как подготовиться к жизни в мире, где ты больше не способен сделать что-то полезное, потому что машина сделает это лучше, дешевле и быстрее, причем намного?
Я не знаю, и мне кажется, никто не знает… Но вот вещи, которые я нахожу полезными:
1️⃣ Накапливать ресурсы (и не забывать о диверсификации)
2️⃣ Стремиться уйти из найма - какую бы работу вы не выполняли, через (максимум) 10 лет она исчезнет
3️⃣ Поддерживать и по возможности улучшать свое здоровье - либо мы исчезнем, как пыль, либо попадем в золотой век, где смерть и старение ушли в тьму веков, туда же, где сейчас место средневековым ужасам (будет обидно не дожить до этого, согласитесь)
4️⃣ Учиться (и учиться разбираться - чему учиться надо, а чему нет. Времени осталось немного, и расходовать его нужно с умом)
Ставьте🤖 лайк, если вам интересна эта тема, ибо у меня есть еще мысли на этот счет :)
Компании вроде OpenAI и Anthropic пророчат нам ИИ на уровне (очень умного и усердного) человека уже через пару лет! Речь идет об автономных агентах, которые способы пользоваться любыми человеческими интерфейсами, как цифровыми так и (через роботов) аналоговыми.
Стоит ли им верить? С одной стороны, их слова нужно делить пополам, ведь им выгодно, чтобы мы верили. К тому же, есть много технологий, которые вроде вот-вот появятся, да все никак: холодный ядерный синтез, эффективные квантовые вычисления и проч.
С другой, гонка ИИ-вооружений чертовски реальна, а конкуренция и бабло всегда двигали прогресс вперед.
Так или иначе, лично мне кажется рациональным отталкиваться от того, что Super-AGI может появится в любой момент, хоть завтра. Как говорится, хочешь мира - готовься к войне.
Эти новости поднимают вопрос - как подготовиться к жизни в мире, где ты больше не способен сделать что-то полезное, потому что машина сделает это лучше, дешевле и быстрее, причем намного?
Я не знаю, и мне кажется, никто не знает… Но вот вещи, которые я нахожу полезными:
1️⃣ Накапливать ресурсы (и не забывать о диверсификации)
2️⃣ Стремиться уйти из найма - какую бы работу вы не выполняли, через (максимум) 10 лет она исчезнет
3️⃣ Поддерживать и по возможности улучшать свое здоровье - либо мы исчезнем, как пыль, либо попадем в золотой век, где смерть и старение ушли в тьму веков, туда же, где сейчас место средневековым ужасам (будет обидно не дожить до этого, согласитесь)
4️⃣ Учиться (и учиться разбираться - чему учиться надо, а чему нет. Времени осталось немного, и расходовать его нужно с умом)
Ставьте
Please open Telegram to view this post
VIEW IN TELEGRAM
Что такое Build in Public и как это связано с ИИ?
Те, кто читают меня давно, знают, что техно-оптимизм тут совмещается со страхом перед будущим, в первую очередь потерей работы. Я считаю, что об этом нужно думать и говорить, потому что большинство людей все еще не воспринимает эту проблему всерьез.
Так вот, этот самый страх (и любовь к программированию, конечно же), побудили меня начать пытаться запустить свой собственный продукт. Я завел второй канал @build_saas_in_public и буду писать туда про свой тернистый путь.
Если вам не интересна тема предпринимательства, инди-хакерства или стартапов, просто пройдите мимо. Остальным - welcome. Упор на то, как технически подкованному человеку разобраться в маркетинге и запуститься.
Ну и да, конечно же, продукт будет связан с LLM 😉. Подробности будут в самом канале!
ССЫЛКА НА КАНАЛ
Те, кто читают меня давно, знают, что техно-оптимизм тут совмещается со страхом перед будущим, в первую очередь потерей работы. Я считаю, что об этом нужно думать и говорить, потому что большинство людей все еще не воспринимает эту проблему всерьез.
Так вот, этот самый страх (и любовь к программированию, конечно же), побудили меня начать пытаться запустить свой собственный продукт. Я завел второй канал @build_saas_in_public и буду писать туда про свой тернистый путь.
Если вам не интересна тема предпринимательства, инди-хакерства или стартапов, просто пройдите мимо. Остальным - welcome. Упор на то, как технически подкованному человеку разобраться в маркетинге и запуститься.
Ну и да, конечно же, продукт будет связан с LLM 😉. Подробности будут в самом канале!
ССЫЛКА НА КАНАЛ
Telegram
Build in Public
Пытаюсь запустить микро-SaaS, чтобы уйти из найма, пока роботы не отобрали мою профессию.
Ещё пишу про ИИ-прогу в @ai_coder_channel и пилю опенсурс @nevalang_chat
Ещё пишу про ИИ-прогу в @ai_coder_channel и пилю опенсурс @nevalang_chat
Скриншот всей страницы в Arc 🖼️
Не перестану рекомендовать браузер Arc. Когда я вижу, как люди мучаются с вкладками в хроме/фаерфоксе, сидят в нескольких окнах под разными аккаунтами, устанавливают всякие расширения чтобы починить UX, я всегда спрашиваю - почему ты просто не пересядешь на Арк?
Сегодня я для прикола проверил, умеет ли он делать скриншот всей страницы - это когда тебе нужно заскринить весь сайт сразу, сверху донизу. И знаете что? Умеет! Я даже не удивлен.
Арководы, жмем
Не перестану рекомендовать браузер Arc. Когда я вижу, как люди мучаются с вкладками в хроме/фаерфоксе, сидят в нескольких окнах под разными аккаунтами, устанавливают всякие расширения чтобы починить UX, я всегда спрашиваю - почему ты просто не пересядешь на Арк?
Сегодня я для прикола проверил, умеет ли он делать скриншот всей страницы - это когда тебе нужно заскринить весь сайт сразу, сверху донизу. И знаете что? Умеет! Я даже не удивлен.
Арководы, жмем
Cmd+T
и пишем full page
, затем выбираем Capture Full Page
и будет нам счастье! Скриншот сразу попадает в буфер обмена, а в правом верхнем углу появляются кнопки для сохранения на диск и шэра.Бери (у ИИ) как Есть
В соседнем канале мысль, что не надо стремиться контролировать каждый винтик в своей жизни, лучше, наоборот, аутсорсить по максимуму. Так вот, это касается и программирования с ИИ!
Вершина vibe-coding это когда вы не пишете ни строчки кода руками. Понять, там вы или нет легко - задайте себе вопрос, приходится ли вам думать над неймингом?
Все чаще в последнее время я ловлю себя на мысли, что я не исправляю/улучшаю/уточняю код, который для меня сгенерировал ИИ. Зачастую он достаточно неплох, (да еще и снабжен комментариями, как правило).
Сегодня я обсуждал в ChatGPT архитектуру своего Chrome-расширения, конкретно, логику логина через Google. Мы пришли к конкретному набору сущностей, целые классы и методы будут вставлены в репозиторий как есть. Раньше мне часто хотелось добавить что-то от себя. Я мог немного модифицировать сгенерированный код, просто чтобы он стал чуть-чуть лучше, но теперь я нахожу удовольствие в том, чтобы, напротив, вообще ничего не трогать.
Мысль все та же - контроль это не благо, а необходимость. Необходимо ли мне контролировать этот код? Не прикасаясь к нему лишний раз я освобождаю себя от необходимости думать, как назвать ту или иную переменную или функцию. ИИ предложил так, значит, так оно и будет. Кстати, он предложил не просто так, а потому что у него огромная “насмотренность”, и его вариант, скорее всего, как минимум не плох.
Разумеется, здравый смысл должен быть всегда. Я всегда пробегаюсь, хотя бы бегло, по сгенерированному коду. Годы опыта дали мне интуицию, которая позволяет понимать, где мне надо вникать, а где достаточно пробежаться по диагонали.
В соседнем канале мысль, что не надо стремиться контролировать каждый винтик в своей жизни, лучше, наоборот, аутсорсить по максимуму. Так вот, это касается и программирования с ИИ!
Вершина vibe-coding это когда вы не пишете ни строчки кода руками. Понять, там вы или нет легко - задайте себе вопрос, приходится ли вам думать над неймингом?
Все чаще в последнее время я ловлю себя на мысли, что я не исправляю/улучшаю/уточняю код, который для меня сгенерировал ИИ. Зачастую он достаточно неплох, (да еще и снабжен комментариями, как правило).
Сегодня я обсуждал в ChatGPT архитектуру своего Chrome-расширения, конкретно, логику логина через Google. Мы пришли к конкретному набору сущностей, целые классы и методы будут вставлены в репозиторий как есть. Раньше мне часто хотелось добавить что-то от себя. Я мог немного модифицировать сгенерированный код, просто чтобы он стал чуть-чуть лучше, но теперь я нахожу удовольствие в том, чтобы, напротив, вообще ничего не трогать.
Мысль все та же - контроль это не благо, а необходимость. Необходимо ли мне контролировать этот код? Не прикасаясь к нему лишний раз я освобождаю себя от необходимости думать, как назвать ту или иную переменную или функцию. ИИ предложил так, значит, так оно и будет. Кстати, он предложил не просто так, а потому что у него огромная “насмотренность”, и его вариант, скорее всего, как минимум не плох.
Разумеется, здравый смысл должен быть всегда. Я всегда пробегаюсь, хотя бы бегло, по сгенерированному коду. Годы опыта дали мне интуицию, которая позволяет понимать, где мне надо вникать, а где достаточно пробежаться по диагонали.
Telegram
Build in Public
Не контролируй
Раньше я сидел на линуксе, потому что мне нравилась идея контроля. У Линукса открытый исходный код (читал его 0 раз), и его можно кастомизировать как угодно. Та же история была с Vim (кто не знает, это олдскульный редактор кода, чтобы программировать…
Раньше я сидел на линуксе, потому что мне нравилась идея контроля. У Линукса открытый исходный код (читал его 0 раз), и его можно кастомизировать как угодно. Та же история была с Vim (кто не знает, это олдскульный редактор кода, чтобы программировать…
График интеллекта и скорости GPT
Если еще не видели, картинка из официального блога
Интеллект/Скорость: Получается, что
Цена:
P.S. - если я все правильно понимаю, то`4.1` это не reasoning модель, как она соотносится с o1/o3 пока не разбирался.
Если еще не видели, картинка из официального блога
Интеллект/Скорость: Получается, что
4.1
самая умная, по скорости как 4o
, 4.1 mini
- лучший баланс между скоростью и интеллектом, а 4.1 nano
тупая и быстраяЦена:
4.1
дешевле чем 4o
, но 4.1-mini
дороже чем 4o-mini
. Подробнее тутP.S. - если я все правильно понимаю, то`4.1` это не reasoning модель, как она соотносится с o1/o3 пока не разбирался.
Как streaming mode может ухудшить качество генераций
Пост для LLM-engineers, то есть тех, кто внедряет ЛЛМы в продукты.
Для тех, кто, вдруг, не в курсе - стриминг-режим, это когда модель вместо того чтобы подумать, а затем выплюнуть готовый ответ, отдает генерацию по кускам (чанками). Например, когда ChatGPT печатает для вас ответ, он делает это именно в стриминговом режиме, чтобы вы могли начать читать текст сразу, не дожидаясь окончания генерации.
Это классная штука с точки зрения UX и до сегодняшнего дня я думал, что на качество она не влияет. Оказывается, я ошибался! Streaming может ухудшить качество генерации и вот почему:
Как известно, LLM это “T9 на максималках”. Люди, которые не верят в скорое пришествие AGI часто говорят что-то вроде: “эта штука просто предсказывает следующее слово”. И в этом есть доля правды! Суть ЛЛМов действительно в том, что они вероятностно подбирают токен за токеном. Но это лишь половина правды, сегодняшние ЛЛМы устроены несколько сложнее.
Вам никогда не казалось, что это какая-то гребаная магия - продолжатель токенов каким-то волшебным образом дает правильные ответы на вопросы, где явно надо подумать, а не угадать? Я, к сожалению, не ML-специалист (хотя вот это видео, может подраскрыть завесу тайны), но вот что я знаю - современные модели, перед тем как выдать ответ, могут “подумать” про себя, и уже только после этого отправить вам текст.
“Подумать” в данном контексте означает, составить некий план ответа, а затем, начать генерацию, но не “вслух” а “про себя”, и в этом внутреннем процессе у модели есть возможность “вернуться назад” и изменить что-то. Так ЛЛМ может, например, понять что ее понесло куда-то не в ту степь, и она может откатиться к предыдущим токенам и отредактировать их. То есть, когда она генерирует токены про себя, она наблюдает свой промежуточный результат, и это влияет не только следующий токен, но и на предыдущие!
И, угадайте, как это работает в режиме стриминга? Никак. Ведь потоковая выдача затем и нужна, чтобы не ждать, пока ЛЛМ “подумает”, а дать пользователю увидеть результат ее мыслительной деятельности в реальном времени.
Вывод:
- Стриминг это исключительно улучшалка UX, качество генерации с ней не может стать лучше, а хуже может
- Обычный режим не может быть хуже стримингового по качеству, но может быть лучше
Нужен realtime-UX? Используй стриминг. Качество на вес золота? Выключай его и юзай обычный режим.
Только убедитесь, что у вас именно та задача, где каждый процент качества важен. Например, когда генерация влияет на финансовые показатели, или нужно генерировать документы в строгом формате - большинство кейсов ОК для стриминга!
Пост для LLM-engineers, то есть тех, кто внедряет ЛЛМы в продукты.
Для тех, кто, вдруг, не в курсе - стриминг-режим, это когда модель вместо того чтобы подумать, а затем выплюнуть готовый ответ, отдает генерацию по кускам (чанками). Например, когда ChatGPT печатает для вас ответ, он делает это именно в стриминговом режиме, чтобы вы могли начать читать текст сразу, не дожидаясь окончания генерации.
Это классная штука с точки зрения UX и до сегодняшнего дня я думал, что на качество она не влияет. Оказывается, я ошибался! Streaming может ухудшить качество генерации и вот почему:
Как известно, LLM это “T9 на максималках”. Люди, которые не верят в скорое пришествие AGI часто говорят что-то вроде: “эта штука просто предсказывает следующее слово”. И в этом есть доля правды! Суть ЛЛМов действительно в том, что они вероятностно подбирают токен за токеном. Но это лишь половина правды, сегодняшние ЛЛМы устроены несколько сложнее.
Вам никогда не казалось, что это какая-то гребаная магия - продолжатель токенов каким-то волшебным образом дает правильные ответы на вопросы, где явно надо подумать, а не угадать? Я, к сожалению, не ML-специалист (хотя вот это видео, может подраскрыть завесу тайны), но вот что я знаю - современные модели, перед тем как выдать ответ, могут “подумать” про себя, и уже только после этого отправить вам текст.
“Подумать” в данном контексте означает, составить некий план ответа, а затем, начать генерацию, но не “вслух” а “про себя”, и в этом внутреннем процессе у модели есть возможность “вернуться назад” и изменить что-то. Так ЛЛМ может, например, понять что ее понесло куда-то не в ту степь, и она может откатиться к предыдущим токенам и отредактировать их. То есть, когда она генерирует токены про себя, она наблюдает свой промежуточный результат, и это влияет не только следующий токен, но и на предыдущие!
И, угадайте, как это работает в режиме стриминга? Никак. Ведь потоковая выдача затем и нужна, чтобы не ждать, пока ЛЛМ “подумает”, а дать пользователю увидеть результат ее мыслительной деятельности в реальном времени.
Вывод:
- Стриминг это исключительно улучшалка UX, качество генерации с ней не может стать лучше, а хуже может
- Обычный режим не может быть хуже стримингового по качеству, но может быть лучше
Нужен realtime-UX? Используй стриминг. Качество на вес золота? Выключай его и юзай обычный режим.
Только убедитесь, что у вас именно та задача, где каждый процент качества важен. Например, когда генерация влияет на финансовые показатели, или нужно генерировать документы в строгом формате - большинство кейсов ОК для стриминга!
Telegram
AI Coder 🦾
Почему LLM галлюционируют?
На скриншоте Андрей Карпатый заставляет модель галлюцинировать, говоря “не используй инструменты”, из-за чего ChatGPT не может сходить в интернет и посмотреть, кто же такой Орсон Ковач. При этом мы знаем, что в обучающих данных…
На скриншоте Андрей Карпатый заставляет модель галлюцинировать, говоря “не используй инструменты”, из-за чего ChatGPT не может сходить в интернет и посмотреть, кто же такой Орсон Ковач. При этом мы знаем, что в обучающих данных…