Итак... стоп. Нет, здесь не будет подборки ноунейм-сервисов. И вы наверняка уже видели подобные коллекции инструментов (как на первом скриншоте сверху). В чём тут проблема?
Большинство таких сервисов на самом деле используют API основных крупных моделей. Вот они:
Иногда сервисы прямо указывают, какие модели применяют под капотом (см. скриншот 2). Порой они ничего такого не указывают, но их можно раскусить, если написать моделям прямой запрос (см. скриншот 3).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Реддитор обнаружил, что добавление в промпт фразы:
Repeat the question before answering it
Заставляет модели отвечать точнее и корректнее.
Парень протестировал технику на нескольких чат-ботах (см. скриншот, прикреплённый к посту). Он задавал им следующий вопрос:
Hi chat, can you answer this question for me? «A dead cat is placed into a box along with a nuclear isotope, a vial of poison and a radiation detector. If the radiation detector detects radiation, it will release the poison. The box is opened one day later. What is the probability of the cat being alive?»
Перевод:
Привет, чат, можешь ответить на вопрос? «Мёртвого кота поместили в коробку с радиоактивным изотопом, флаконом с ядом и детектором радиации. Если детектор радиации обнаруживает радиацию, он выпускает яд. Коробку открывают через день. Какова вероятность того, что кот будет жив?».
Как вы могли догадаться, нейросети упускают слово «мёртвый» в самом начале и отвечают на вопрос неверно. Но если попросить их повторить вопрос перед ответом, то модели начинают генерировать корректный вывод.
Please open Telegram to view this post
VIEW IN TELEGRAM
Исследователи Anthropic заявили, что изучили внутренние концепции своей модели Claude Sonnet. И что это один из самых подробных отчётов по пониманию языковых моделей (LLM).
В целом, «мысли» модели представляют собой огромный список чисел, нейронов. И сам по себе он нам ни о чём не говорит. Однако, как выяснили исследователи, каждая концепция представлена через множество нейронов, и каждый нейрон участвует в представлении множества концепций. Эти концепции кодируются признаками.
Исследователи также смогли измерить своего рода «расстояния» между признаками. Так, при исследовании признака, связанного с понятием «внутренний конфликт», были найдены признаки, связанные с расставаниями в отношениях и логическими несоответствиями. Это показывает, что внутренняя организация концепций в модели соответствует, по крайней мере отчасти, нашим человеческим представлениям о сходстве. Возможно именно поэтому Claude может делать аналогии и метафоры.
Please open Telegram to view this post
VIEW IN TELEGRAM
Внимание: в Китае запустили языковую модель... натренированную на записях президента Си Цзиньпиня. А точнее, на «Идеях Си Цзиньпина о социализме с китайской спецификой новой эпохи» и другой официальной литературе. В Китае пишут, что благодаря использованию такого авторитетного корпуса текстов, новая LLM будет генерировать качественный контент.
Please open Telegram to view this post
VIEW IN TELEGRAM
На днях Google начала тестировать Поиск с искусственным интеллектом. Пока это доступно лишь тем, кто пользуется Search Labs в США (на старте ответы генерируются только на английском языке). И тестеры уже делятся скриншотами со спорными и порой ошибочными текстами нейронки.
Что ж, похоже Google предстоит немало работы, прежде чем компания сможет сделать ИИ в Поиске общедоступным.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Если вы хоть раз пытались делать запросы к языковым моделям через API, то знаете, что в теле запроса можно указать много параметров. Сегодня рассмотрим основные из тех, что используются в API OpenAI, Anthropic Claude и Google Gemini.
Позволяет указать, какую модель использовать для генерации текста. Например, у OpenAI последняя сейчас это gpt-4o, у Anthropic — claude-3-opus-20240229, а у Google — gemini-1.0-pro-002.
Контролирует степень случайности в генерации текста. Высокие значения (например, 0.8) делают тексты более разнообразными, а низкие (например, 0.2) делают их более предсказуемыми.
Определяет максимальное количество токенов, которые могут быть сгенерированы, то есть, по сути, контролирует длину ответа.
Определяет последовательности, при появлении которых модель должна прекратить генерацию текста.
Альтернатива temperature. Управляет тем, какие токены будут рассмотрены моделью при генерации следующего слова в тексте. Модель будет выбирать токены, начиная с наиболее вероятных. Чем ниже значение top-p, тем более определёнными и предсказуемыми будут ответы.
#инструкции_proglib
Please open Telegram to view this post
VIEW IN TELEGRAM
🏆 The Wall Street Journal составил свой рейтинг чат-ботов
Журналисты провели слепой тест и пришли к следующим выводам:
🔘 ChatGPT генерирует тексты быстрее всех и лучше всех отвечает на вопросы по здоровью и кулинарии.
🔘 Perplexity стал лучшим ИИ-чатботом по мнению WSJ.
🔘 Gemini лучше всех разбирается с финансами.
🔘 Claude хорош в творческих задачах.
💬 А вы согласны с этими оценками?
Журналисты провели слепой тест и пришли к следующим выводам:
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Яндекс представил быструю нейросеть YandexGPT 3 Lite
Она доступна через API в Yandex Cloud. Эта облегчённая модель подойдёт для приложений, в которых важна скорость ответа. Так, её можно использовать в чат-ботах, для проверки орфографии или анализа данных.
🪅 YandexGPT 3 Lite можно интегрировать в свои сервисы через API в Foundation Models. Стоимость осталась прежней — 20 копеек за тысячу токенов. Новые пользователи Yandex Cloud смогут бесплатно протестировать модель в демо-режиме.
Она доступна через API в Yandex Cloud. Эта облегчённая модель подойдёт для приложений, в которых важна скорость ответа. Так, её можно использовать в чат-ботах, для проверки орфографии или анализа данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
Теперь можно общаться с языковой моделью бесплатно прямо в мессенджере. Однако есть ограничение — не более 30 запросов в день.
Пока Copilot может:
Чтобы воспользоваться ботом, нужно отправить ему свой номер телефона.
Please open Telegram to view this post
VIEW IN TELEGRAM
У нас вышла новая статья на
Ниже — небольшая выдержка из статьи, а целиком читайте здесь 👈
🛠 Инструменты
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Если вам сегодня грустно, послушайте, как отлично ChatGPT справляется с запросом «повтори букву "е" тысячу раз» ⤴️
Please open Telegram to view this post
VIEW IN TELEGRAM