Градиент обреченный
7.97K subscribers
834 photos
20 videos
8 files
454 links
Download Telegram
🔺 По агентам

Пара ссылок с паттернами использования


🔸 https://www.anthropic.com/engineering/building-effective-agents
🔸 https://github.com/openai/openai-agents-python/tree/main/examples/agent_patterns

Основной совет тут — не использовать агенты, если можно их не использовать. Например, если есть четкий пайплайн, а неопределенности разрешаются эвристиками.

Если необходимость есть, то почитайте, какие сейчас самые распространенные практики и фреймворки.

OpenAI вчера обновили API и выложили библиотеку для построения агентных систем:

🔸 https://github.com/openai/openai-agents-python
🔸 https://platform.openai.com/docs/guides/agents

Пока там все то же самое, что в других подобных SDK, но есть примеры и уже 2k звезд.

Поиск, ещё поиск и Operator

Так же, наконец-то в API появился web search (модель gpt-4o-search-preview) и computer use (модель computer-use-preview). Если в последнюю отправить скриншот экрана и инструкцию, то она будет возвращать вам действия типа click(x,y) или type(text). Оборачиваете это в цикл и получаете автоматизированного работника, есть пример.

File search. Искать теперь можно и по своим файлам. Есть ограничения — до 100Gb в сумме и 10k файлов по количеству. Загружать можно код, pdf, doc'и и презы. Все это векторизируется и параметр vector_store_ids затем можно использовать при использовании агента file_search.

Он будет искать в вашем хранилище релевантные фрагменты и строить на их основе свой ответ.
👍18🔥62
LLM и черные дыры

Игрался тут на выходных — просил разные модели сгенерировать код для отрисовки черной дыры с аккреционным диском как в Интерстелларе.

Была надежда, что получится, потому что, во-первых, есть статья с кучей формул — Gravitational Lensing by Spinning Black Holes, где в соавторах указан Кип Торн, делавший расчеты для фильма (даже книгу про это написал). Во-вторых, есть клевое видео, где человек делится своей версией подобной трассировки и выкладывает упрощенную версию кода.

В итоге ничего похожего не получилось. DeepResearch'и, рассуждения и подкладывание дополнительных материалов в контекст не помогли. Хотя может я все делал не правильно и у вас получится. Если так, то поделитесь.

P.S. Некоторые модели писали очень изощренный код, который минут за 30 рисовал квадрат Малевича.
😁247👍4👀21
Когда правописание («е» или «и») решает
😁75🔥632
🔺 GigaChat 2

Друзья, день релиза! Сегодня потихоньку выкатываем новую версию Гигачата. В API он уже доступен, также его можно попробовать в разделе Playground в консоли.

Про улучшения коллеги написали на Хабре. Из прикольного там, например, то, как у ребят получилось приручить DPO, финальный этап обучения, на котором мы пытаемся увеличить вероятность качественного ответа.

Персонажность тоже улучшили, как и вызов функций (появились множественные вызовы) и работу с кодом.

Стало ощутимо лучше, коллеги молодцы.

В обычный чат, думаю, тоже скоро доедет. Пока можете потыкать в API (ключик мой личный, там еще есть немного токенов) и в своем ЛК.

👉 Upd. Токены закончились 💪

#pip install gigachat

from gigachat import GigaChat
from gigachat.models import Chat, Messages, MessagesRole

key = "………"

payload = Chat(
messages=[Messages(
role=MessagesRole.SYSTEM,
content="Отвечай как пришелец с Венеры"
)],
temperature=0.8,
max_tokens=100,
)

with GigaChat(credentials=key, verify_ssl_certs=False, model="GigaChat-2-Max") as giga:
query = "Как у вас там дела?"
payload.messages.append(Messages(role=MessagesRole.USER, content=query))
response = giga.chat(payload)

print(response.choices[0].message.content)


👉 Хабр | Playground | GitHub
🔥246🎉4👍2👀2🤯1💅1😎1
🔺 Атлас HuggingFace

Прикольная визуализация всех моделек с HF в виде вот таких цветочков. В центре базовая модель, а на лепестках ее файнтюны.

Больше всего, конечно, llama и картиночных моделей типа FLUX и SD.

👉 https://huggingface.co/spaces/Eliahu/Model-Atlas
👍2912🔥7🆒3
Выступил на семинаре Института Языкознания (запись будет позже на сайте ИЯ). Аудитория серьезная, записи предыдущих докладов можно посмотреть тут. В прошлый раз, кстати, были интересные рассказы про машинный перевод и цифровизацию башкирского.

Из полезного подготовил пару блокнотов для работы с данными:

Исправление проблем со смешанной кодировкой для обработки текстовых PDF
Извлечение параллельного корпуса при помощи lingtrain-aligner
👍20🔥1271
На HF Daily papers за март было почти 600 статей (!), весна...

В прошлом году автоматизировал для сообщества страничку — hfday.ru, на ней можно посмотреть краткие содержания статей и отфильтровать по категориям, удобно искать какие-то конкретные темы.

Я и сам про эту страничку иногда забываю, но народ, судя по логам, пользуется. Так что напоминаю тем, кто еще не видел и себе тоже.

Парсится и генерится все скриптами, развернуто на процессах GitHub'а, дневные странички обновляются каждые пару часов.

👉 А код тут https://github.com/averkij/top_papers
5🔥28👍851
❤️ Друзья, а ведь нас с вами в канале уже 7000 человек (и немножко кремниевых мешочков). Число немаленькое — раз в 10 больше населения Ватикана и даже больше чем в моем родном поселке.

Всех приветствую! Будем и дальше обсуждать и делать интересные проекты на тему ИИ, изучения языков и программирования.

P.S. Плакат нарисовал в на днях обновившемся Ideogram'е, он стал постабильней работать с генерацией кириллических надписей (и вообще стал сильно круче, попробуйте). В gpt-4o, кстати, также обновилась генерация по тексту, попробуем и его.
Please open Telegram to view this post
VIEW IN TELEGRAM
27👍14🔥10🎉3🤝2
Потестировал вчера Ideogram и gpt-4o и вот что скажу — качество очень прилично подросло за последние несколько месяцев. Если вам в работе и хобби надо делать какие-то прототипы дизайнов и картинок, то надо обязательно использовать (если еще не).

Порисовал обложки для книг. За час получилось несколько десятков веселых обложек. Можно делать так: любой LLM с web-поиском генерируете промпт для генерации картинок (я вбивал в perplexity), что-нибудь типа такого:

"Найди информацию о книге Стругацких "Улитка на склоне". В выводе напиши только промпт для генерации изображения для обложки этой книги. На обложке должна быть яркая сцена из книги, название и имя автора на русском, промпт должен быть на английском. Стиль укиё-э."


Так как есть поиск, то книгу можно задавать любую, которую можно найти в интернете. Полученный промпт уже можно использовать.

gtp-4o работает с русскими надписями гораздо стабильней, хотя тоже ошибается. Самое частое у них — это либо удвоить какую-нибудь букву, либо написать одну вместо удвоенной (либо написать кракозябры). Причем, если просить не писать надписей вообще (чтобы самому дописать в иллюстраторе), то получается как-будто бы похуже. Ideogram делает более разнообразные картинки, быстрей (секунд за 20) и сразу по 4 штуки. Кроме того, на платных подписках там есть редактор с всем типичным функционалом типа inpainting'а, outpainting'а, создания стиля по своим картинкам и т.д. Как специализированный инструмент он кажется получше.

👉 Еще нащупал лайфхак. Если к надписям в полученном промпте добавлять что-то типа "label is in Russian, reads exactly as '...' " и писать не капсом, то процент правильных надписей получается выше.

В общем надо тестить еще и, наверное, накидать пет-проект для end-2-end генерации.
28🔥13👍4🆒2