Заметки LLM-энтузиаста
518 subscribers
144 photos
17 videos
1 file
175 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
Всем привет! Первый пост на этом канале. И сразу ДВЕ отличные новости.

Новость N1.

#meta #llama2 #news
Компания Meta только что выпустила достойного конкурента ChatGPT с открытым исходным кодом, который защищает конфиденциальность данных пользователей

Речь идет об LLM модели Llama 2.

Вот некоторые из ее отличительных характеристик:
- Доступна для коммерческого использования
- Предварительно обучена на 2Т токенов
- Сильные оценки MMLU (т.е. сильная аргументация)
- 4K контекстное окно
- Близка к GPT-3.5 по производительности решения задач, которые требуют рассуждений

Полезные ссылки для дальнейшего изучения:
веб-сайт: https://ai.meta.com/llama/
huggingface: https://lnkd.in/dZ58EWVy
🔥1
Новость N2.

#langchain #langsmith #news

Компания Langchain выпустила LangSmith - платформу для отладки, тестирования и мониторинга LLM-приложений в промышленных инсталляциях

Этот шаг стал быстрым ответом на основные жалобы разработчиков, в том числе:
* Понимание того, что именно представляет собой финальный запрос на вызов LLM (после всего форматирования шаблона запроса этот финальный запрос может быть длинным и запутанным)
* Понимание того, что именно возвращается из вызова LLM на каждом шаге (до пост-обработки или какого-либо преобразования)
* Понимание точной последовательности обращений к LLM (или другим ресурсам), а также того, как они связаны между собой
* Отслеживание использования токенов
* Управление затратами
* Отслеживание (и отладка) задержек
* Отсутствие хорошего набора данных для оценки приложения
* Отсутствие хороших метрик для оценки приложения
* Понимание того, как пользователи взаимодействуют с продуктом.

Подробнее можно прочитать здесь: https://blog.langchain.dev/announcing-langsmith/
🔥1
1) Классный поисковик с рейтингами по плагинам GPT-4 https://plugin.surf

2) OpenAI выпустил руководство о том, как использовать свои модели GPT-4 и Whisper для расшифровки и обобщения протоколов совещаний. Meeting minutes - OpenAI API
https://platform.openai.com/docs/tutorials/meeting-minutes
🔥1
#langchain #llama2 #news

Вышел релиз LLaMA-2 с окном контекста 32k
https://together.ai/blog/llama-2-7b-32k
"Fine-tune the model for targeted, long-context tasks—such as multi-document understanding, summarization, and QA"
"Тонкая настройка модели для решения целевых задач с длинным контекстом, таких как работа с многодокументными текстами, обобщение и QA".
Похоже именно эта LLM модель сейчас самый лучший opensource вариант для решения задачи осмысленной работы с документами произвольной длины
🔥1
#y23w31 #ai #news

Главные Tech и AI-новости за неделю

1. OpenAI подали заявку на патент GPT-5. Там будет встроенный синтез и распознавание речи и многое другое (ссылка)

2. Сергей Брин возвращается в Google для работы над AI-системой Gemini (ссылка)

3. ИИ в метро Нью-Йорка. Ловит безбилетников и нарушителей (ссылка)

4. Минобороны США финансирует исследования по объединению клеток человеческого мозга с ИИ. (ссылка)

5. Benesse предлагает AI-сервис для помощи детям в исследовательских проектах (ссылка)

6. Bing Chat теперь доступен в браузерах Chrome и Safari (ссылка)

7. ИИ-персонажи в видеоиграх. Replica Studios предлагает голосовых актеров на основе искусственного интеллекта для игр, фильмов и анимации (ссылка)

8. CEO OpenAI Сэм Альтман запускает Worldcoin: смелый крипто-эксперимент на стыке ИИ, идентификации и блокчейна. Криптоэнтузиасты, не расходимся! (ссылка)

9. Первый ИИ в качестве генерального директора в Европе (ссылка)

10. Япония в гонке AI: делают новый суперкомпьютер (ссылка)

11. Netflix ставит на AI, в то время как сценаристы бастуют против искусственного интеллекта (ссылка)

12. Stability AI представляет SDXL 1.0, лучшую открытую модель для генерации изображений
(ссылка)

13. Тепловая визуализация на базе ИИ обеспечивает дневную видимость ночью
(ссылка)

14. ChatGPT разрабатывает новый микрочип всего за 100 минут
(ссылка)

15. LinkedIn тестирует новый инструмент искусственного интеллекта под названием LinkedIn Coach, предназначенный для упрощения поиска работы (ссылка)

16. Университеты говорят, что ИИ невозможно победить, отказываясь от попыток заблокировать ИИ (ссылка)

17. Hugging Face, GitHub и другие объединяются для защиты открытого исходного кода в законодательстве ЕС об искусственном интеллекте (ссылка)

18. Stack Overflow, крупнейший в мире веб-сайт вопросов и ответов для программистов, объявил о «будущем Stack Overflow» — OverflowAI. Если помните, их посещаемость стала сильно проседать после появления ChatGPT. (ссылка) - внедрили LLM разработку в свой сайт

Новости предоставлены порталом https://tweekly.ru/
🔥1
#y23w31d5 #ai #news

5 ключевых выводов из отчета McKinsey "Состояние ИИ в 2023 году":

1. Ожидаемые перебои в работе бизнеса значительны.
"Респонденты прогнозируют значительные изменения в своих трудовых коллективах. Они ожидают сокращения штата в некоторых областях и значительных усилий по переквалификации для удовлетворения меняющихся потребностей в талантах".

2. Наиболее распространенные варианты использования - маркетинг и продажи, разработка продуктов и услуг, а также сервисные операции.

3. Отрасли, в которых в наибольшей степени используется работа, основанная на знаниях, скорее всего, испытают наибольшие потрясения.
"Значительное влияние может быть оказано на такие отрасли, основанные на знаниях, как банковское дело (до 5%), фармацевтика и медицинская продукция (также до 5%) и образование (до 4%)".

4. Неточности, кибербезопасность и нарушение прав интеллектуальной собственности - самые большие риски

5. Операции машинного обучения, вероятно, будут играть большую роль в будущем.
"Специалисты, добившиеся высоких результатов в области ИИ, чаще всего указывают на модели и инструменты, такие как мониторинг производительности моделей в производстве и переобучение моделей по мере необходимости с течением времени, как на свою главную задачу".

Полный текст отчета здесь: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year
1
#yandexgpt #apps #library

Сделал публичную версию небольшой библиотеки LLM-приложений на базе yandexGPT

Для "коробочных" демонстрационных приложений вводить "креды" для доступа к приложению не нужно - работает на моих.
Для остальных приложений - нужно использовать свои "креды": folder-id и yandexGPT api-key
Как и откуда их взять - описал здесь
2🔥1👏1
#yandexgpt #obsidian #plugins

Теперь можно использовать yandexgpt при работе со своими заметками в Obsidian при помощи следующих AI-плагинов:

- Text Generator
- Сopilot
- Copilot Auto Completion

Записал короткий ролик (3 мин) с одним из сценариев
https://ooo.mmhmm.app/watch/z_cK9h88fzj3RpkQ8EVWqz

Все это возможно благодаря openai-to-yandexgpt api-транслятору, который можно скачать и запустить по ссылке

Теперь практически любые приложения, которые допускают настройку LLM в виде openai api совместимого end point, можно использовать совместно с yandexgpt
👍2🔥2💯1
#yandexgpt #obsidian #plugins

Чуть более подробная информация

Obsidian Text Generator (помощник в составлении заметок)
- работает с yandexgpt при использовании api-транслятора "из коробки"
- не требует изменения кода плагина
- берется из community plugin
- исправляются параметры плагина в самом Obsidian (api-ключ, api-endpoint, название модели)
- в Advanced настройках надо включить CORS bypass
- как пользоваться https://www.youtube.com/watch?v=OergqWCdFKc
- позволяет генерировать текст с разными промптами прямо в заметках

Obsidian Сopilot
(ИИ-секретарь по заметкам)
- работает с yandexgpt при использовании api-транслятора "из коробки"
- не требует изменения кода плагина
- берется из community plugin
- исправляются параметры плагина в самом Obsidian (api-ключ, api-endpoint, название модели для LLM и embeddings)
- в настройках надо включить CORS bypass
- позволяет отвечать на вопросы по заметкам в режиме чата. На данный момент можно выбрать заметку, по которой хотелось бы получить ответы и пообщаться с ИИ-секретарем.
🔥3👍1
#yandexart #new

Сморите какие няшные картинки стал генерировать новый yandexART!

И что еще круто - с правильными надписями на английском языке!

Теперь можно делать шикарные открытки с поздравлениями в одном промпте :)

Вот, кстати, промпт под данную генерацию
Подарочная открытка с изображением корги в стиле Pixar на лаймовом фоне, держит в лапках букет цветов.
Вставь текст "Happy Birthday!"


Я использовал библиотеку промптов YandexART
🔥43
#info #lidar

Вот примерно так нас видят роботы-доставщики Яндекса :)
🔥3👍2😁1
#ai #florist #app

Приложение "AI-флорист" на базе YandexGPT/YandexART, которое генерирует букеты для разных людей и под разные события

Пример работы приложения на скриншоте.

Все изображения букетов можно скачать.
Промпты для генерации букетов можно редактировать.

Приложение хорошо работает как на ПК, так и на мобильных устройствах.
Но требует ввести креды, для YandexGPT/YandexART

Добавил данное приложение в библиотеку публичных приложений для тестирования YandexGPT/YandexART

Код приложения в открытом доступе здесь
👍21🔥1
Media is too big
VIEW IN TELEGRAM
Коллеги записали видео-ролик как пользоваться AI-флористом :)
🔥31