Заметки LLM-энтузиаста
518 subscribers
144 photos
17 videos
1 file
175 links
Дмитрий Жечков @djdim
архитектор в Yandex Cloud,
ex. VMware NSX specialist, ex. Cisco SE

Здесь пишу свои заметки по LLM (большим языковым моделям) и AI-разработке.

Это личное мнение и не отражает официальную позицию компании, в которой я работаю.
Download Telegram
#y23w31 #ai #news

Главные Tech и AI-новости за неделю

1. OpenAI подали заявку на патент GPT-5. Там будет встроенный синтез и распознавание речи и многое другое (ссылка)

2. Сергей Брин возвращается в Google для работы над AI-системой Gemini (ссылка)

3. ИИ в метро Нью-Йорка. Ловит безбилетников и нарушителей (ссылка)

4. Минобороны США финансирует исследования по объединению клеток человеческого мозга с ИИ. (ссылка)

5. Benesse предлагает AI-сервис для помощи детям в исследовательских проектах (ссылка)

6. Bing Chat теперь доступен в браузерах Chrome и Safari (ссылка)

7. ИИ-персонажи в видеоиграх. Replica Studios предлагает голосовых актеров на основе искусственного интеллекта для игр, фильмов и анимации (ссылка)

8. CEO OpenAI Сэм Альтман запускает Worldcoin: смелый крипто-эксперимент на стыке ИИ, идентификации и блокчейна. Криптоэнтузиасты, не расходимся! (ссылка)

9. Первый ИИ в качестве генерального директора в Европе (ссылка)

10. Япония в гонке AI: делают новый суперкомпьютер (ссылка)

11. Netflix ставит на AI, в то время как сценаристы бастуют против искусственного интеллекта (ссылка)

12. Stability AI представляет SDXL 1.0, лучшую открытую модель для генерации изображений
(ссылка)

13. Тепловая визуализация на базе ИИ обеспечивает дневную видимость ночью
(ссылка)

14. ChatGPT разрабатывает новый микрочип всего за 100 минут
(ссылка)

15. LinkedIn тестирует новый инструмент искусственного интеллекта под названием LinkedIn Coach, предназначенный для упрощения поиска работы (ссылка)

16. Университеты говорят, что ИИ невозможно победить, отказываясь от попыток заблокировать ИИ (ссылка)

17. Hugging Face, GitHub и другие объединяются для защиты открытого исходного кода в законодательстве ЕС об искусственном интеллекте (ссылка)

18. Stack Overflow, крупнейший в мире веб-сайт вопросов и ответов для программистов, объявил о «будущем Stack Overflow» — OverflowAI. Если помните, их посещаемость стала сильно проседать после появления ChatGPT. (ссылка) - внедрили LLM разработку в свой сайт

Новости предоставлены порталом https://tweekly.ru/
🔥1
#y23w31d5 #ai #news

5 ключевых выводов из отчета McKinsey "Состояние ИИ в 2023 году":

1. Ожидаемые перебои в работе бизнеса значительны.
"Респонденты прогнозируют значительные изменения в своих трудовых коллективах. Они ожидают сокращения штата в некоторых областях и значительных усилий по переквалификации для удовлетворения меняющихся потребностей в талантах".

2. Наиболее распространенные варианты использования - маркетинг и продажи, разработка продуктов и услуг, а также сервисные операции.

3. Отрасли, в которых в наибольшей степени используется работа, основанная на знаниях, скорее всего, испытают наибольшие потрясения.
"Значительное влияние может быть оказано на такие отрасли, основанные на знаниях, как банковское дело (до 5%), фармацевтика и медицинская продукция (также до 5%) и образование (до 4%)".

4. Неточности, кибербезопасность и нарушение прав интеллектуальной собственности - самые большие риски

5. Операции машинного обучения, вероятно, будут играть большую роль в будущем.
"Специалисты, добившиеся высоких результатов в области ИИ, чаще всего указывают на модели и инструменты, такие как мониторинг производительности моделей в производстве и переобучение моделей по мере необходимости с течением времени, как на свою главную задачу".

Полный текст отчета здесь: https://www.mckinsey.com/capabilities/quantumblack/our-insights/the-state-of-ai-in-2023-generative-ais-breakout-year
1
#yandexgpt #apps #library

Сделал публичную версию небольшой библиотеки LLM-приложений на базе yandexGPT

Для "коробочных" демонстрационных приложений вводить "креды" для доступа к приложению не нужно - работает на моих.
Для остальных приложений - нужно использовать свои "креды": folder-id и yandexGPT api-key
Как и откуда их взять - описал здесь
2🔥1👏1
#yandexgpt #obsidian #plugins

Теперь можно использовать yandexgpt при работе со своими заметками в Obsidian при помощи следующих AI-плагинов:

- Text Generator
- Сopilot
- Copilot Auto Completion

Записал короткий ролик (3 мин) с одним из сценариев
https://ooo.mmhmm.app/watch/z_cK9h88fzj3RpkQ8EVWqz

Все это возможно благодаря openai-to-yandexgpt api-транслятору, который можно скачать и запустить по ссылке

Теперь практически любые приложения, которые допускают настройку LLM в виде openai api совместимого end point, можно использовать совместно с yandexgpt
👍2🔥2💯1
#yandexgpt #obsidian #plugins

Чуть более подробная информация

Obsidian Text Generator (помощник в составлении заметок)
- работает с yandexgpt при использовании api-транслятора "из коробки"
- не требует изменения кода плагина
- берется из community plugin
- исправляются параметры плагина в самом Obsidian (api-ключ, api-endpoint, название модели)
- в Advanced настройках надо включить CORS bypass
- как пользоваться https://www.youtube.com/watch?v=OergqWCdFKc
- позволяет генерировать текст с разными промптами прямо в заметках

Obsidian Сopilot
(ИИ-секретарь по заметкам)
- работает с yandexgpt при использовании api-транслятора "из коробки"
- не требует изменения кода плагина
- берется из community plugin
- исправляются параметры плагина в самом Obsidian (api-ключ, api-endpoint, название модели для LLM и embeddings)
- в настройках надо включить CORS bypass
- позволяет отвечать на вопросы по заметкам в режиме чата. На данный момент можно выбрать заметку, по которой хотелось бы получить ответы и пообщаться с ИИ-секретарем.
🔥3👍1
#yandexart #new

Сморите какие няшные картинки стал генерировать новый yandexART!

И что еще круто - с правильными надписями на английском языке!

Теперь можно делать шикарные открытки с поздравлениями в одном промпте :)

Вот, кстати, промпт под данную генерацию
Подарочная открытка с изображением корги в стиле Pixar на лаймовом фоне, держит в лапках букет цветов.
Вставь текст "Happy Birthday!"


Я использовал библиотеку промптов YandexART
🔥43
#info #lidar

Вот примерно так нас видят роботы-доставщики Яндекса :)
🔥3👍2😁1
#ai #florist #app

Приложение "AI-флорист" на базе YandexGPT/YandexART, которое генерирует букеты для разных людей и под разные события

Пример работы приложения на скриншоте.

Все изображения букетов можно скачать.
Промпты для генерации букетов можно редактировать.

Приложение хорошо работает как на ПК, так и на мобильных устройствах.
Но требует ввести креды, для YandexGPT/YandexART

Добавил данное приложение в библиотеку публичных приложений для тестирования YandexGPT/YandexART

Код приложения в открытом доступе здесь
👍21🔥1
Media is too big
VIEW IN TELEGRAM
Коллеги записали видео-ролик как пользоваться AI-флористом :)
🔥31
#новыйгод

Один из моих коллег написал телеграмм бота для генерации новогодних открыток при помощи YandexART 2.0

Исходники здесь https://github.com/shwars/yartbot

С Наступающим Новым Годом!
3🎉2
#cursor #ai #programming #dashboard

Закончился наш курс по AI-программированию

Я свел весь набор проектов, который мы сделали и подробно разобрали на курсе, на одну страничку (везде есть ссылки на исходный код)

Кому интересно - исходники этого дашборда здесь
👍42🔥1
#ui #web #ux #examples #ai #dev

Недавно я наткнулся на новый бесплатный ресурс, который, на мой взгляд, очень ценен!

https://21st.dev/

Он содержит более 730 готовых к работе компонентов пользовательского интерфейса от более чем 50 ведущих инженеров-проектировщиков.
Можно бесплатно брать и использовать все, что хочешь.
Запущен 9 января 2025 года - очень свежий!

Здесь оригинальный анонс

Что очень круто он уже оптимизирован для популярных ИИ-редакторов программного кода, таких как
- lovable.dev
- bolt.new
- v0.dev от vercel
с индивидуальными подсказками для легкой интеграции

Алгоритм работы с ним очень прост:
1) Выбирается понравившийся компонент интерфейса
2) Копируется информация о том, как его установить и промпт для выбранного ИИ-помощника
3) Затем повторяем компонент в своем коде
см. скришоты
11👍1🔥1
#openai #news #agents #operator

Что произошло?
Опенаи вчера анонсировали своего первого агента под названием Operator.

Зачем это нужно?

Оператор - это что-то вроде виртуального ИИ-консъержа, может решать задачи по планированию поездки, бронированию номеров в гостинице, столика в ресторане, покупке продуктов по рукописному списку и т.д.

Как работает?
Все это он делает через закрытую "песочницу" с браузером, в котором вводит необходимые команды поиска и работает с выбранными при постановке задаче инструментами. То есть, даже если у выбранного сайта (например, по заказу продуктов) нет API-интерфейса, он просто воспользуется им как обычный пользователь и решит поставленную задачу.
Подробнее здесь: https://help.openai.com/en/articles/10421097-operator

Как потестировать?

Оператор доступен по ссылке https://operator.chatgpt.com/
Сейчас 2 условия для доступа:
- регион USA (поэтому VPN нужно подобрать соответствующий)
- подписка ChatGPT Pro. Это более существенное ограничение, т.к. стоит $200 в месяц (https://chatgpt.com/#pricing)

Планы на будущее?
В анонсе говорят, что планируют:
- расширять линейку инструментов Оператора
- добавлять новых агентов
- расширять список регионов, в которых доступен Оператор
- через какое-то время сделать Оператора доступным для тех, у кого подписка ChatGPT Plus (за $20 в месяц)

Есть ли что-то похожее?
Да. Опенаи не первые, кто делает агентов, использующих веб-браузер для решения поставленных задач.
2🔥2👍1
#news #vercel #agents #operator #free

Бесплатный Open Operator от Vercel - теперь не надо платить $200 в месяц за данную функциональность, как это предлагает нам сделать Openai :)

https://open-operator.vercel.app

Vercel только что выпустила Open Operator, и я его протестировал
Основные функции:
- Поддержка web scraping
- Поддержка автоматической публикации задач
- Поддержка самостоятельного управления браузером, в котором происходит поиск
🎉3👍1🔥1
#info #nvda

Шикарный лонг-рид про то:
- Почему NVIDIA стоит таких денег, их ключевые преимущества
- Новые угрозы, основанные на последних разработках, особенно на развитии моделей рассуждений с новым законом масштабирования (deepseek как пример);

TLDR - Deepseek показал, что аппаратных ресурсов для инференса и обучения моделей нужно меньше, появляются новые разработки в области "железа" такие как гигантские чипы Cerebras, разработка tpu-процессоров google и groq, улучшенные драйверы для AMD от команды Джорджа Хотца

В общем, интересный short case для NVDA
Судя по пре-маркету, котировки NVDA сегодня откроются мощным гэп-дауном
👍3🤔1
Newwhitepaper_Agents2.pdf
4.1 MB
#info #ai #agents #google #whitepaper

Google недавно опубликовали отличный обзорный материал по ИИ-агентам (см. вложенный файл).

ИИ-агенты принципиально отличаются от стандартных языковых моделей по трем ключевым параметрам:

1) Они комбинируют возможности больших языковых моделей с инструментами реального мира и уровнем оркестрации, который управляет сложными рассуждениями. Это позволяет им как обрабатывать информацию, так и выполнять какие-то полезные действия.

2) В отличие от традиционных моделей, которые могут ссылаться только на данные, на которых их обучали, агенты могут получать доступ к новой актуальной информации через:

- Расширения: Прямые соединения с внешними API
- Функции: Возможности выполнения кода/алгоритмов на стороне клиента
- Хранилища данных: Доступ к базам данных и внешним знаниям

3) Они используют сложные алгоритмы рассуждений (например, ReAct и Chain-of-Thought) для планирования и выполнения многоэтапных задач, подобно тому, как повар планирует и корректирует процесс приготовления сложного блюда.

В документе подчеркивается важное техническое различие между тем, что выдает модель (model outputs) на выходе и тем, что выдает агент в результате выполнения им поставленной задачи (agent execution). В то время как модель может генерировать ответы только на основе своего обучения, агент может проверять информацию, выполнять вызовы API и взаимодействовать с внешними системами для обеспечения точности и актуальности своих ответов.

Заглядывая в будущее, авторы предполагают, что «цепочка агентов» ("agent chaining") - объединение специализированных агентов для выполнения различных задач - может значительно расширить возможности ИИ.
Однако они также подчеркивают, что создание по-настоящему эффективно работающих полезных агентов требует тщательного итерационного подхода и оптимизации под конкретную область.

В общем, судя по всему, 2025 год будет годом "вертикальных" ИИ-агентов.
2👍1
#deepseek #cursor #news

Что произошло?
Модели deepseek-v3 (аналог claude-3-5-sonnet) и deepseek-r1 (аналог o1) стали доступны в Cursor нативно, а не только через добавление их как openai-like моделей по инструкции от конца прошлого года.

Как включить и пользоваться?
Нужно просто включить их в разделе Settings - см. скриншот
И далее можно использовать даже в Cursor-агенте через Composer

Что круто?
- Cursor подтвердили, что используют самую большую Deepseek R1 модель
DeepSeek R1 model with 671B parameters. пруф здесь

Что не круто?
- Cursor агент пока не поддерживает работу с моделями deepseek-r1 и deepseek-v3
При работе со сложными проектами лучше всего использовать Сursor агент в Composer.
С Deepseek эта опция, к сожалению, пока не доступна. Придется использовать claude-3-5-sonnet модель от anthropic как обычно.
- deepseek-v3 не работает с изображениями, поэтому при траблшутинге, когда надо сослаться на скрин веб-интерфейса как и ранее продолжаем использовать claude-3-5-sonnet модель от anthropic

На что надо обратить внимание?
- deepseek-v3 - не будет "съедать" лимиты по премиальным запросам, т.к. считается не премиальной моделью
- А вот deepseek-r1 считается премиальной моделью, поэтому нужно следить за количеством премиальных запросов (на Pro-тарифе их 500). Но следить не так сильно как за количеством запросов к o1- модели (которых на Pro-тарифе всего 10)

Вот цитата с форума Cursor, подтверждающая данный тезис:
DeepSeek v3 is a non-premium model, so is unlimited to use, but R1 is premium currently, so will count towards your usage.

Ссылка на тарифы и условия здесь
🔥21🎉1