Як краще створювати код за допомогою LLM
29 subscribers
43 photos
178 links
Корисні поради, приклади, інструкції та інші матеріали на тему LLM, які допоможуть вам у програмуванні.

https://aicode.danvoronov.com/

З приводу онлайн чи офлайн (Київ) лекцій - @dan_voronov
Download Telegram
https://mistral.ai/news/codestral-2501/

Компанія Mistral AI представила оновлену модель Codestral 25.01, яка покращує швидкість та точність генерації коду, особливо у задачах "заповнення пропусків" (fill-in-the-middle, FIM).

Дійсно швидко генерує. Чомусь модель стала гірше у Java, але додала % HumanEval у Python / С++ / Javascript

Перевірити можна через Continue.dev чи по openai сумісному АПІ (модель codestral-latest) - ключ у консолі

Модель в консолі поки що не відображається в розділі лімітів, швидше за все зараз тестовий період.

VS code - Cline [3.1.9] & Roo Cline [3.1.6]
- Add Mistral API provider with codestral-latest model

#newllmmodel
👍2
https://api-docs.deepseek.com/news/news250120

DeepSeek-R1

Китайський стартап DeepSeek продовжує нас радувати дешевими клонами. Ось вони й добралися до openai о1.

Через API, якщо використовувати (прямо чи через openrouter), треба платити - підійде вже згенерований ключ, просто треба змінити модель на deepseek-reasoner. Коштує у 4 рази дешевше, ніж o1.

Зараз в Cline та Aider немає її у списку - чекаємо на апдейти. Але вже можна через OpenRouter прокинути свій апі ключ DeepSeek, чи заплатити їм.

Через веб-інтерфейс та їхню нову програму для телефонів можна використовувати безкоштовно. Кэнвас/Артефактс поки що не скопіювали.

#newllmmodel
1
OpenAI агент Operator (новина на techcrunch) через гугул ШІ Google AI Studio та Репліт может створити сайт =)

X

#newllmmodel
https://www.cursor.com/changelog

Cursor

DeepSeek моделі: DeepSeek R1 та DeepSeek v3 підтримуються у версіях 0.45 та 0.44. Ви можете увімкнути їх у Settings > Models. Ми хостимо ці моделі в США.

Але composer (автоматична система написання коду) все одно підтримує наразі тільки застарілі GPT-4o чи Claude-3.5. У чаті з r1 тег <think> не є прихованим блоком.

#cursor #newllmmodel