Як краще створювати код за допомогою LLM
29 subscribers
38 photos
171 links
Корисні поради, приклади, інструкції та інші матеріали на тему LLM, які допоможуть вам у програмуванні.

https://aicode.danvoronov.com/

З приводу онлайн чи офлайн (Київ) лекцій - @dan_voronov
Download Telegram
"12 днів" OpenAI — день 4

Canvas у ChatGPT тепер для всіх та навчився виконувати Python код

https://www.youtube.com/watch?v=qZ0ImE41pVs

Конкурента функція Anthropic’s Claude Artifacts вже давно вмів навіть React компоненти виводити, але останім часом в них великі проблеми з наватаженням та вони вимикають багато чого для безкоштовних юзерів
В оновленні Gemini 2.0 Flash є Jules та Colab Data Science Agent.

url

Jules — це експериментальний агент на основі штучного інтелекту, який може виконувати завдання з розробки коду, зокрема виправлення багів, написання нових функцій та створення pull-реквестів.
[поки ще недоступний]

Colab Data Science Agent — асистент для аналізу даних. Цей інструмент створений для автоматизації роботи з даними. Він допомагає швидко отримати інсайти, створюючи робочі Colab-ноутбуки на основі запитів.
Windsurf
https://codeium.com/windsurf

як конкурент Cursor (при запуску ще й може з нього забрати налаштування). У базі це все той же VSC, тому інтерфейс сильно вивчати не треба.

Треба акканут на codeium це мінус. Моделі три - за гроші GPT 4o та Claude 3.5 Sonnet, безкоштовно Cascade Base (це схоже Llama 3 70B). Я шукаю що буде працювати на моїх API-ключах, і тут немає такого варіанту, на жаль.

Калькулятор html мені створило, але кнопка "=" чомусь в середіні.

Автор відео наводить аналогію з автомобілем 2015 року - "Tartan Prancer" (Honda з Албанії), щоб проілюструвати, що Windsurf створює враження чудового інструменту, але в реальності він недопрацьований. Він порівнює це з колегами на роботі, які постійно все переробляють. ШІ тут постійно переписує код багатьох файлів, через що доводиться перевіряти все постійно, а це схоже на початок спочатку.
Приклади, де й як задавати контекст проекту для ШІ
- VSC Copilot
- Cursor .cursorrules
- Windsurf .windsurfrules

Сюди додаємо стиль коду, техстек, та структуру проекту + прояснюємо для моделі ті моменти, де у нас система генерації часто помиляєтся — чим меньш тут написано, тим краще

https://youtu.be/aG-utUqVrb0

Автор відео хотів б що це працювало як memGPT тобто чати самі розуміли що треба туда дописувати
Chatbot Arena додала WebDev Arena: web.lmarena.ai - ШІ-битва по дві моделі, щоб знайти що генерує найкращий UI

Моделі: Claude 3.5 Sonnet (20241022), Gemini-Exp-1206, GPT-4o-2024-11-20, Gemini-2.0-Flash-Exp, Qwen2.5-Coder-32B-Instruct та Gemini-1.5-Pro-002.
Github надіслав мені листа про те, що в Copilot з'явилося безкоштовне використання із такими обмеженнями:

2к доповнень коду, 50 чат-повідомлень / місяць
👾1
Цікава думка тут у коментарі:

З розвитком штучного інтелекту в програмуванні ціна на (просте) програмне забезпечення прямує до нуля! Іноді, набагато швидше самому "накодити" потрібну тобі функцію чи утиліту, ніж шукати щось готове.

Раніше розробка навіть невеликої програми вимагала значних зусиль і часу. Тепер же, з допомогою інструментів на базі ШІ процес створення власного софту стає швидким й простим.

Тобто до того часу коли все стане ШІ, а софт зникне буде щось перехідне й це коли хто вміє буде робити собі свої программи, а не використовувати чужі.
😱1
Курсор чітщіт

Символи @:

Посилання на файл: @filename - дає змогу посилатися на певний файл.
Посилання на функцію: @functionName - посилається на функцію в коді.
Посилання на змінну: @variableName - посилається на змінну.

Пошук у кодовій базі: @codebase query - шукає у кодовій базі.
Пошук в інтернеті: @web query - виконує пошук в інтернеті.
🤩1
LLM від Google нарешті щось можут робити

Зараз Gemini 2.0 Flash як експеремент є безкоштовною для використання через Google AI Studio та API. Має велике контекстне вікно - 2 мільйони токенів (це на віхд). 😲

Моделі від Google можна підключити через API в налаштуваннях Cursor (вкладка "Моделі"), але автопатчінг з чату зникає і вимагає Pro-версії, як на мене, це жлобство.

А у цьому відео про те, як використовувати Gemini 2.0 Flash за допомогою інструментів Aider (під термінал) та Cline під VSC. 💻

- демонструє, як встановити та налаштувати ці інструменти. Розповідає про обмеження через API. ⚙️
- зазначає, що Gemini 2.0 Flash працює дуже швидко та має відмінні можливості виклику функцій. ⚡️

На лідерборді Aider вона звісно відстає від топ моделей, але за них треба платити та й це модель серії Flash тобто спрощенної.
🤩1
Відео демонструє Cursor Composer Agent

Композер у Cursor - це інструмент, що дозволяє ШІ створювати цілі застосунки за вказівками. Він значно пришвидшує розробку, автоматизуючи створення файлів, коду, команд у терміналі. Це може бути особливо корисно, якщо ти хочеш швидко створити прототип або уникнути рутинної роботи.

Це не можна використовувати зі своїм API ключем, треба платити за Cursor Pro. Some Cursor features (like Tab Completion, Apply from Chat, and Composer) require specialized models and won’t work with custom API keys
1
reddit

Жоден з них (ШІ помічників) не є ідеальним... у всіх є певні недоліки.

Для мене Windsurf є найкращим і найнадійнішим для редагування кількох файлів, без сумніву. Здається, він просто краще розуміє контекст. Але йому потрібне доопрацювання та деякі функції.

Cursor найкраще продуманий та має найкраще автодоповнення. Але їхній composer залишає бажати кращого.

Aider має кілька справді крутих функцій, і, на мою думку, має найкращу функціональність diff редагування.

Cline безкоштовний (є варіант) і працює доволі добре.

Continue.dev безкоштовний і чудово підходить для автодоповнення через безкоштовний API codestral FIM.
1
Roo-Cline - форк Cline (prev. Claude Dev)
github

Додані експериментальні функції:

Перетягування зображень у чати
Звукові ефекти для зворотного зв'язку
Швидке копіювання запитів з історії
Включає поточний час у системний запит
Використовує спостерігач файлової системи для більш надійного спостереження за змінами файлової системи
Автоматичне затвердження MCP для кожного інструменту
Увімкнення/вимкнення серверів MCP
Налаштовувальна затримка після автоматичного запису для дозволу діагностики виявляти потенційні проблеми
та інш

Працює поряд з оригінальним Cline
🤩1
Китай такий Китай
😁1🤓1
Два тижні тому вийшла версія три VSC плагіна Cline (prev. Claude Dev). Він як Composer у Cursor чи Cascade у Windsurf але не залочен на приватні підписки.

https://open-vsx.org/extension/saoudrizwan/claude-dev

Дві дуже приємні функції:

- Auto-approve – тепер для програмування навіть не треба натискати щоразу кнопку ;), можна відправити агента у фон і увімкнути нотифікації, коли треба.

Токени, звичайно ж, споживає якневсебе і іноді зациклюється.

- .clinerulesяк я вже писав, таке є і в Cursor, і у Windsurf – це файл у корені проєкту з кастомною інструкцією, куди можна виписати техстек, структуру БД, зовнішні API та інше, щоб агент не плутався.

Проблема, звичайно ж, у тому, що тепер кожен апп називає цей файл як хоче (cursorrules, windsurfrules) і не домовилися до стандару.

форк Roo-Cline досі на v2
👾1
Aider LLM Leaderboards

https://aider.chat/docs/leaderboards/

Polyglot тест вимірює здатність LLM програмувати популярними мовами.

Aider найкраще працює з LLM, які добре вміють редагувати код, а не просто добре генерують код. Щоб оцінити навички редагування LLM, Aider використовує тести, які оцінюють здатність моделі послідовно дотримуватися системних підказок, щоб успішно редагувати код.


На початку 2025 року несподівано китайський DeepSeek V3 (671B MoE) дуже добре себе показує. Зараз ще у них знижки до 8 лютого на токени, ну і ціна $0.14/M input $0.28/M output [але контекстне вікно зарізане] (можна купувати на openrouter) ні в яке порівняння з о1 та claude-3.5-sonnet не йде.
🤩2
https://nmn.gl/blog/ai-senior-developer
та з коментів https://nmn.gl/blog/hn-rank-1-analysis

Аналізатор коду, аналізуючи лінійно, часто застрягав у деталях. Щоб покращити аналіз, ми змінили підхід, моделюючи спосіб мислення (Mindset) досвідчених розробників:

📝 Групування файлів: файли згруповані за функціональністю (наприклад, "аутентифікація", "база даних").

ℹ️ Контекст: додаєтся опис про функціональність групи в рамках всієї архетектури перед аналізом коду. Аналіз впливу: розглядати зміни відносно усієї системи

🕰 Історичне розуміння: відстежувати, чому код розвивався певним чином

промт до группи
    Analyzing authentication system files:
- Core token validation logic
- Session management
- Related middleware

Focus on:
1. How these integrate with existing auth patterns
2. Security implications
3. Performance impact on other systems

Files to analyze:
${formatFiles(group.files)}


Результатом стало покращення якості розуміння, від простих спостережень до виявлення потенційних проблем, як-от конфлікти та зв'язки між компонентами.
👨‍💻1
5ки вийшли... чекаємо тестів, як на цьому буде бігати Llama-3.3-70b-specdec
1
AiDE забезпечує структурований підхід до розробки проектів із допомогою штучного інтелекту. Framework пропронує стандартизований спосіб розуміння штучним інтелектом контексту вашого проекту та ведення документації.

https://github.com/FixingPixels/AiDE

є кастомний GPT