Як краще створювати код за допомогою LLM
29 subscribers
38 photos
171 links
Корисні поради, приклади, інструкції та інші матеріали на тему LLM, які допоможуть вам у програмуванні.

https://aicode.danvoronov.com/

З приводу онлайн чи офлайн (Київ) лекцій - @dan_voronov
Download Telegram
Найближчим часом очікуємо кейсів программуваня з OpenAI o1 - стежу. Багато говорять, що буде вирішувати дуже складні завдання

також цікаво скільки буде коштувати геренація проектів після тестової стадії

https://www.youtube.com/watch?v=50W4YeQdnSg
👍1
https://youtu.be/eHz-xLSs50o

Відеоролик порівнює продуктивність двох топ моделей ШІ - OpenAI o1 та Anthropic Sonnet 3.5 - у створенні 3D-гри з фізикою паркування автомобіля.

🚗 Sonnet 3.5 не впорався із завданням видавши некеровану автівку, тоді як o1-preview змогла згенерувати базовий функціонал гри. o1 зробила керовану автівку зі слідами шин 0-шот промтом. Websim з цього зробив прям гру.

⚠️ Однак, на ускладнення завдання (зроби 3d гру у браузері), модель o1 також зазнала невдачі - автівка не рухалась, демонструючи, що модель все ще не досягла рівня людського розробника.

🤖 Загалом, відео показує, що o1 є більш потужною моделлю, ніж Sonnet 3.5, але все ще має обмеження і потребує подальшого вдосконалення.

Крутий кейс - починати код дорогою моделью, потім вже дороблюючи більш дешевими (з o1 у websim)
https://trypear.ai/

PearAI назвали себе open source Cursor - форкнули VSCode (редактор) та Continue (ШІ помічник з програмування) - з цього сталась невиличка сварка з Continue за права власності та тип ліцензії що додало їм PR (TechCrunch)

PS уже був open source клон Курсору https://voideditor.com/
https://openai.com/index/introducing-canvas/

OpenAI анонсували нову функцію ChatGPT для редагування тексту чи коду — Canvas. Вона дозволяє переносити чат у окрему панель та мати "вікно редактору".

Для тексту прикольно що дозволяет робити правки від ШІ збоку, подібно до коментарів у Word. Для коду схожа кнопка "Review code" . В цілому функціонал для коду (поки що?) дуже базовий і, на жаль, не має можливості запуску, як це є в Claude Artifacts. Але для простих проектів це краще ніж було.

Є цікава кнопка для перекладу коду на інші мови програмування, проте залишається питання, кому вона потрібна (можливо якщо JS у TS). Кнопки додавання коментарів та логінгу не вибірково це роблять, а майже на кожний рядок коду - це погано.
Review code у ChatGPT Canvas

Головне що вони зробили, це нарешті відповили на Claude артефакти (я їх доволі часто використовува для коду й вже не хотів повертатися у чат ChatGPT) - але тут поки працює тільки в платних планах, а там у всіх.
У нас новий цікавий етап розвитку помічників для кодингу. Якщо раніше ми починали з інструментів на кшталт phind та інших плагінів, інтегрованих у Visual Studio Code (VSC) як чат, то зараз користувачі мають щонайменше чотири основні варіанти:

(1) з категорії таких плагінів першим та головним є GitHub Copilot, який повністю закритий продукт Microsoft + OpenaAI дуже тісно інтегрований з VSC. За вас уже все вирішили та налаштували

(2) Водночас, потрохи популярності набрав Cursor який зараз стабільний та якісний продукт. Хоча він спочатку підтримував використання API-ключів та кастомних запитів для взаємодії з моделями, тепер більш змістилися теж до того, що "ви платите, ми налаштовуємо"

(3) Наступний варіант — це Canvas або Artifact, які вже вбудовані в самі чати на сайті, дозволяючи інтерактивно працювати з кодом та отримувати підказки в реальному часі у самому браузері. Для простих проектів. Є схожі на них й онлайн ide

(4) І нарешті, починають виходити "копії" Курсору наприклад PearAI, орієнтовані на більш прозорий підхід до взаємодії з моделями - через API-ключі та локальними на наш вибір. Це вже не просто плагіни VSC. Зараз я тестую цю програму й в ній поки що багів достатньо

Тож сфера ШІ кодінгу продовжує еволюціонувати, і користувачі можуть обирати серед різних продуктів, залежно від своїх потреб та уподобань.
👍1
🤖 Anthropic представили нові версії моделей Claude 3.5 Sonnet та Claude 3.5 Haiku, які значно покращили їхню продуктивність.

🖥 Найбільшою новинкою є "використання комп'ютера / Agentic Computer Use" (бета) - можливість моделей Claude безпосередньо взаємодіяти з комп'ютером, відкривати програми, виконувати завдання і створювати код.

💻 Демонстрації показують, що моделі можуть знаходити інформацію, заповнювати форми, виправляти помилки і навіть створювати веб-сайти самостійно.

https://www.youtube.com/watch?v=xwf4LKrCy9w
👍1
Copilot Arena

Copilot Arena - безкоштовний у використанні проект порівняння помічників штучного інтелекту (моделей) для генерації коду.

Надає вам для оцінки парні автозавершення від різних мовних моделей, серед яких GPT-4o, Codestral, Llama-3.1 та інші.

Мета - оцінити, які надають найкращу допомогу програмісту.

github vsc
GitHub Copilot тепер надає вибір моделі - розробники можуть використовувати моделі від Anthropic, Google та OpenAI.

Представлено GitHub Spark - інструмент для створення додатків на природній мові.

Впроваджено низку вдосконалень в GitHub Copilot, Copilot Workspace, GitHub Models та Copilot Autofix, щоб створити ще більш інтегроване AI-орієнтоване середовище для розробників.

За даними GitHub Octoverse 2024, кількість розробників у світі різко зросла, при цьому мова Python обігнала JavaScript як найпопулярніша мова на GitHub, частково завдяки зростанню активності в галузі генеративного AI.

https://github.com/newsroom/press-releases/github-universe-2024
👍2
⚙️ Bolt.new Fork by Cole Medin
github

форк репозиторію Bolt.new by StackBlitz (автоматичне створення повноцінних веб-застосунків безпосередньо в браузері за допомогою Claude Sonnet 3.5), який дозволяє використовувати різні LLM провайдери як то OpenRouter, Gemini, DeepSeek, Mistral та "Open AI Like" (це наприклад sambanova)

Також додана можливість Docker контейнеризувати застосунок для спрощення установки та публікувати проекти безпосередньо на GitHub.

на черзі деплой на Vercel/Netlify та Voice prompting
Останні дні активно чомусь просуваєтся в інтернетах модель Qwen 2.5 Coder

Для поціновувачів збочень ось відео яке демонструє, як ефективно поєднати AI-редактор коду Cursor з локальною Qwen 2.5 3b чи 14b (чи 32b якщо у вас макбук з M чіпом), встановивши сервер LM Studio з CORS налаштуванням та використовуючи Ngrok для забезпечення доступу через публічний домен.
Європейська компанія Mistral випустила оновлення для свого онлайн чату le Chat, щоб наздогнати і OpenAI, і Anthropic. Зараз у безкоштовній бета стадії.

Тепер у них теж є режим редактора Canvas - а якщо у ньому виділити шматок коду, то з'являється inline вікно запиту.

новина анонс: https://mistral.ai/news/mistral-chat/
🤩1
https://www.youtube.com/watch?v=1QaXyA3iwig

Це відео розповідає про те, як розвивається AI-программування як продукт. Автор - Патрік Дебуа - демонструє нові можливості, які з'явилися в різних IDE та інструментах для розробників завдяки AI. Замість простого доповнення коду, зараз AI може виконувати багатофайлову правку, підбирати контекст, тощо.

Патрік також описує, як розробники можуть розширювати контекст для AI, додаючи документацію, правила стильового оформлення, термінали та інші джерела інформації. Це дозволяє отримувати більш точні та ефективні результати від AI.

⚠️ Ключовим моментом є те, що роль розробника змінюється - тепер більше часу витрачається на перегляд та оцінку того, що згенерував AI, замість безпосереднього написання коду.

Патрік розповідає про механізми для полегшення цього процесу, такі як автоматичне виділення змін, покрокове представлення результатів та зворотній зв'язок.
На першому дні онлайн шоу "12 днів" OpenAI показали повну версію моделі о1, і вона ще ліпше вирішує завдання з програмування.

Також за 200$ / міс новий тариф ChatGPT, який дає доступ до pro версій o1 яка ще краща
Одна з найшвидших генеративних ШІ-платформ sambanova додала модель для программуваня від Qwen.

Проблема в тому, що Cursor їх блокує, спеціально чи ні - не зрозуміло. Люди на форумі у них пишуть про це вже кілька місяців.


The Qwen2.5-Coder-32B model is a 32B-parameter language model tailored for code-related tasks. It was trained on 5.5 trillion tokens, including source code and synthetic data. The model excels in code generation, reasoning, and debugging across 92 programming languages. Notably, it achieves a HumanEval score of 92.7%, matching coding capability of GPT-4o, making it one of the best open-source coding models for coding assistant like applications.