Як краще створювати код за допомогою LLM
29 subscribers
38 photos
172 links
Корисні поради, приклади, інструкції та інші матеріали на тему LLM, які допоможуть вам у програмуванні.

https://aicode.danvoronov.com/

З приводу онлайн чи офлайн (Київ) лекцій - @dan_voronov
Download Telegram
Artifacts — на відео витік деталей про нову функцію Claude: не код, написаний програмістами, а ефективно сформульований запит до LLM.

Нова функція, згідно з витоком, демонструє, як добре структуровані запити можуть ефективно управляти великими обсягами інформації, створюючи значущий контент, який користувачі можуть легко адаптувати і повторно використовувати. Це відкриває нові перспективи для розвитку програмного забезпечення, де ключову роль відіграє вміння правильно напочатку запитувати LLM, а не лише програмувати.

https://youtu.be/EoswGAcD5YY
codestral-mamba-latest на 7B від Mistral - новина
контекстне вікно 256k токенів

Вийшла модель для программування не Трансформер, а Мамба архітектури
Статистика LMSYS Chatbot Arena - у всіх нові версії моделей кращі ніж попередні.

Клод 3.5 поки що є тільки середнього розміру (Sonnet), але вона в зв'язці з ідею Artifacts у браузері обходить зараз усе інше
https://cosine.sh/blog/genie-technical-report

Компанія Ccosine презентувала ШІ модель Genie спеціально для програмної інженерії (автоматичного написання коду як то Devin). Говорять, була навчена на спеціальних даних, що відтворюють логіку та процеси роботи програмістів.

Говорять, модель здатна:
Аналізувати та розбивати складні проблеми на менші завдання.
Шукати та знаходити відповідні фрагменти коду для внесення змін.
Генерувати, перевіряти та покращувати код, вирішуючи завдання так, як це робить інженер.
Виконувати широкий спектр завдань, від розробки нових функцій до виправлення багів, рефакторингу та написання тестів.

Genie адаптується до різних мов програмування.

Наразі доступ до Genie можливий лише через вейтлист.
🌍 У статті Андрія Карпатія (2017 рік), популярного дослідника зі сфери штучного інтелекту та машинного навчання, аналізується фундаментальний зсув у парадигмі розробки програмного забезпечення. Він проводить чітке розмежування між "Програмним забезпеченням 1.0" (традиційне ручне кодування) та "Програмним забезпеченням 2.0" (ШІ модель-орієнтоване навчання).

🧠 Карпатій стверджує, що нейронні мережі - це не просто черговий інструмент у наборі машинного навчання, а початок нової програмної Парадигми. На відміну від явного кодування в ПЗ 1.0, ПЗ 2.0 покладається на навчання моделей через великі обсяги даних, щоб виявляти закономірності та правила.

🚘 Цей перехід уже спостерігається в галузях, таких як комп'ютерне зір, розпізнавання мови, машинний переклад та автономні транспортні засоби, де нейронні мережі перевершують традиційні алгоритми.

📚 Однак Карпатій визнає певні проблеми, пов'язані з переходом до ПЗ 2.0. Зокрема, він зазначає, що програмування через налаштування ваг і зміщень нейронних мереж є значно менш інтуїтивним і зрозумілим для людей, ніж традиційне кодування.

🔍 Таким чином, основним викликом є створення більш інтуїтивних інструментів та методів, які б дозволили розробникам та користувачам краще розуміти та взаємодіяти з нейронними мережами, - ключовим компонентом цієї нової програмної парадигми.

🔮 Висновок Карпатія полягає в тому, що, подібно до того, як "Програмне забезпечення 1.0 поглинає світ", зараз "Штучний інтелект або Програмне забезпечення 2.0 поглинає Програмне забезпечення". Це захоплююча перспектива еволюції технологій, яка змінює саму природу розробки програмного забезпечення.

https://www.youtube.com/watch?v=ozEZbqzPyFM
Phind-405B based on the Meta Llama 3.1 405B scores 92% on HumanEval (0-shot), matching Claude 3.5 Sonnet

+ new Phind Instant model based on Meta Llama 3.1 8B (free)

https://www.phind.com/blog/introducing-phind-405b-and-better-faster-searches
Найближчим часом очікуємо кейсів программуваня з OpenAI o1 - стежу. Багато говорять, що буде вирішувати дуже складні завдання

також цікаво скільки буде коштувати геренація проектів після тестової стадії

https://www.youtube.com/watch?v=50W4YeQdnSg
👍1
https://youtu.be/eHz-xLSs50o

Відеоролик порівнює продуктивність двох топ моделей ШІ - OpenAI o1 та Anthropic Sonnet 3.5 - у створенні 3D-гри з фізикою паркування автомобіля.

🚗 Sonnet 3.5 не впорався із завданням видавши некеровану автівку, тоді як o1-preview змогла згенерувати базовий функціонал гри. o1 зробила керовану автівку зі слідами шин 0-шот промтом. Websim з цього зробив прям гру.

⚠️ Однак, на ускладнення завдання (зроби 3d гру у браузері), модель o1 також зазнала невдачі - автівка не рухалась, демонструючи, що модель все ще не досягла рівня людського розробника.

🤖 Загалом, відео показує, що o1 є більш потужною моделлю, ніж Sonnet 3.5, але все ще має обмеження і потребує подальшого вдосконалення.

Крутий кейс - починати код дорогою моделью, потім вже дороблюючи більш дешевими (з o1 у websim)
https://trypear.ai/

PearAI назвали себе open source Cursor - форкнули VSCode (редактор) та Continue (ШІ помічник з програмування) - з цього сталась невиличка сварка з Continue за права власності та тип ліцензії що додало їм PR (TechCrunch)

PS уже був open source клон Курсору https://voideditor.com/
https://openai.com/index/introducing-canvas/

OpenAI анонсували нову функцію ChatGPT для редагування тексту чи коду — Canvas. Вона дозволяє переносити чат у окрему панель та мати "вікно редактору".

Для тексту прикольно що дозволяет робити правки від ШІ збоку, подібно до коментарів у Word. Для коду схожа кнопка "Review code" . В цілому функціонал для коду (поки що?) дуже базовий і, на жаль, не має можливості запуску, як це є в Claude Artifacts. Але для простих проектів це краще ніж було.

Є цікава кнопка для перекладу коду на інші мови програмування, проте залишається питання, кому вона потрібна (можливо якщо JS у TS). Кнопки додавання коментарів та логінгу не вибірково це роблять, а майже на кожний рядок коду - це погано.
Review code у ChatGPT Canvas

Головне що вони зробили, це нарешті відповили на Claude артефакти (я їх доволі часто використовува для коду й вже не хотів повертатися у чат ChatGPT) - але тут поки працює тільки в платних планах, а там у всіх.
У нас новий цікавий етап розвитку помічників для кодингу. Якщо раніше ми починали з інструментів на кшталт phind та інших плагінів, інтегрованих у Visual Studio Code (VSC) як чат, то зараз користувачі мають щонайменше чотири основні варіанти:

(1) з категорії таких плагінів першим та головним є GitHub Copilot, який повністю закритий продукт Microsoft + OpenaAI дуже тісно інтегрований з VSC. За вас уже все вирішили та налаштували

(2) Водночас, потрохи популярності набрав Cursor який зараз стабільний та якісний продукт. Хоча він спочатку підтримував використання API-ключів та кастомних запитів для взаємодії з моделями, тепер більш змістилися теж до того, що "ви платите, ми налаштовуємо"

(3) Наступний варіант — це Canvas або Artifact, які вже вбудовані в самі чати на сайті, дозволяючи інтерактивно працювати з кодом та отримувати підказки в реальному часі у самому браузері. Для простих проектів. Є схожі на них й онлайн ide

(4) І нарешті, починають виходити "копії" Курсору наприклад PearAI, орієнтовані на більш прозорий підхід до взаємодії з моделями - через API-ключі та локальними на наш вибір. Це вже не просто плагіни VSC. Зараз я тестую цю програму й в ній поки що багів достатньо

Тож сфера ШІ кодінгу продовжує еволюціонувати, і користувачі можуть обирати серед різних продуктів, залежно від своїх потреб та уподобань.
👍1
🤖 Anthropic представили нові версії моделей Claude 3.5 Sonnet та Claude 3.5 Haiku, які значно покращили їхню продуктивність.

🖥 Найбільшою новинкою є "використання комп'ютера / Agentic Computer Use" (бета) - можливість моделей Claude безпосередньо взаємодіяти з комп'ютером, відкривати програми, виконувати завдання і створювати код.

💻 Демонстрації показують, що моделі можуть знаходити інформацію, заповнювати форми, виправляти помилки і навіть створювати веб-сайти самостійно.

https://www.youtube.com/watch?v=xwf4LKrCy9w
👍1
Copilot Arena

Copilot Arena - безкоштовний у використанні проект порівняння помічників штучного інтелекту (моделей) для генерації коду.

Надає вам для оцінки парні автозавершення від різних мовних моделей, серед яких GPT-4o, Codestral, Llama-3.1 та інші.

Мета - оцінити, які надають найкращу допомогу програмісту.

github vsc
GitHub Copilot тепер надає вибір моделі - розробники можуть використовувати моделі від Anthropic, Google та OpenAI.

Представлено GitHub Spark - інструмент для створення додатків на природній мові.

Впроваджено низку вдосконалень в GitHub Copilot, Copilot Workspace, GitHub Models та Copilot Autofix, щоб створити ще більш інтегроване AI-орієнтоване середовище для розробників.

За даними GitHub Octoverse 2024, кількість розробників у світі різко зросла, при цьому мова Python обігнала JavaScript як найпопулярніша мова на GitHub, частково завдяки зростанню активності в галузі генеративного AI.

https://github.com/newsroom/press-releases/github-universe-2024
👍2