Як краще створювати код за допомогою LLM
29 subscribers
38 photos
172 links
Корисні поради, приклади, інструкції та інші матеріали на тему LLM, які допоможуть вам у програмуванні.

https://aicode.danvoronov.com/

З приводу онлайн чи офлайн (Київ) лекцій - @dan_voronov
Download Telegram
GPTScript — програмування на звичайній мові

відео як можна створити файл з розширенням GPT. Це дозволяє писати програми звичайною (тут англійською) мовою. Ви просто описуєте кроки: наприклад, програма очікує завантаження фотографії 📸, витягує список інгредієнтів з фото 🍎🍞, створює файл з цими інгредієнтами 📄, а потім пропонує рецепт 🍲. GPTScript автоматично виконує всі мережеві запити до OpenAI, щоб це працювало. 🌐

На відео ця штука працює доволі повільно.

https://gptscript.ai/
https://mistral.ai/news/codestral/

🗓 29 травня 2024 року команда Mistral AI оголосила про запуск Codestral - своєї першої моделі для генерації коду. 🤖

Codestral - це генеративна модель штучного інтелекту для розробки коду, яка підтримує більше 80 мов програмування, включаючи Python, Java, C++ і багато інших. Модель допомагає розробникам писати код, створювати тести та завершувати фрагменти коду. 🧑‍💻

🔍 Codestral пропонує високу продуктивність з великим контекстним вікном у 32k та перевершує інші моделі у бенчмарках.

💬 Модель доступниа через Le Chat

🌍 Скачати чи випробувати можна на HuggingFace, а також через спеціалізований API-ендпоїнт на сайті mistral.ai
Тепер GPT доступні у безкоштовному плані ChatGPT.

Огляд на Grimoire https://www.youtube.com/watch?v=PIvvjP2z24o та інтеграції з Netlify
Claude Artifacts у веб-інтерфейсі

https://www.youtube.com/watch?v=8xvsBOzLGGA

🎮 У відео йдеться про нову функцію в Claude 3.5 Chat, яка дозволяє створювати відеоігри. Розповідається, як використовувати цю можливість для розробки ігор.

🔍 Автор відео наводить огляд на основні можливості Claude 3.5 і підкреслює, що недавно він зрозумів важливість ще однієї значної функції, яку можна активувати в налаштуваннях
Artifacts — на відео витік деталей про нову функцію Claude: не код, написаний програмістами, а ефективно сформульований запит до LLM.

Нова функція, згідно з витоком, демонструє, як добре структуровані запити можуть ефективно управляти великими обсягами інформації, створюючи значущий контент, який користувачі можуть легко адаптувати і повторно використовувати. Це відкриває нові перспективи для розвитку програмного забезпечення, де ключову роль відіграє вміння правильно напочатку запитувати LLM, а не лише програмувати.

https://youtu.be/EoswGAcD5YY
codestral-mamba-latest на 7B від Mistral - новина
контекстне вікно 256k токенів

Вийшла модель для программування не Трансформер, а Мамба архітектури
Статистика LMSYS Chatbot Arena - у всіх нові версії моделей кращі ніж попередні.

Клод 3.5 поки що є тільки середнього розміру (Sonnet), але вона в зв'язці з ідею Artifacts у браузері обходить зараз усе інше
https://cosine.sh/blog/genie-technical-report

Компанія Ccosine презентувала ШІ модель Genie спеціально для програмної інженерії (автоматичного написання коду як то Devin). Говорять, була навчена на спеціальних даних, що відтворюють логіку та процеси роботи програмістів.

Говорять, модель здатна:
Аналізувати та розбивати складні проблеми на менші завдання.
Шукати та знаходити відповідні фрагменти коду для внесення змін.
Генерувати, перевіряти та покращувати код, вирішуючи завдання так, як це робить інженер.
Виконувати широкий спектр завдань, від розробки нових функцій до виправлення багів, рефакторингу та написання тестів.

Genie адаптується до різних мов програмування.

Наразі доступ до Genie можливий лише через вейтлист.
🌍 У статті Андрія Карпатія (2017 рік), популярного дослідника зі сфери штучного інтелекту та машинного навчання, аналізується фундаментальний зсув у парадигмі розробки програмного забезпечення. Він проводить чітке розмежування між "Програмним забезпеченням 1.0" (традиційне ручне кодування) та "Програмним забезпеченням 2.0" (ШІ модель-орієнтоване навчання).

🧠 Карпатій стверджує, що нейронні мережі - це не просто черговий інструмент у наборі машинного навчання, а початок нової програмної Парадигми. На відміну від явного кодування в ПЗ 1.0, ПЗ 2.0 покладається на навчання моделей через великі обсяги даних, щоб виявляти закономірності та правила.

🚘 Цей перехід уже спостерігається в галузях, таких як комп'ютерне зір, розпізнавання мови, машинний переклад та автономні транспортні засоби, де нейронні мережі перевершують традиційні алгоритми.

📚 Однак Карпатій визнає певні проблеми, пов'язані з переходом до ПЗ 2.0. Зокрема, він зазначає, що програмування через налаштування ваг і зміщень нейронних мереж є значно менш інтуїтивним і зрозумілим для людей, ніж традиційне кодування.

🔍 Таким чином, основним викликом є створення більш інтуїтивних інструментів та методів, які б дозволили розробникам та користувачам краще розуміти та взаємодіяти з нейронними мережами, - ключовим компонентом цієї нової програмної парадигми.

🔮 Висновок Карпатія полягає в тому, що, подібно до того, як "Програмне забезпечення 1.0 поглинає світ", зараз "Штучний інтелект або Програмне забезпечення 2.0 поглинає Програмне забезпечення". Це захоплююча перспектива еволюції технологій, яка змінює саму природу розробки програмного забезпечення.

https://www.youtube.com/watch?v=ozEZbqzPyFM
Phind-405B based on the Meta Llama 3.1 405B scores 92% on HumanEval (0-shot), matching Claude 3.5 Sonnet

+ new Phind Instant model based on Meta Llama 3.1 8B (free)

https://www.phind.com/blog/introducing-phind-405b-and-better-faster-searches
Найближчим часом очікуємо кейсів программуваня з OpenAI o1 - стежу. Багато говорять, що буде вирішувати дуже складні завдання

також цікаво скільки буде коштувати геренація проектів після тестової стадії

https://www.youtube.com/watch?v=50W4YeQdnSg
👍1
https://youtu.be/eHz-xLSs50o

Відеоролик порівнює продуктивність двох топ моделей ШІ - OpenAI o1 та Anthropic Sonnet 3.5 - у створенні 3D-гри з фізикою паркування автомобіля.

🚗 Sonnet 3.5 не впорався із завданням видавши некеровану автівку, тоді як o1-preview змогла згенерувати базовий функціонал гри. o1 зробила керовану автівку зі слідами шин 0-шот промтом. Websim з цього зробив прям гру.

⚠️ Однак, на ускладнення завдання (зроби 3d гру у браузері), модель o1 також зазнала невдачі - автівка не рухалась, демонструючи, що модель все ще не досягла рівня людського розробника.

🤖 Загалом, відео показує, що o1 є більш потужною моделлю, ніж Sonnet 3.5, але все ще має обмеження і потребує подальшого вдосконалення.

Крутий кейс - починати код дорогою моделью, потім вже дороблюючи більш дешевими (з o1 у websim)
https://trypear.ai/

PearAI назвали себе open source Cursor - форкнули VSCode (редактор) та Continue (ШІ помічник з програмування) - з цього сталась невиличка сварка з Continue за права власності та тип ліцензії що додало їм PR (TechCrunch)

PS уже був open source клон Курсору https://voideditor.com/
https://openai.com/index/introducing-canvas/

OpenAI анонсували нову функцію ChatGPT для редагування тексту чи коду — Canvas. Вона дозволяє переносити чат у окрему панель та мати "вікно редактору".

Для тексту прикольно що дозволяет робити правки від ШІ збоку, подібно до коментарів у Word. Для коду схожа кнопка "Review code" . В цілому функціонал для коду (поки що?) дуже базовий і, на жаль, не має можливості запуску, як це є в Claude Artifacts. Але для простих проектів це краще ніж було.

Є цікава кнопка для перекладу коду на інші мови програмування, проте залишається питання, кому вона потрібна (можливо якщо JS у TS). Кнопки додавання коментарів та логінгу не вибірково це роблять, а майже на кожний рядок коду - це погано.