Як краще створювати код за допомогою LLM
Claude Artifacts у веб-інтерфейсі https://www.youtube.com/watch?v=8xvsBOzLGGA 🎮 У відео йдеться про нову функцію в Claude 3.5 Chat, яка дозволяє створювати відеоігри. Розповідається, як використовувати цю можливість для розробки ігор. 🔍 Автор відео наводить…
Artifacts тепер теж можна публікувати онлайн
Artifacts — на відео витік деталей про нову функцію Claude: не код, написаний програмістами, а ефективно сформульований запит до LLM.
Нова функція, згідно з витоком, демонструє, як добре структуровані запити можуть ефективно управляти великими обсягами інформації, створюючи значущий контент, який користувачі можуть легко адаптувати і повторно використовувати. Це відкриває нові перспективи для розвитку програмного забезпечення, де ключову роль відіграє вміння правильно напочатку запитувати LLM, а не лише програмувати.
https://youtu.be/EoswGAcD5YY
Нова функція, згідно з витоком, демонструє, як добре структуровані запити можуть ефективно управляти великими обсягами інформації, створюючи значущий контент, який користувачі можуть легко адаптувати і повторно використовувати. Це відкриває нові перспективи для розвитку програмного забезпечення, де ключову роль відіграє вміння правильно напочатку запитувати LLM, а не лише програмувати.
https://youtu.be/EoswGAcD5YY
YouTube
Claude 3.5 “Artifacts” LEAKED - Anthropic's Secret Revealed
Let's review how the Claude 3.5 Artifacts feature works by examining its system prompt!
Check out more details and get your own ASUS Vivobook S 15 ➜ https://asus.click/vbs_matthew
#ASUSCopilotPlusPC #ASUS #Vivobook #Microsoft
Subscribe to my newsletter…
Check out more details and get your own ASUS Vivobook S 15 ➜ https://asus.click/vbs_matthew
#ASUSCopilotPlusPC #ASUS #Vivobook #Microsoft
Subscribe to my newsletter…
codestral-mamba-latest на 7B від Mistral - новина
контекстне вікно 256k токенів
Вийшла модель для программування не Трансформер, а Мамба архітектури
контекстне вікно 256k токенів
Вийшла модель для программування не Трансформер, а Мамба архітектури
mistral.ai
Codestral Mamba | Mistral AI
As a tribute to Cleopatra, whose glorious destiny ended in tragic snake circumstances, we are proud to release Codestral Mamba, a Mamba2 language model specialised in code generation, available under an Apache 2.0 license.
Як краще створювати код за допомогою LLM
Хоча на https://cursor.sh/pricing ще написано GPT-3.5 в мене вона вже замінилася на GPT-4o який значно краще працює Phind у Pro плані теж додали цю модель до 4 трубо та опусу.
Cursor додали 4o-mini — нову швидку модель від OpenAI
Статистика LMSYS Chatbot Arena - у всіх нові версії моделей кращі ніж попередні.
Клод 3.5 поки що є тільки середнього розміру (Sonnet), але вона в зв'язці з ідею Artifacts у браузері обходить зараз усе інше
Клод 3.5 поки що є тільки середнього розміру (Sonnet), але вона в зв'язці з ідею Artifacts у браузері обходить зараз усе інше
https://cosine.sh/blog/genie-technical-report
Компанія Ccosine презентувала ШІ модель Genie спеціально для програмної інженерії (автоматичного написання коду як то Devin). Говорять, була навчена на спеціальних даних, що відтворюють логіку та процеси роботи програмістів.
Говорять, модель здатна:
Аналізувати та розбивати складні проблеми на менші завдання.
Шукати та знаходити відповідні фрагменти коду для внесення змін.
Генерувати, перевіряти та покращувати код, вирішуючи завдання так, як це робить інженер.
Виконувати широкий спектр завдань, від розробки нових функцій до виправлення багів, рефакторингу та написання тестів.
Genie адаптується до різних мов програмування.
Наразі доступ до Genie можливий лише через вейтлист.
Компанія Ccosine презентувала ШІ модель Genie спеціально для програмної інженерії (автоматичного написання коду як то Devin). Говорять, була навчена на спеціальних даних, що відтворюють логіку та процеси роботи програмістів.
Говорять, модель здатна:
Аналізувати та розбивати складні проблеми на менші завдання.
Шукати та знаходити відповідні фрагменти коду для внесення змін.
Генерувати, перевіряти та покращувати код, вирішуючи завдання так, як це робить інженер.
Виконувати широкий спектр завдань, від розробки нових функцій до виправлення багів, рефакторингу та написання тестів.
Genie адаптується до різних мов програмування.
Наразі доступ до Genie можливий лише через вейтлист.
🌍 У статті Андрія Карпатія (2017 рік), популярного дослідника зі сфери штучного інтелекту та машинного навчання, аналізується фундаментальний зсув у парадигмі розробки програмного забезпечення. Він проводить чітке розмежування між "Програмним забезпеченням 1.0" (традиційне ручне кодування) та "Програмним забезпеченням 2.0" (ШІ модель-орієнтоване навчання).
🧠 Карпатій стверджує, що нейронні мережі - це не просто черговий інструмент у наборі машинного навчання, а початок нової програмної Парадигми. На відміну від явного кодування в ПЗ 1.0, ПЗ 2.0 покладається на навчання моделей через великі обсяги даних, щоб виявляти закономірності та правила.
🚘 Цей перехід уже спостерігається в галузях, таких як комп'ютерне зір, розпізнавання мови, машинний переклад та автономні транспортні засоби, де нейронні мережі перевершують традиційні алгоритми.
📚 Однак Карпатій визнає певні проблеми, пов'язані з переходом до ПЗ 2.0. Зокрема, він зазначає, що програмування через налаштування ваг і зміщень нейронних мереж є значно менш інтуїтивним і зрозумілим для людей, ніж традиційне кодування.
🔍 Таким чином, основним викликом є створення більш інтуїтивних інструментів та методів, які б дозволили розробникам та користувачам краще розуміти та взаємодіяти з нейронними мережами, - ключовим компонентом цієї нової програмної парадигми.
🔮 Висновок Карпатія полягає в тому, що, подібно до того, як "Програмне забезпечення 1.0 поглинає світ", зараз "Штучний інтелект або Програмне забезпечення 2.0 поглинає Програмне забезпечення". Це захоплююча перспектива еволюції технологій, яка змінює саму природу розробки програмного забезпечення.
https://www.youtube.com/watch?v=ozEZbqzPyFM
🧠 Карпатій стверджує, що нейронні мережі - це не просто черговий інструмент у наборі машинного навчання, а початок нової програмної Парадигми. На відміну від явного кодування в ПЗ 1.0, ПЗ 2.0 покладається на навчання моделей через великі обсяги даних, щоб виявляти закономірності та правила.
🚘 Цей перехід уже спостерігається в галузях, таких як комп'ютерне зір, розпізнавання мови, машинний переклад та автономні транспортні засоби, де нейронні мережі перевершують традиційні алгоритми.
📚 Однак Карпатій визнає певні проблеми, пов'язані з переходом до ПЗ 2.0. Зокрема, він зазначає, що програмування через налаштування ваг і зміщень нейронних мереж є значно менш інтуїтивним і зрозумілим для людей, ніж традиційне кодування.
🔍 Таким чином, основним викликом є створення більш інтуїтивних інструментів та методів, які б дозволили розробникам та користувачам краще розуміти та взаємодіяти з нейронними мережами, - ключовим компонентом цієї нової програмної парадигми.
🔮 Висновок Карпатія полягає в тому, що, подібно до того, як "Програмне забезпечення 1.0 поглинає світ", зараз "Штучний інтелект або Програмне забезпечення 2.0 поглинає Програмне забезпечення". Це захоплююча перспектива еволюції технологій, яка змінює саму природу розробки програмного забезпечення.
https://www.youtube.com/watch?v=ozEZbqzPyFM
YouTube
How AI is eating Software - GPT4o explains Andrej Karpathy
In 2017 Andrej Karpathy published a provocative article titled "Software 2.0". In it he argues that AI (neural networks) are eating software and that the long standing current paradigm for software development will shift to an AI-centric paradigm called Software…
Phind-405B based on the Meta Llama 3.1 405B scores 92% on HumanEval (0-shot), matching Claude 3.5 Sonnet
+ new Phind Instant model based on Meta Llama 3.1 8B (free)
https://www.phind.com/blog/introducing-phind-405b-and-better-faster-searches
+ new Phind Instant model based on Meta Llama 3.1 8B (free)
https://www.phind.com/blog/introducing-phind-405b-and-better-faster-searches
The Replit Agent is currently available through a limited early access program
https://youtu.be/IYiVPrxY8-Y
https://youtu.be/IYiVPrxY8-Y
YouTube
Meet the Replit Agent
Introducing: Replit Agent
Discover how Replit Agent transforms ideas into fully-functional apps—no coding experience required.
Key Highlights:
00:00:00 - Introduction to Replit Agent
00:00:42 - Demo: Creating a local landmarks app
00:01:24 - Adding search…
Discover how Replit Agent transforms ideas into fully-functional apps—no coding experience required.
Key Highlights:
00:00:00 - Introduction to Replit Agent
00:00:42 - Demo: Creating a local landmarks app
00:01:24 - Adding search…
Найближчим часом очікуємо кейсів программуваня з OpenAI o1 - стежу. Багато говорять, що буде вирішувати дуже складні завдання
також цікаво скільки буде коштувати геренація проектів після тестової стадії
https://www.youtube.com/watch?v=50W4YeQdnSg
також цікаво скільки буде коштувати геренація проектів після тестової стадії
https://www.youtube.com/watch?v=50W4YeQdnSg
YouTube
Coding with OpenAI o1
Say hello to OpenAI o1—a new series of AI models designed to spend more time thinking before they respond. This new series of AI models can reason through complex tasks and solve harder problems than previous models in science, coding, and math. More here:…
👍1
https://youtu.be/eHz-xLSs50o
Відеоролик порівнює продуктивність двох топ моделей ШІ - OpenAI o1 та Anthropic Sonnet 3.5 - у створенні 3D-гри з фізикою паркування автомобіля.
🚗 Sonnet 3.5 не впорався із завданням видавши некеровану автівку, тоді як o1-preview змогла згенерувати базовий функціонал гри. o1 зробила керовану автівку зі слідами шин 0-шот промтом. Websim з цього зробив прям гру.
⚠️ Однак, на ускладнення завдання (зроби 3d гру у браузері), модель o1 також зазнала невдачі - автівка не рухалась, демонструючи, що модель все ще не досягла рівня людського розробника.
🤖 Загалом, відео показує, що o1 є більш потужною моделлю, ніж Sonnet 3.5, але все ще має обмеження і потребує подальшого вдосконалення.
Крутий кейс - починати код дорогою моделью, потім вже дороблюючи більш дешевими (з o1 у websim)
Відеоролик порівнює продуктивність двох топ моделей ШІ - OpenAI o1 та Anthropic Sonnet 3.5 - у створенні 3D-гри з фізикою паркування автомобіля.
🚗 Sonnet 3.5 не впорався із завданням видавши некеровану автівку, тоді як o1-preview змогла згенерувати базовий функціонал гри. o1 зробила керовану автівку зі слідами шин 0-шот промтом. Websim з цього зробив прям гру.
⚠️ Однак, на ускладнення завдання (зроби 3d гру у браузері), модель o1 також зазнала невдачі - автівка не рухалась, демонструючи, що модель все ще не досягла рівня людського розробника.
🤖 Загалом, відео показує, що o1 є більш потужною моделлю, ніж Sonnet 3.5, але все ще має обмеження і потребує подальшого вдосконалення.
Крутий кейс - починати код дорогою моделью, потім вже дороблюючи більш дешевими (з o1 у websim)
YouTube
OpenAI o1 VS Sonnet 3.5 in Coding Physics Games - AI Showdown
In this video, we put two AI models to the test: OpenAI's new o1 and Sonet 3.5 from Antropic using Claude and WebSync. We challenge them to create a car parking simulator with realistic physics. Watch as we explore the capabilities of o1's advanced reasoning…
в Cursor AI додали o1-preview та o1-mini
з 19/09 моделі OpenAI o1-preview та o1-mini тепер й у гітхаб копайлоті
https://github.blog/news-insights/product-news/try-out-openai-o1-in-github-copilot-and-models/
з 19/09 моделі OpenAI o1-preview та o1-mini тепер й у гітхаб копайлоті
https://github.blog/news-insights/product-news/try-out-openai-o1-in-github-copilot-and-models/
The GitHub Blog
Try out OpenAI o1 in GitHub Copilot and Models
OpenAI o1-preview and o1-mini are now available in GitHub Copilot Chat in VS Code and in the GitHub Models playground.
https://trypear.ai/
PearAI назвали себе open source Cursor - форкнули VSCode (редактор) та Continue (ШІ помічник з програмування) - з цього сталась невиличка сварка з Continue за права власності та тип ліцензії що додало їм PR (TechCrunch)
PS уже був open source клон Курсору https://voideditor.com/
PearAI назвали себе open source Cursor - форкнули VSCode (редактор) та Continue (ШІ помічник з програмування) - з цього сталась невиличка сварка з Continue за права власності та тип ліцензії що додало їм PR (TechCrunch)
PS уже був open source клон Курсору https://voideditor.com/
trypear.ai
PearAI - The AI Code Editor For Your Next Project
PearAI is an open source AI code editor with powerful features like AI chat, PearAI Creator, and AI debugging to help you make what excites.
https://openai.com/index/introducing-canvas/
OpenAI анонсували нову функцію ChatGPT для редагування тексту чи коду — Canvas. Вона дозволяє переносити чат у окрему панель та мати "вікно редактору".
Для тексту прикольно що дозволяет робити правки від ШІ збоку, подібно до коментарів у Word. Для коду схожа кнопка "Review code" . В цілому функціонал для коду (поки що?) дуже базовий і, на жаль, не має можливості запуску, як це є в Claude Artifacts. Але для простих проектів це краще ніж було.
Є цікава кнопка для перекладу коду на інші мови програмування, проте залишається питання, кому вона потрібна (можливо якщо JS у TS). Кнопки додавання коментарів та логінгу не вибірково це роблять, а майже на кожний рядок коду - це погано.
OpenAI анонсували нову функцію ChatGPT для редагування тексту чи коду — Canvas. Вона дозволяє переносити чат у окрему панель та мати "вікно редактору".
Для тексту прикольно що дозволяет робити правки від ШІ збоку, подібно до коментарів у Word. Для коду схожа кнопка "Review code" . В цілому функціонал для коду (поки що?) дуже базовий і, на жаль, не має можливості запуску, як це є в Claude Artifacts. Але для простих проектів це краще ніж було.
Є цікава кнопка для перекладу коду на інші мови програмування, проте залишається питання, кому вона потрібна (можливо якщо JS у TS). Кнопки додавання коментарів та логінгу не вибірково це роблять, а майже на кожний рядок коду - це погано.
Openai
Introducing canvas
Canvas is a new way to write and code with ChatGPT.
У нас новий цікавий етап розвитку помічників для кодингу. Якщо раніше ми починали з інструментів на кшталт phind та інших плагінів, інтегрованих у Visual Studio Code (VSC) як чат, то зараз користувачі мають щонайменше чотири основні варіанти:
(1) з категорії таких плагінів першим та головним є GitHub Copilot, який повністю закритий продукт Microsoft + OpenaAI дуже тісно інтегрований з VSC. За вас уже все вирішили та налаштували
(2) Водночас, потрохи популярності набрав Cursor який зараз стабільний та якісний продукт. Хоча він спочатку підтримував використання API-ключів та кастомних запитів для взаємодії з моделями, тепер більш змістилися теж до того, що "ви платите, ми налаштовуємо"
(3) Наступний варіант — це Canvas або Artifact, які вже вбудовані в самі чати на сайті, дозволяючи інтерактивно працювати з кодом та отримувати підказки в реальному часі у самому браузері. Для простих проектів. Є схожі на них й онлайн ide
(4) І нарешті, починають виходити "копії" Курсору наприклад PearAI, орієнтовані на більш прозорий підхід до взаємодії з моделями - через API-ключі та локальними на наш вибір. Це вже не просто плагіни VSC. Зараз я тестую цю програму й в ній поки що багів достатньо
Тож сфера ШІ кодінгу продовжує еволюціонувати, і користувачі можуть обирати серед різних продуктів, залежно від своїх потреб та уподобань.
(1) з категорії таких плагінів першим та головним є GitHub Copilot, який повністю закритий продукт Microsoft + OpenaAI дуже тісно інтегрований з VSC. За вас уже все вирішили та налаштували
(2) Водночас, потрохи популярності набрав Cursor який зараз стабільний та якісний продукт. Хоча він спочатку підтримував використання API-ключів та кастомних запитів для взаємодії з моделями, тепер більш змістилися теж до того, що "ви платите, ми налаштовуємо"
(3) Наступний варіант — це Canvas або Artifact, які вже вбудовані в самі чати на сайті, дозволяючи інтерактивно працювати з кодом та отримувати підказки в реальному часі у самому браузері. Для простих проектів. Є схожі на них й онлайн ide
(4) І нарешті, починають виходити "копії" Курсору наприклад PearAI, орієнтовані на більш прозорий підхід до взаємодії з моделями - через API-ключі та локальними на наш вибір. Це вже не просто плагіни VSC. Зараз я тестую цю програму й в ній поки що багів достатньо
Тож сфера ШІ кодінгу продовжує еволюціонувати, і користувачі можуть обирати серед різних продуктів, залежно від своїх потреб та уподобань.
👍1
🤖 Anthropic представили нові версії моделей Claude 3.5 Sonnet та Claude 3.5 Haiku, які значно покращили їхню продуктивність.
🖥 Найбільшою новинкою є "використання комп'ютера / Agentic Computer Use" (бета) - можливість моделей Claude безпосередньо взаємодіяти з комп'ютером, відкривати програми, виконувати завдання і створювати код.
💻 Демонстрації показують, що моделі можуть знаходити інформацію, заповнювати форми, виправляти помилки і навіть створювати веб-сайти самостійно.
https://www.youtube.com/watch?v=xwf4LKrCy9w
🖥 Найбільшою новинкою є "використання комп'ютера / Agentic Computer Use" (бета) - можливість моделей Claude безпосередньо взаємодіяти з комп'ютером, відкривати програми, виконувати завдання і створювати код.
💻 Демонстрації показують, що моделі можуть знаходити інформацію, заповнювати форми, виправляти помилки і навіть створювати веб-сайти самостійно.
https://www.youtube.com/watch?v=xwf4LKrCy9w
YouTube
Bigger than Open AI o1 - Claude 3.5 Agentic Computer Use
HUGE Thanks to SEOWriting for sponsoring today's video! Use MATT25 at checkout! https://seowriting.ai/?utm_source=youtube&utm_medium=matt_vid_pro
In this episode, I dive into the latest advancements from Anthropic AI, featuring their innovative models Claude…
In this episode, I dive into the latest advancements from Anthropic AI, featuring their innovative models Claude…
👍1
Copilot Arena
Copilot Arena - безкоштовний у використанні проект порівняння помічників штучного інтелекту (моделей) для генерації коду.
Надає вам для оцінки парні автозавершення від різних мовних моделей, серед яких GPT-4o, Codestral, Llama-3.1 та інші.
Мета - оцінити, які надають найкращу допомогу програмісту.
github vsc
Copilot Arena - безкоштовний у використанні проект порівняння помічників штучного інтелекту (моделей) для генерації коду.
Надає вам для оцінки парні автозавершення від різних мовних моделей, серед яких GPT-4o, Codestral, Llama-3.1 та інші.
Мета - оцінити, які надають найкращу допомогу програмісту.
github vsc
GitHub
GitHub - lmarena/copilot-arena
Contribute to lmarena/copilot-arena development by creating an account on GitHub.
GitHub Copilot тепер надає вибір моделі - розробники можуть використовувати моделі від Anthropic, Google та OpenAI.
Представлено GitHub Spark - інструмент для створення додатків на природній мові.
Впроваджено низку вдосконалень в GitHub Copilot, Copilot Workspace, GitHub Models та Copilot Autofix, щоб створити ще більш інтегроване AI-орієнтоване середовище для розробників.
За даними GitHub Octoverse 2024, кількість розробників у світі різко зросла, при цьому мова Python обігнала JavaScript як найпопулярніша мова на GitHub, частково завдяки зростанню активності в галузі генеративного AI.
https://github.com/newsroom/press-releases/github-universe-2024
Представлено GitHub Spark - інструмент для створення додатків на природній мові.
Впроваджено низку вдосконалень в GitHub Copilot, Copilot Workspace, GitHub Models та Copilot Autofix, щоб створити ще більш інтегроване AI-орієнтоване середовище для розробників.
За даними GitHub Octoverse 2024, кількість розробників у світі різко зросла, при цьому мова Python обігнала JavaScript як найпопулярніша мова на GitHub, частково завдяки зростанню активності в галузі генеративного AI.
https://github.com/newsroom/press-releases/github-universe-2024
GitHub
Universe 2024: GitHub Embraces Developer Choice with Multi-Model Copilot, New App Tool GitHub Spark, and AI-Native Developer Experience
At its flagship conference, GitHub emphasized the power of developer choice delivering multi-model GitHub Copilot with models from Anthropic, Google, and OpenAI, plus the introduction of GitHub Spa...
👍2