🎥 Генерация видео с FireRed-OpenStoryline
FireRed-OpenStoryline упрощает создание видео, превращая его в интуитивный процесс общения. Система автоматически генерирует сценарии, подбирает музыку и шрифты, а также позволяет редактировать видео с помощью естественных языковых команд.
🚀 Основные моменты:
- 🌐 Умный поиск и организация медиа
- ✍️ Интеллектуальная генерация сценариев
- 🎵 Рекомендации по музыке и озвучке
- 💬 Редактирование через разговорные команды
- ⚡ Архивирование навыков редактирования
📌 GitHub: https://github.com/FireRedTeam/FireRed-OpenStoryline
@pythonl
FireRed-OpenStoryline упрощает создание видео, превращая его в интуитивный процесс общения. Система автоматически генерирует сценарии, подбирает музыку и шрифты, а также позволяет редактировать видео с помощью естественных языковых команд.
🚀 Основные моменты:
- 🌐 Умный поиск и организация медиа
- ✍️ Интеллектуальная генерация сценариев
- 🎵 Рекомендации по музыке и озвучке
- 💬 Редактирование через разговорные команды
- ⚡ Архивирование навыков редактирования
📌 GitHub: https://github.com/FireRedTeam/FireRed-OpenStoryline
@pythonl
❤9👍1😱1🤩1
Ваш домен может стоить один рубль
Переносите и продлевайте домены в Selectel и платите за это всего по одному рублю. Бонусом получите бесплатный DNS-хостинг и SSL-сертификаты, а еще возможность развернуть полноценную IT-инфраструктуру проекта в одном окне браузера.
Успейте перенести и продлить домены в Selectel по рублю до 30.06 →
Реклама. АО "Селектел". erid:2W5zFJqGwih
Переносите и продлевайте домены в Selectel и платите за это всего по одному рублю. Бонусом получите бесплатный DNS-хостинг и SSL-сертификаты, а еще возможность развернуть полноценную IT-инфраструктуру проекта в одном окне браузера.
Успейте перенести и продлить домены в Selectel по рублю до 30.06 →
Реклама. АО "Селектел". erid:2W5zFJqGwih
❤6👍1😢1
This media is not supported in your browser
VIEW IN TELEGRAM
Сохрани себе: извлечение всех ссылок со страницы с помощью регулярных выражений - это быстро и просто. Вот пример кода, который поможет тебе в этом.
import re
import requests
def extract_links(url):
response = requests.get(url)
html_content = response.text
links = re.findall(r'href=["\']?(https?://[^"\'>]+)', html_content)
return links
url = 'https://example.com'
all_links = extract_links(url)
print(all_links)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13❤6
В Python 3.14 появилось решение, которое помогает избавиться от SQL-инъекций - t-strings 🔒
Проблема
Когда вы используете f-strings для SQL:
пользовательский ввод напрямую попадает в запрос.
Если злоумышленник передаст:
— база выполнит вредоносную команду.
Это классическая SQL injection.
Почему это неудобно сейчас
Безопасный способ — параметризованные запросы:
Но приходится:
• запускать шаблон отдельно
• передавать значения отдельно
• поддерживать две структуры
Что изменилось в Python 3.14
Появились template string literals (t-strings).
В отличие от f-strings, они:
• не возвращают готовую строку
• возвращают объект Template
• отдельно хранят текст и подставленные значения
Пример:
Теперь можно:
• получить все интерполяции
• проверить значения
• экранировать или валидировать их
• и только потом собрать финальный SQL
Результат:
• вредоносный ввод очищается
• SQL-инъекции блокируются
• таблицы остаются на месте
Почему это важно
f-strings - быстрые, но опасные для SQL.
t-strings позволяют сохранить удобство шаблонов и добавить контроль безопасности.
Python движется к безопасным шаблонам по умолчанию, меньше ручной защиты, меньше уязвимостей в продакшене.
📲 Max
@pythonl
Проблема
Когда вы используете f-strings для SQL:
query = f"SELECT * FROM users WHERE name = '{user_input}'"
пользовательский ввод напрямую попадает в запрос.
Если злоумышленник передаст:
admin'; DROP TABLE users; --
— база выполнит вредоносную команду.
Это классическая SQL injection.
Почему это неудобно сейчас
Безопасный способ — параметризованные запросы:
cursor.execute(
"SELECT * FROM users WHERE name = %s",
(user_input,)
)
Но приходится:
• запускать шаблон отдельно
• передавать значения отдельно
• поддерживать две структуры
Что изменилось в Python 3.14
Появились template string literals (t-strings).
В отличие от f-strings, они:
• не возвращают готовую строку
• возвращают объект Template
• отдельно хранят текст и подставленные значения
Пример:
query = t"SELECT * FROM users WHERE name = {user_input}"
Теперь можно:
• получить все интерполяции
• проверить значения
• экранировать или валидировать их
• и только потом собрать финальный SQL
safe = safe_sql(query)
Результат:
• вредоносный ввод очищается
• SQL-инъекции блокируются
• таблицы остаются на месте
Почему это важно
f-strings - быстрые, но опасные для SQL.
t-strings позволяют сохранить удобство шаблонов и добавить контроль безопасности.
Python движется к безопасным шаблонам по умолчанию, меньше ручной защиты, меньше уязвимостей в продакшене.
@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥23👍7❤2😢1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Как изучать любой GitHub-репозиторий за 5 минут с DeepWiki
Если ты открываешь чужой репозиторий и не понимаешь, с чего начать - не читай файлы вручную. Спроси код.
DeepWiki автоматически строит AI-wiki для любого проекта и позволяет задавать вопросы прямо к исходникам.
Как использовать:
1. Открой нужный репозиторий на GitHub
2. Замени в адресе:
github.com → deepwiki.com
3. Задай вопросы:
- Как устроена архитектура?
- С чего начинается запуск?
- Где реализована основная логика?
- Как работает конкретная функция?
Почему это работает:
- Документация может быть устаревшей
- README часто поверхностный
- Код — единственный источник истины
DeepWiki анализирует структуру проекта и объясняет её простым языком.
Когда особенно полезно:
- Быстрый онбординг в новый проект
- Подготовка к собеседованию
- Разбор open-source
- Понимание сложных библиотек
- Работа AI-агентов с кодом
Главная мысль:
Не читай сотни файлов — задавай вопросы репозиторию.
Пример
GitHub
https://github.com/karpathy/nanochat
// DeepWiki
https://deepwiki.com/karpathy/nanochat
Примеры вопросов:
- How does training work?
- Where is the main entry point?
- How is inference implemented?
- What are the key modules?
Если ты открываешь чужой репозиторий и не понимаешь, с чего начать - не читай файлы вручную. Спроси код.
DeepWiki автоматически строит AI-wiki для любого проекта и позволяет задавать вопросы прямо к исходникам.
Как использовать:
1. Открой нужный репозиторий на GitHub
2. Замени в адресе:
github.com → deepwiki.com
3. Задай вопросы:
- Как устроена архитектура?
- С чего начинается запуск?
- Где реализована основная логика?
- Как работает конкретная функция?
Почему это работает:
- Документация может быть устаревшей
- README часто поверхностный
- Код — единственный источник истины
DeepWiki анализирует структуру проекта и объясняет её простым языком.
Когда особенно полезно:
- Быстрый онбординг в новый проект
- Подготовка к собеседованию
- Разбор open-source
- Понимание сложных библиотек
- Работа AI-агентов с кодом
Главная мысль:
Не читай сотни файлов — задавай вопросы репозиторию.
Пример
GitHub
https://github.com/karpathy/nanochat
// DeepWiki
https://deepwiki.com/karpathy/nanochat
Примеры вопросов:
- How does training work?
- Where is the main entry point?
- How is inference implemented?
- What are the key modules?
👍17🔥10❤7
MOVA — это открытая модель, которая синхронно генерирует видео и аудио, устраняя проблемы каскадных пайплайнов. Она обеспечивает высокое качество и точную синхронизацию губ и звуковых эффектов, предлагая пользователям мощный инструмент для создания контента.
🚀Основные моменты:
- Бимодальная генерация: видео и аудио создаются одновременно.
- Высокая точность синхронизации губ и звуковых эффектов.
- Полностью открытый исходный код и доступные веса модели.
- Архитектура с асимметричными двойными башнями для лучшего взаимодействия модальностей.
📌 GitHub: https://github.com/OpenMOSS/MOVA
#python
Please open Telegram to view this post
VIEW IN TELEGRAM
❤7👍4🔥4
🌟 Создайте свой пиксельный офис с Star Office UI
Star Office UI — это интерактивная панель для многопользовательского сотрудничества, визуализирующая статус ваших AI помощников в реальном времени. Вы можете видеть, кто чем занят, что было сделано вчера и кто сейчас онлайн.
🚀 Основные моменты:
- Визуализация статусов AI: idle, writing, syncing и др.
- "Вчерашние заметки" для краткого обзора выполненной работы.
- Поддержка приглашения других участников в офис.
- Адаптивный интерфейс для мобильных устройств.
- Гибкие варианты публичного доступа.
📌 GitHub: https://github.com/ringhyacinth/Star-Office-UI
#python
@pythonl
Star Office UI — это интерактивная панель для многопользовательского сотрудничества, визуализирующая статус ваших AI помощников в реальном времени. Вы можете видеть, кто чем занят, что было сделано вчера и кто сейчас онлайн.
🚀 Основные моменты:
- Визуализация статусов AI: idle, writing, syncing и др.
- "Вчерашние заметки" для краткого обзора выполненной работы.
- Поддержка приглашения других участников в офис.
- Адаптивный интерфейс для мобильных устройств.
- Гибкие варианты публичного доступа.
📌 GitHub: https://github.com/ringhyacinth/Star-Office-UI
#python
@pythonl
🔥16❤7👍5😁3
🔧 Инструмент для тестирования безопасности
RaspyJack - это портативный инструмент для авторизованного тестирования безопасности с интерфейсом на LCD, веб-интерфейсом и интегрированной IDE для создания полезных нагрузок. Подходит для исследований и образовательных целей.
🚀 Основные моменты:
- LCD-интерфейс для управления
- Категории полезных нагрузок (разведка, перехват и др.)
- Веб-интерфейс для удаленного управления
- Интеграция инструментов DNS-спуфинга и WiFi-атак
📌 GitHub: https://github.com/7h30th3r0n3/Raspyjack
@pythonl
RaspyJack - это портативный инструмент для авторизованного тестирования безопасности с интерфейсом на LCD, веб-интерфейсом и интегрированной IDE для создания полезных нагрузок. Подходит для исследований и образовательных целей.
🚀 Основные моменты:
- LCD-интерфейс для управления
- Категории полезных нагрузок (разведка, перехват и др.)
- Веб-интерфейс для удаленного управления
- Интеграция инструментов DNS-спуфинга и WiFi-атак
📌 GitHub: https://github.com/7h30th3r0n3/Raspyjack
@pythonl
❤10🤩4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Языки программирования и их for-циклы
Ты когда-нибудь замечал, что почти все языки программирования выглядят по-разному, но внутри делают одно и то же?
Самый простой пример — обычный цикл. В Python он читается почти как английский. В C, Java и Go он выглядит как строгая формула. В Rust и Kotlin больше похож на математическую запись. А в Assembly это вообще набор инструкций для процессора.
Но смысл всегда один и тот же. Мы просто говорим компьютеру: повтори действие N раз.
• 🐍 Python - for i in range(n):
• ☕ Java - for(int i=0;i<n;i++){}
• ⚡ C - for(int i=0;i<n;i++){}
• 🛠️ C++ - for(int i=0;i<n;i++){}
• 🌐 JavaScript - for(let i=0;i<n;i++){}
• 🛠️ C# - for(int i=0;i<n;i++){}
• 🐹 Go - for i:=0;i<n;i++{}
• 🦀 Rust - for i in 0..n {}
• 🐘 PHP - for($i=0;$i<$n;$i++){}
• 💎 Ruby - for i in 0...n do end
• 🐪 Kotlin - for(i in 0 until n){}
• 🍎 Swift - for i in 0..<n {}
• 🔷 TypeScript - for(let i=0;i<n;i++){}
• 🧮 R - for(i in 1:n){}
• 🐚 Bash - for ((i=0;i<n;i++)); do :; done
• 🧱 Dart - for(int i=0;i<n;i++){}
• 🎯 Scala - for(i <- 0 until n){}
• 🐼 Groovy - for(int i=0;i<n;i++){}
• 🧠 Julia - for i in 1:n end
• 🔧 Assembly (x86 Linux) - mov ecx,n ; loop: dec ecx ; jnz loop
•
Один цикл — десятки языков
Ты когда-нибудь замечал, что почти все языки программирования выглядят по-разному, но внутри делают одно и то же?
Самый простой пример — обычный цикл. В Python он читается почти как английский. В C, Java и Go он выглядит как строгая формула. В Rust и Kotlin больше похож на математическую запись. А в Assembly это вообще набор инструкций для процессора.
Но смысл всегда один и тот же. Мы просто говорим компьютеру: повтори действие N раз.
• 🐍 Python - for i in range(n):
• ☕ Java - for(int i=0;i<n;i++){}
• ⚡ C - for(int i=0;i<n;i++){}
• 🛠️ C++ - for(int i=0;i<n;i++){}
• 🌐 JavaScript - for(let i=0;i<n;i++){}
• 🛠️ C# - for(int i=0;i<n;i++){}
• 🐹 Go - for i:=0;i<n;i++{}
• 🦀 Rust - for i in 0..n {}
• 🐘 PHP - for($i=0;$i<$n;$i++){}
• 💎 Ruby - for i in 0...n do end
• 🐪 Kotlin - for(i in 0 until n){}
• 🍎 Swift - for i in 0..<n {}
• 🔷 TypeScript - for(let i=0;i<n;i++){}
• 🧮 R - for(i in 1:n){}
• 🐚 Bash - for ((i=0;i<n;i++)); do :; done
• 🧱 Dart - for(int i=0;i<n;i++){}
• 🎯 Scala - for(i <- 0 until n){}
• 🐼 Groovy - for(int i=0;i<n;i++){}
• 🧠 Julia - for i in 1:n end
• 🔧 Assembly (x86 Linux) - mov ecx,n ; loop: dec ecx ; jnz loop
•
Один цикл — десятки языков
🔥25❤10👍3
Forwarded from Machinelearning
OpenAI объявила о начале развёртывания новых моделей GPT-5.4 Thinking и GPT-5.4 Pro в ChatGPT.
Также GPT-5.4 стала доступна разработчикам через API и в Codex. Новая версия объединяет несколько ключевых направлений развития моделей: улучшенное логическое рассуждение, более сильные возможности программирования и поддержку агентных сценариев работы.
Самое интересное:
• GPT-5.4 лидер в agentic tasks
• заметный скачок в математике
• очень сильный результат в научных задачах (GPQA)
• улучшена работа с веб-средой и инструментами
Фактически это модель, которую явно оптимизировали под агентов, инструменты и сложное reasoning, а не просто чат.
По словам компании, GPT-5.4 стала одной из самых точных и эффективных моделей. Она требует меньше токенов для выполнения задач и работает быстрее по сравнению с предыдущими версиями.
В версии ChatGPT модель GPT-5.4 Thinking получила улучшенный режим размышления: при более длительном анализе она лучше удерживает контекст и способна проводить более глубокие исследования в интернете.
Появилась и новая функция управления процессом ответа. Теперь пользователь может прервать генерацию в середине ответа и изменить направление работы модели, добавив новые инструкции.
Функция управления ответом уже начинает появляться в веб-версии ChatGPT и на Android. Поддержка iOS ожидается немного позже.
https://x.com/openai/status/2029620624923189283?s=46
@ai_machinelearning_big_data
Также GPT-5.4 стала доступна разработчикам через API и в Codex. Новая версия объединяет несколько ключевых направлений развития моделей: улучшенное логическое рассуждение, более сильные возможности программирования и поддержку агентных сценариев работы.
Самое интересное:
• GPT-5.4 лидер в agentic tasks
• заметный скачок в математике
• очень сильный результат в научных задачах (GPQA)
• улучшена работа с веб-средой и инструментами
Фактически это модель, которую явно оптимизировали под агентов, инструменты и сложное reasoning, а не просто чат.
По словам компании, GPT-5.4 стала одной из самых точных и эффективных моделей. Она требует меньше токенов для выполнения задач и работает быстрее по сравнению с предыдущими версиями.
В версии ChatGPT модель GPT-5.4 Thinking получила улучшенный режим размышления: при более длительном анализе она лучше удерживает контекст и способна проводить более глубокие исследования в интернете.
Появилась и новая функция управления процессом ответа. Теперь пользователь может прервать генерацию в середине ответа и изменить направление работы модели, добавив новые инструкции.
Функция управления ответом уже начинает появляться в веб-версии ChatGPT и на Android. Поддержка iOS ожидается немного позже.
https://x.com/openai/status/2029620624923189283?s=46
@ai_machinelearning_big_data
👍9❤3😁1🤩1
🔥 Вышла модель Qwen-Image-Layered-Control-V2
Новая версия инструмента для извлечения слоёв из изображений с управлением через кисть. Модель построена поверх оригинальной Qwen-Image-Layered-Control и позволяет точнее выделять элементы на иллюстрациях и постерах.
Теперь можно управлять слоями прямо на изображении:
Красная кисть показывает какой слой нужно извлечь.
Зелёная кисть отмечает что нужно удалить.
Если области пересекаются, они отображаются жёлтым.
Также продолжает работать текстовое управление:
prompt — описывает, что нужно извлечь.
negative_prompt — что нужно исключить.
Кисти и текст можно свободно комбинировать, что даёт больше контроля при работе со слоями.
Рекомендуемые настройки: около 10 шагов инференса.
Если используется управление кистью, можно поставить cfg_scale=1, чтобы значительно ускорить генерацию.
Лучше всего модель работает с постерами и иллюстрациями, где объекты изначально разделены на слои. Для фотографий с тенями и сложным освещением она не предназначена.
Модель обучена на датасете PrismLayersPro и распространяется как LoRA, которая загружается поверх базовой версии V1.
🟢 Model: https://modelscope.ai/models/DiffSynth-Studio/Qwen-Image-Layered-Control-V2
🟢 Dataset: https://modelscope.cn/datasets/artplus/PrismLayersPro
🟢 GitHub: https://github.com/modelscope/DiffSynth-Studio
@pythonl
Новая версия инструмента для извлечения слоёв из изображений с управлением через кисть. Модель построена поверх оригинальной Qwen-Image-Layered-Control и позволяет точнее выделять элементы на иллюстрациях и постерах.
Теперь можно управлять слоями прямо на изображении:
Красная кисть показывает какой слой нужно извлечь.
Зелёная кисть отмечает что нужно удалить.
Если области пересекаются, они отображаются жёлтым.
Также продолжает работать текстовое управление:
prompt — описывает, что нужно извлечь.
negative_prompt — что нужно исключить.
Кисти и текст можно свободно комбинировать, что даёт больше контроля при работе со слоями.
Рекомендуемые настройки: около 10 шагов инференса.
Если используется управление кистью, можно поставить cfg_scale=1, чтобы значительно ускорить генерацию.
Лучше всего модель работает с постерами и иллюстрациями, где объекты изначально разделены на слои. Для фотографий с тенями и сложным освещением она не предназначена.
Модель обучена на датасете PrismLayersPro и распространяется как LoRA, которая загружается поверх базовой версии V1.
@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
❤15🔥4👍1😁1
🎥 Helios: Модель генерации видео в реальном времени
Helios — это передовая модель генерации видео, способная создавать высококачественные видео длительностью в минуты с частотой 19.5 FPS на одном GPU H100. Она не использует традиционные методы борьбы с дрейфом и стандартные техники ускорения, что делает её уникальной в своем роде.
🚀Основные моменты:
- Генерация видео без анти-дрифтовых стратегий.
- Высокая скорость 19.5 FPS без стандартных ускоряющих техник.
- Оптимизация, уменьшающая потребление памяти и увеличивающая производительность.
- Поддержка нескольких моделей в рамках 80 ГБ видеопамяти.
- Официальная реализация с открытым исходным кодом.
📌 GitHub: https://github.com/PKU-YuanGroup/Helios
🐍 Python полезные ресурсы 🚀Max
@pythonl
Helios — это передовая модель генерации видео, способная создавать высококачественные видео длительностью в минуты с частотой 19.5 FPS на одном GPU H100. Она не использует традиционные методы борьбы с дрейфом и стандартные техники ускорения, что делает её уникальной в своем роде.
🚀Основные моменты:
- Генерация видео без анти-дрифтовых стратегий.
- Высокая скорость 19.5 FPS без стандартных ускоряющих техник.
- Оптимизация, уменьшающая потребление памяти и увеличивающая производительность.
- Поддержка нескольких моделей в рамках 80 ГБ видеопамяти.
- Официальная реализация с открытым исходным кодом.
📌 GitHub: https://github.com/PKU-YuanGroup/Helios
🐍 Python полезные ресурсы 🚀Max
@pythonl
❤8🔥3👍1
NiceGUI — это простой в использовании фреймворк на основе Python, который отображается в вашем веб-браузере.
Вы можете создавать кнопки, диалоговые окна, Markdown, 3D-сцены, графики и многое другое.
https://github.com/zauberzeug/nicegui
🐍 Python полезные ресурсы 🚀Max
@pythonl
Вы можете создавать кнопки, диалоговые окна, Markdown, 3D-сцены, графики и многое другое.
https://github.com/zauberzeug/nicegui
🐍 Python полезные ресурсы 🚀Max
@pythonl
👍17🔥6❤2🤩1
Языки программирования и их инструкции импорта
🐍 Python - import module
☕ Java - import package.Class;
⚡ C - #include <stdio.h>
🛠️ C++ - #include <iostream>
🌐 JavaScript - import module from "module"
🛠️ C# - using Namespace;
🐹 Go - import "package"
🦀 Rust - use crate::module;
🐘 PHP - require "file.php";
💎 Ruby - require "library"
🐪 Kotlin - import package.Class
🍎 Swift - import Module
🔷 TypeScript - import {x} from "module"
🧮 R - library(package)
🐚 Bash - source file.sh
🧱 Dart - import 'package:lib/lib.dart';
🎯 Scala - import package.Class
🐼 Groovy - import package.Class
🧠 Julia - using Module
🔧 Assembly (x86 Linux) - %include "file.inc"
🐍 Python полезные ресурсы 🚀Max
@pythonl
🐍 Python - import module
☕ Java - import package.Class;
⚡ C - #include <stdio.h>
🛠️ C++ - #include <iostream>
🌐 JavaScript - import module from "module"
🛠️ C# - using Namespace;
🐹 Go - import "package"
🦀 Rust - use crate::module;
🐘 PHP - require "file.php";
💎 Ruby - require "library"
🐪 Kotlin - import package.Class
🍎 Swift - import Module
🔷 TypeScript - import {x} from "module"
🧮 R - library(package)
🐚 Bash - source file.sh
🧱 Dart - import 'package:lib/lib.dart';
🎯 Scala - import package.Class
🐼 Groovy - import package.Class
🧠 Julia - using Module
🔧 Assembly (x86 Linux) - %include "file.inc"
🐍 Python полезные ресурсы 🚀Max
@pythonl
❤10👍5🔥3
🔥 Андрей Карпати выложил в open-source проект autoresearch.
Идея проста, но мощная: агент может запускать до 100 ML-экспериментов за ночь на одном GPU. Он сам пишет код, запускает обучение, анализирует результат, улучшает архитектуру и сохраняет только то, что работает.
Роль человека в этой системе минимальна.
Всё, что нужно поддерживать - один файл `program.md`, в котором описана стратегия исследования:
что исследовать, какие идеи приоритетнее, какие компромиссы важны.
Агент читает этот файл, рассуждает над ним и сам решает, какой эксперимент запускать следующим.
Как работает система:
- автономный git-цикл — агент коммитит каждое улучшение
- каждый эксперимент длится ровно 5 минут, чтобы сравнение было честным
- оптимизируются архитектура, гиперпараметры и оптимизатор
- человек редактирует стратегию
- агент редактирует код
- всё работает на одном GPU
Главная мысль проекта:
узкое место в AI-исследованиях - уже не вычисления, а идея эксперимента.
В autoresearch этим bottleneck становится всего один файл -
github.com/karpathy/autoresearch
🐍 Python полезные ресурсы 🚀Max
@pythonl
Идея проста, но мощная: агент может запускать до 100 ML-экспериментов за ночь на одном GPU. Он сам пишет код, запускает обучение, анализирует результат, улучшает архитектуру и сохраняет только то, что работает.
Роль человека в этой системе минимальна.
Всё, что нужно поддерживать - один файл `program.md`, в котором описана стратегия исследования:
что исследовать, какие идеи приоритетнее, какие компромиссы важны.
Агент читает этот файл, рассуждает над ним и сам решает, какой эксперимент запускать следующим.
Как работает система:
- автономный git-цикл — агент коммитит каждое улучшение
- каждый эксперимент длится ровно 5 минут, чтобы сравнение было честным
- оптимизируются архитектура, гиперпараметры и оптимизатор
- человек редактирует стратегию
- агент редактирует код
- всё работает на одном GPU
Главная мысль проекта:
узкое место в AI-исследованиях - уже не вычисления, а идея эксперимента.
В autoresearch этим bottleneck становится всего один файл -
program.md.github.com/karpathy/autoresearch
🐍 Python полезные ресурсы 🚀Max
@pythonl
❤20👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🎙 TADA (Text Audio Dual Alignment) - речевая AI-система нового типа.
Она генерирует текст и аудио одновременно в одном синхронизированном потоке.
Это позволяет снизить галлюцинации на уровне токенов и значительно уменьшить задержку.
Что показали тесты:
→ 0 галлюцинаций контента на 1000+ тестовых примеров
→ в 5 раз быстрее, чем похожие LLM-решения для TTS
→ намного длиннее аудио: 2048 токенов покрывают ~700 секунд речи (в обычных системах около 70 секунд)
→ транскрипт генерируется сразу вместе с аудио без дополнительной задержки
По сути, модель думает текстом и голосом одновременно, что делает генерацию речи быстрее и точнее.
https://huggingface.co/collections/HumeAI/tada
🐍 Python полезные ресурсы 🚀Max
@pythonl
Она генерирует текст и аудио одновременно в одном синхронизированном потоке.
Это позволяет снизить галлюцинации на уровне токенов и значительно уменьшить задержку.
Что показали тесты:
→ 0 галлюцинаций контента на 1000+ тестовых примеров
→ в 5 раз быстрее, чем похожие LLM-решения для TTS
→ намного длиннее аудио: 2048 токенов покрывают ~700 секунд речи (в обычных системах около 70 секунд)
→ транскрипт генерируется сразу вместе с аудио без дополнительной задержки
По сути, модель думает текстом и голосом одновременно, что делает генерацию речи быстрее и точнее.
https://huggingface.co/collections/HumeAI/tada
🐍 Python полезные ресурсы 🚀Max
@pythonl
❤10👍4🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
Многие думают, что язык программирования можно сделать быстро. Но на практике на это уходят годы. Rust разрабатывали девять лет, Kotlin и C++ около шести, Go и Java примерно пять. Даже Python готовили два года перед первым релизом.
Есть знаменитое исключение - JavaScript. Его написали всего за десять дней в 1995 году, и многие странности языка до сих пор связаны именно с такой скоростью разработки.
Это хороший пример того, что создание фундаментального инструмента требует времени и большого количества экспериментов.
🦀 Rust - 9 лет (2006 → 2015)
🤖 Kotlin - 6 лет (2010 → 2016)
⚙️ C++ - 6 лет (1979 → 1985)
☕ Java - 5 лет (1991 → 1996)
🐹 Go - 5 лет (2007 → 2012)
🍎 Swift - 4 года (2010 → 2014)
🔧 C - 3 года (1969 → 1972)
🧬 Scala - 3 года (2001 → 2004)
📊 Julia - 3 года (2009 → 2012)
🐍 Python - 2 года (1989 → 1991)
🌐 JavaScript - 10 дней (1995)
💎 Ruby - 2 года (1993 → 1995)
🐘 PHP - 1 год (1994 → 1995)
🔷 C# - 2 года (1998 → 2000)
🎯 TypeScript - 2 года (2010 → 2012)
🎯 Dart - 2 года (2009 → 2011)
⚡ Elixir - 2 года (2011 → 2013)
🧠 Haskell - 3 года (1987 → 1990)
🧩 Objective-C - 1 год (1983 → 1984)
🐍 Python полезные ресурсы 🚀Max
@pythonl
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥21👍6❤3