PewDiePie продолжает вайбкодить: 15тыс звёзд на GitHub менее чем за 24 часа.
Он назвал его Odysseus и это своего рода аналог ChatGPT и Claude, но ориентированный на локальный запуск ИИ. Сейчас он стремительно набирает популярность.👃
Он описывает его как «селф-хост интерфейс для работы с языковыми моделями», в котором есть чат, автономные агенты, инструменты, запуск и обслуживание моделей, почта, ресёрч и другие возможности.
https://github.com/pewdiepie-archdaemon/odysseus
👉 @PythonPortal
Он назвал его Odysseus и это своего рода аналог ChatGPT и Claude, но ориентированный на локальный запуск ИИ. Сейчас он стремительно набирает популярность.
Он описывает его как «селф-хост интерфейс для работы с языковыми моделями», в котором есть чат, автономные агенты, инструменты, запуск и обслуживание моделей, почта, ресёрч и другие возможности.
https://github.com/pewdiepie-archdaemon/odysseus
Please open Telegram to view this post
VIEW IN TELEGRAM
❤23👍5🏆3😢2
This media is not supported in your browser
VIEW IN TELEGRAM
DuckDuckGo официально добавила режим No-AI 🦆
Он автоматически отключает AI-функции и скрывает AI-сгенерированные изображения из результатов поиска.
Что входит:
→ Без AI-ответов в поиске
→ Без Duck.ai и AI-чата
→ Фильтрация AI-сгенерированных изображений
→ Обычная выдача без AI-вставок
Забавно наблюдать, как после нескольких лет гонки за внедрением ИИ поисковики начали добавлять кнопку «выключить ИИ».
Похоже, классический поиск снова стал фичей :)
👉 @PythonPortal
Он автоматически отключает AI-функции и скрывает AI-сгенерированные изображения из результатов поиска.
Что входит:
→ Без AI-ответов в поиске
→ Без Duck.ai и AI-чата
→ Фильтрация AI-сгенерированных изображений
→ Обычная выдача без AI-вставок
Забавно наблюдать, как после нескольких лет гонки за внедрением ИИ поисковики начали добавлять кнопку «выключить ИИ».
Похоже, классический поиск снова стал фичей :)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥59❤17👍16
Наткнулся на open-source PDF-парсер, который конвертирует PDF в Markdown со скоростью до 100 страниц в секунду.
На CPU.
Без GPU, облака и API-ключей.
Что умеет:
• Таблицы
• Сложные макеты документов
• Вложенные структуры
• OCR для 80+ языков
• Интеграция с LangChain
Называется OpenDataLoader.
По бенчмаркам авторов сейчас занимает первое место среди PDF → Markdown решений.
Для контекста:
• Docling показывает хорошие результаты, но работает примерно в 15 раз медленнее
• Marker требует GPU и значительно медленнее
• PyMuPDF4LLM быстрый, но заметно хуже справляется с таблицами
Отдельно удивило, что проект делали вместе с PDF Association и командой veraPDF.
То есть не просто очередной AI-стартап с громкими заявлениями, а люди, которые много лет работают с самим PDF-форматом.
Если собираете RAG, индексируете документацию или регулярно разбираете PDF-файлы, выглядит как проект, на который стоит посмотреть.
https://github.com/opendataloader-project/opendataloader-pdf
👉 @PythonPortal
На CPU.
Без GPU, облака и API-ключей.
Что умеет:
• Таблицы
• Сложные макеты документов
• Вложенные структуры
• OCR для 80+ языков
• Интеграция с LangChain
Называется OpenDataLoader.
По бенчмаркам авторов сейчас занимает первое место среди PDF → Markdown решений.
Для контекста:
• Docling показывает хорошие результаты, но работает примерно в 15 раз медленнее
• Marker требует GPU и значительно медленнее
• PyMuPDF4LLM быстрый, но заметно хуже справляется с таблицами
Отдельно удивило, что проект делали вместе с PDF Association и командой veraPDF.
То есть не просто очередной AI-стартап с громкими заявлениями, а люди, которые много лет работают с самим PDF-форматом.
Если собираете RAG, индексируете документацию или регулярно разбираете PDF-файлы, выглядит как проект, на который стоит посмотреть.
https://github.com/opendataloader-project/opendataloader-pdf
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - opendataloader-project/opendataloader-pdf: PDF Parser for AI-ready data. Automate PDF accessibility. Open-source.
PDF Parser for AI-ready data. Automate PDF accessibility. Open-source. - opendataloader-project/opendataloader-pdf
👍11❤4🔥1
14-дневный туториал, где ты с нуля собираешь на Python code-agent CLI в стиле Claude Code и параллельно разбираешь, как вообще работает Agent Harness.
В итоге ты не просто вызываешь готового агента через API, а понимаешь, из каких деталей собирается Claude Code-подобный инструмент.
https://github.com/bozhouDev/14days-build-claude-code-cli
👉 @PythonPortal
В итоге ты не просто вызываешь готового агента через API, а понимаешь, из каких деталей собирается Claude Code-подобный инструмент.
https://github.com/bozhouDev/14days-build-claude-code-cli
Please open Telegram to view this post
VIEW IN TELEGRAM
GitHub
GitHub - bozhouDev/14days-build-claude-code-cli: 网页版教程,看起来会舒服一点
网页版教程,看起来会舒服一点. Contribute to bozhouDev/14days-build-claude-code-cli development by creating an account on GitHub.
❤10
Перестаньте изучать LLM по случайным статьям и видео, которые объясняют только отдельные куски картины.
LLM from Scratch — это практический курс на PyTorch для тех, кто хочет понять весь путь современной LLM: от первого Transformer-блока до RLHF.
Вместо бесконечной теории здесь собирают полноценную цепочку обучения модели:
• Pretraining → Finetuning → Alignment в одном курсе
• Transformer с нуля: positional embeddings, self-attention, multi-head attention, MLP, residual connections, LayerNorm и полные Transformer-блоки
• Собственный training loop без Trainer-магии: токенизация, батчи, cross-entropy, validation loss, генерация текста
• Современные улучшения архитектуры: RMSNorm, RoPE, SwiGLU, KV Cache, sliding-window attention и streaming cache
• Полный раздел по alignment: SFT, reward models, PPO-style RLHF и GRPO с разбором того, как это выглядит в тренировочном цикле на практике
https://github.com/vivekkalyanarangan30/llm_from_scratch
👉 @PythonPortal
LLM from Scratch — это практический курс на PyTorch для тех, кто хочет понять весь путь современной LLM: от первого Transformer-блока до RLHF.
Вместо бесконечной теории здесь собирают полноценную цепочку обучения модели:
• Pretraining → Finetuning → Alignment в одном курсе
• Transformer с нуля: positional embeddings, self-attention, multi-head attention, MLP, residual connections, LayerNorm и полные Transformer-блоки
• Собственный training loop без Trainer-магии: токенизация, батчи, cross-entropy, validation loss, генерация текста
• Современные улучшения архитектуры: RMSNorm, RoPE, SwiGLU, KV Cache, sliding-window attention и streaming cache
• Полный раздел по alignment: SFT, reward models, PPO-style RLHF и GRPO с разбором того, как это выглядит в тренировочном цикле на практике
https://github.com/vivekkalyanarangan30/llm_from_scratch
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤3
Кто-то взял Perplexity и сделал его локальным: https://github.com/ItzCrazyKns/Vane
Называется Vane.
35K+ звёзд на GitHub, MIT-лицензия, запускается у себя на машине и не требует подписки за $20/мес.
Что умеет:
• веб-поиск с источниками
• поиск по научным статьям и форумам
• вопросы по PDF-файлам
• Ollama, OpenAI, Claude и Gemini из коробки
• режимы Speed / Balanced / Quality
Самое интересное: всё может работать локально без отправки данных в облако.
По сути, open-source Perplexity для тех, кто хочет держать поиск, модели и документы под своим контролем.
👉 @PythonPortal
Называется Vane.
35K+ звёзд на GitHub, MIT-лицензия, запускается у себя на машине и не требует подписки за $20/мес.
Что умеет:
• веб-поиск с источниками
• поиск по научным статьям и форумам
• вопросы по PDF-файлам
• Ollama, OpenAI, Claude и Gemini из коробки
• режимы Speed / Balanced / Quality
Самое интересное: всё может работать локально без отправки данных в облако.
По сути, open-source Perplexity для тех, кто хочет держать поиск, модели и документы под своим контролем.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤8👀6
Как создать собственный контекстный менеджер в Python для открытия и закрытия соединения с базой данных SQLite
Метод
👉 @PythonPortal
Метод
__enter__() используется при открытии соединения, а метод __exit__() — при его закрытии:Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Наткнулся на один из самых отполированных File Tree компонентов, которые видел за последнее время
https://trees.software/
Называется Trees. Это open-source файловое дерево для приложений, которым нужен интерфейс уровня IDE, а не очередной список div-ов, замаскированный под проводник.
Из коробки:
→ поиск по файлам
→ drag-and-drop
→ выбор файлов и директорий
→ Git-статусы
→ нормальная навигация по дереву
Подходит для редакторов кода, девтулзов, файловых менеджеров и любых приложений, где пользователи работают с файлами.
Одна из тех библиотек, после которых резко пропадает желание писать собственный file explorer на выходных.
👉 @PythonPortal
https://trees.software/
Называется Trees. Это open-source файловое дерево для приложений, которым нужен интерфейс уровня IDE, а не очередной список div-ов, замаскированный под проводник.
Из коробки:
→ поиск по файлам
→ drag-and-drop
→ выбор файлов и директорий
→ Git-статусы
→ нормальная навигация по дереву
Подходит для редакторов кода, девтулзов, файловых менеджеров и любых приложений, где пользователи работают с файлами.
Одна из тех библиотек, после которых резко пропадает желание писать собственный file explorer на выходных.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤11🤣3🌭1
От школьной алгебры до линейной алгебры и математической базы для ML.
Что есть внутри:
𝗕𝗮𝘀𝗶𝗰𝘀
• Statistics — полный университетский курс по статистике и основам Data Science
𝗙𝗼𝗿 𝗔𝗜 / 𝗠𝗟
• Linear Algebra for Machine Learning and Generative AI
𝗠𝗮𝘁𝗵 𝗣𝗮𝘁𝗵
• College Algebra
• Precalculus
• Calculus I
• Linear Algebra
• College Algebra с примерами на Python
👉 @PythonPortal
Что есть внутри:
𝗕𝗮𝘀𝗶𝗰𝘀
• Statistics — полный университетский курс по статистике и основам Data Science
𝗙𝗼𝗿 𝗔𝗜 / 𝗠𝗟
• Linear Algebra for Machine Learning and Generative AI
𝗠𝗮𝘁𝗵 𝗣𝗮𝘁𝗵
• College Algebra
• Precalculus
• Calculus I
• Linear Algebra
• College Algebra с примерами на Python
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16👍3😢1
Без лишних слов: https://github.com/rohitg00/ai-engineering-from-scratch
👉 @PythonPortal
Phase 00: Setup & Tooling (12 lessons)
Phase 01: Math Foundations (22 lessons)
Phase 02: ML Fundamentals (18 lessons)
Phase 03: Deep Learning Core (13 lessons)
Phase 04: Computer Vision (28 lessons)
Phase 05: NLP (29 lessons)
Phase 06: Speech & Audio (17 lessons)
Phase 07: Transformers Deep Dive (14 lessons)
Phase 08: Generative AI (14 lessons)
Phase 09: Reinforcement Learning (12 lessons)
Phase 10: LLMs from Scratch (22 lessons)
Phase 11: LLM Engineering (15 lessons)
Phase 12: Multimodal AI (25 lessons)
Phase 13: Tools & Protocols (23 lessons)
Phase 14: Agent Engineering (42 lessons)
Phase 15: Autonomous Systems (22 lessons)
Phase 16: Multi-Agent & Swarms (25 lessons)
Phase 17: Infrastructure & Production (28 lessons)
Phase 18: Ethics, Safety & Alignment (30 lessons)
Phase 19: Capstone Projects (85 lessons)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12
Please open Telegram to view this post
VIEW IN TELEGRAM
😢38😁22❤4
Google выложила исследование, которое может пошатнуть монополию трансформеров.
Последние 7 лет почти все крупные модели, от ChatGPT и Claude до Gemini, строились на одной и той же архитектуре: Transformer.
Проблема в том, что у трансформеров дорогая память. Чтобы учитывать контекст, они сравнивают каждый токен со всеми остальными. Из-за этого вычислительная стоимость растёт квадратично вместе с длиной контекста.
Альтернатива существует давно: RNN. Они быстрые, дешёвые и работают линейно, но страдают от другой проблемы.
Чем длиннее последовательность, тем больше информации они забывают.
Google предлагает компромисс.
В работе Memory Caching: RNNs with Growing Memory исследователи добавили RNN возможность сохранять промежуточные состояния в кэш по мере обработки последовательности.
Вместо фиксированной памяти модель получает память, которая может расти вместе с длиной контекста.
Авторы реализовали несколько вариантов механизма, включая выборочное сохранение состояний, где модель сама решает, какие участки контекста стоит запомнить.
На задачах с длинным контекстом и интенсивным использованием памяти такие Memory-Cached RNN заметно сократили разрыв с трансформерами.
При этом им не требуется платить квадратичную цену за обработку всей истории на каждом шаге.
Самая интересная мысль из статьи: возможно, для длинных диалогов и больших контекстов необязательно постоянно прогонять всю историю через attention.
Если подход масштабируется так же хорошо, как выглядит на бумаге, нас может ждать первая за долгое время серьёзная альтернатива Transformer-архитектуре.
https://arxiv.org/pdf/2602.24281
👉 @PythonPortal
Последние 7 лет почти все крупные модели, от ChatGPT и Claude до Gemini, строились на одной и той же архитектуре: Transformer.
Проблема в том, что у трансформеров дорогая память. Чтобы учитывать контекст, они сравнивают каждый токен со всеми остальными. Из-за этого вычислительная стоимость растёт квадратично вместе с длиной контекста.
Альтернатива существует давно: RNN. Они быстрые, дешёвые и работают линейно, но страдают от другой проблемы.
Чем длиннее последовательность, тем больше информации они забывают.
Google предлагает компромисс.
В работе Memory Caching: RNNs with Growing Memory исследователи добавили RNN возможность сохранять промежуточные состояния в кэш по мере обработки последовательности.
Вместо фиксированной памяти модель получает память, которая может расти вместе с длиной контекста.
Авторы реализовали несколько вариантов механизма, включая выборочное сохранение состояний, где модель сама решает, какие участки контекста стоит запомнить.
На задачах с длинным контекстом и интенсивным использованием памяти такие Memory-Cached RNN заметно сократили разрыв с трансформерами.
При этом им не требуется платить квадратичную цену за обработку всей истории на каждом шаге.
Самая интересная мысль из статьи: возможно, для длинных диалогов и больших контекстов необязательно постоянно прогонять всю историю через attention.
Если подход масштабируется так же хорошо, как выглядит на бумаге, нас может ждать первая за долгое время серьёзная альтернатива Transformer-архитектуре.
https://arxiv.org/pdf/2602.24281
Please open Telegram to view this post
VIEW IN TELEGRAM
❤25👍6
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
Наткнулся на Agentic Design Patterns — бесплатный документ на 421 страницу от старшего инженера Google.
Редко встретишь материалы такого объёма, где автор не пытается продать курс после каждой главы.
Внутри:
⬩ агентные архитектуры
⬩ multi-agent системы
⬩ memory и управление контекстом
⬩ оркестрация и планирование задач
⬩ инструменты, MCP и интеграции
⬩ production-кейсы и примеры кода
https://drive.google.com/file/d/1-5ho2aSZ-z0FcW8W_jMUoFSQ5hTKvJ43/view
👉 @PythonPortal
Редко встретишь материалы такого объёма, где автор не пытается продать курс после каждой главы.
Внутри:
⬩ агентные архитектуры
⬩ multi-agent системы
⬩ memory и управление контекстом
⬩ оркестрация и планирование задач
⬩ инструменты, MCP и интеграции
⬩ production-кейсы и примеры кода
https://drive.google.com/file/d/1-5ho2aSZ-z0FcW8W_jMUoFSQ5hTKvJ43/view
Please open Telegram to view this post
VIEW IN TELEGRAM
❤14
This media is not supported in your browser
VIEW IN TELEGRAM
По слухам, OpenAI готовит что-то вроде единого приложения вокруг ChatGPT.
Если утечки окажутся правдой, в одном месте могут объединить:
• ChatGPT — для работы с текстом, исследованиями, планированием и повседневных задач
• Codex — для программирования, отладки, автоматизации и разработки приложений
• Atlas — браузер с агентными возможностями для работы с сайтами и веб-сервисами
• Computer Use — агентов, которые могут работать с полноценным рабочим столом и приложениями
Если посмотреть на это со стороны, то идея уже не выглядит как «ещё один чат-бот».
Скорее как попытка собрать всё в одном интерфейсе.
Вместо отдельных приложений для поиска, кода, браузера и автоматизации — одна точка входа, через которую можно искать информацию, писать код, работать с сайтами и запускать задачи.
Интересно будет посмотреть, насколько далеко OpenAI действительно пойдёт в этом направлении.
👉 @PythonPortal
Если утечки окажутся правдой, в одном месте могут объединить:
• ChatGPT — для работы с текстом, исследованиями, планированием и повседневных задач
• Codex — для программирования, отладки, автоматизации и разработки приложений
• Atlas — браузер с агентными возможностями для работы с сайтами и веб-сервисами
• Computer Use — агентов, которые могут работать с полноценным рабочим столом и приложениями
Если посмотреть на это со стороны, то идея уже не выглядит как «ещё один чат-бот».
Скорее как попытка собрать всё в одном интерфейсе.
Вместо отдельных приложений для поиска, кода, браузера и автоматизации — одна точка входа, через которую можно искать информацию, писать код, работать с сайтами и запускать задачи.
Интересно будет посмотреть, насколько далеко OpenAI действительно пойдёт в этом направлении.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9
Please open Telegram to view this post
VIEW IN TELEGRAM
❤44🔥10👍3
Наткнулся на пост от автора Ruff (очень быстрого линтера и форматтера для Python)
Он пишет, что редко смотрит технические доклады, но "A Practical Guide to Applying Data-Oriented Design" от Andrew Kelley оказал на него большое влияние.
Причём впервые он посмотрел этот доклад примерно тогда, когда начинал работать над Ruff.
Иногда один хороший доклад даёт больше пользы, чем десятки часов случайных видео на YouTube.😊
👉 @PythonPortal
Он пишет, что редко смотрит технические доклады, но "A Practical Guide to Applying Data-Oriented Design" от Andrew Kelley оказал на него большое влияние.
Причём впервые он посмотрел этот доклад примерно тогда, когда начинал работать над Ruff.
Иногда один хороший доклад даёт больше пользы, чем десятки часов случайных видео на YouTube.
Please open Telegram to view this post
VIEW IN TELEGRAM
1❤6