Python_BE1
9 subscribers
748 photos
251 videos
7 files
672 links
Канал по Python, полезный и интересный контент для всех уровней.
По вопросам сотрудничества @cyberJohnny
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 GPT-5 прошёл Pokémon Red!

6 470 шагов против 18 184 у o3 — колоссальный прогресс в эффективности.

• GPT-5 гораздо реже «галлюцинирует» — главный фактор ускорения.
• Лучшая пространственная логика: o3 часто пытался «пробиться» сквозь стены и путался в сложных локациях, а GPT-5 умеет планировать длинные последовательности действий с минимумом ошибок.
• Более чёткое планирование целей и их последовательное выполнение.

Теперь посмотрим, как он справится с финальным испытанием! 🔥

🔜 Следующий челлендж: GPT-5 играет Pokémon Crystal. Старт скоро на Twitch!

Livestream: https://twitch.tv/gpt_plays_pokemon

@python_be1
Еще одна полезная команда для системных администраторов — 'nc', или Netcat. Эта утилита позволяет отправлять и получать данные по сетевым соединениям, и может использоваться для множества задач: от отладки сетевых сервисов до создания простых чатов. Например, с помощью 'nc -l -p <порт>' вы можете создать прослушивающий сокет, который будет ждать входящих соединений. Это дает вам возможность протестировать, как ваши приложения взаимодействуют по сети, и выявлять проблемы с подключениями. Также 'nc' может быть использован для передачи файлов между машинами или для создания туннелей, что делает его настоящим швейцарским армейским ножом для сетевых администраторов.

@python_be1
Если вы хотите оптимизировать операции с множествами в Python, обратите внимание на использование 'frozenset'. Этот неизменяемый аналог обычного 'set' может быть использован в качестве ключей в словарях, что расширяет ваши возможности работы с данными. Например, вместо использования обычного множества в качестве ключа, создайте 'frozenset', чтобы избежать ошибок, связанных с изменяемостью. Это также позволяет создавать более сложные структуры данных, обеспечивая при этом неизменяемость. Пример создания 'frozenset': 'frozen_set = frozenset([1, 2, 3])'. С его помощью вы сможете легко проверять наличие элементов и выполнять другие операции над множествами.

@python_be1
🚀 Ускоряем работу с данными с помощью Delta Lake

Когда нужно добавить новые данные к уже существующему набору, есть два подхода:

🔴 Без Delta Lake
- Сначала загружаешь все старые данные (например, 10 000 записей) из CSV.
- Загружаешь новые данные (например, 50 записей).
- Объединяешь их, что требует обработки всех 10 050 записей.
- Это медленно, расходует память и ресурсы.

🟢 С Delta Lake
- Хранишь данные в формате Delta Lake.
- Загружаешь только новые записи (например, 50 штук).
- Добавляешь их напрямую в существующую таблицу с помощью `append`, обрабатывая только новые данные.
- Экономия времени, памяти и ресурсов.

💡 Преимущества Delta Lake:
- Инкрементальная загрузка данных.
- Работа с большими объёмами без полной перезагрузки.
- Поддержка транзакций (ACID).
- Совместимость с большими дата-платформами (Spark, Pandas и др.).

📊 Если у тебя миллионы строк — выигрыш в скорости будет колоссальным.

@python_be1
Только что в России начали работать нейросети от Google — без обхода блокировок и без смены региона.

Пробуем тут. (https://gemini.google.com/app)

@python_be1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 ByteDance выкатили **UI-TARS Desktop** — опенсорсный AI-агент для управления рабочим столом
📌 Что умеет:
- Управлять любыми приложениями через язык — клики, ввод текста, навигация
- Работает локально, бесплатно и под лицензией Apache 2.0
- Поддержка Windows и macOS (Linux в разработке)
- Новое в v0.2.0 — удалённое управление компьютером и браузером (пока только для материкового Китая)

📌 Зачем нужен:
- Локальный и приватный ассистент без облака
- Полезен для RPA, автоматизации и тестирования
- Основан на визуально-языковой модели, которая распознаёт интерфейсы и взаимодействует с ними

📂 Код: github.com/bytedance/UI-TARS-desktop

@python_be1
🧪 uQLM — движок для SQL‑запросов к LLM, разработанный в CVS Health

Что если к языковой модели можно обращаться как к обычной базе данных?

💡 uQLM (Universal Query Language for Models) позволяет писать SQL‑подобные запросы, чтобы:

Обращаться к LLM как к таблице
Фильтровать, агрегировать и комбинировать ответы
Подключать собственные модели и источники данных
Использовать привычный синтаксис SQL без prompt-инженерии

📌 Пример запроса:
```

SELECT generate_response(prompt)
FROM gpt4
WHERE prompt LIKE '%explain%'
LIMIT 5;

```

uQLM работает как прослойка между пользователем и языковой моделью, облегчая интеграцию ИИ в аналитические пайплайны.

🔗 GitHub: https://github.com/cvs-health/uqlm

@python_be1
😂MrBeast устраивает (https://nomusica.com/mrbeast-announces-1-million-coding-challenge-for-software-engineers/) конкурс для разработчиков, лол

Сообщается, что в конкурсе примут участие 100 инженеров-программистов, работающих без доступа к Cursor

@python_be1
🐍 Почему Python `deepcopy()` такой медленный и что использовать вместо

Функция `copy.deepcopy()` кажется удобной: она создаёт полную копию объекта со всеми вложенными структурами. Но на практике она часто оказывается очень медленной и становится бутылочным горлышком в проектах. Давайте разберёмся почему так происходит и какие есть альтернативы.

🔥 Почему `deepcopy()` тормозит
1. Рекурсия на всём дереве объектов
Python проходит по каждому вложенному элементу, даже если их сотни тысяч.

2. Определение метода копирования
Для каждого объекта проверяется, можно ли вызвать `__deepcopy__`, или приходится идти стандартным путём.

3. Memo-словарь для ссылок
Чтобы избежать бесконечных циклов при копировании (например, объект ссылается сам на себя), Python ведёт словарь уже скопированных элементов. Это полезно, но замедляет работу.

4. Реализация на чистом Python
В отличие от сериализации (`pickle`), `deepcopy()` не ускорена на уровне C, поэтому работает медленнее.

📊 Пример замеров скорости
```

import copy, pickle, time

data = [[i for i in range(1000)] for _ in range(1000)]

# deepcopy
start = time.time()
a = copy.deepcopy(data)
print("deepcopy:", time.time() - start)

```
```

# pickle
start = time.time()
b = pickle.loads(pickle.dumps(data))
print("pickle roundtrip:", time.time() - start)

```

```python
# list comprehension (для списков списков)
start = time.time()
c = [sub[ for sub in data]
print("manual copy:", time.time() - start)
````
`
💻 Результат (у вас может отличаться, но смысл тот же):

- d`eepcopy:` ~2.5 сек
- p`ickle:` ~0.8 сек
- р`учное копирование:` ~0.02 сек (!)

Когда что использовать

copy.deepcopy()
Подходит, если структура очень сложная, а вам нужна стопроцентно независимая копия.

pickle.loads(pickle.dumps(obj))
Быстрее на больших структурах, плюс удобно, если данные нужно сохранять.

json.loads(json.dumps(obj))
Хорошо для простых словарей и списков с базовыми типами.

Ручное копирование (list comprehension, dict comprehension)
Лучший вариант, если вы знаете структуру данных и хотите максимум скорости.

📌 Итог
d`eepcopy() `— это универсальный инструмент, но он платит за универсальность скоростью.
Если важна производительность — используйте сериализацию или ручные методы копирования, они могут быть в десятки и сотни раз быстрее.

Ставь 🔥, сохраняй себе в копилку Python-трюков, чтобы не забыть 😉

@python_be1
Chatgpt- гений

@python_be1
🎙️ NVIDIA выпустили Canary-1B v2 — открытую модель для распознавания и перевода речи, которая работает с 25 европейскими языками.

Что она умеет:
- 📝 Точное ASR (распознавание речи) и AST (перевод речи) между английским и 24 другими языками.
- Автоматическая пунктуация, капитализация и точные таймстампы до слова.
- Поддержка русского, французского, немецкого, испанского и многих других языков.

Чем интересна
- До 10× быстрее инференс, чем у моделей в 3 раза больше.
- Уже показывает state-of-the-art точность среди открытых моделей на Hugging Face.
- Лицензия CC-BY-4.0 — можно свободно использовать в проектах.

Под капотом:
- Архитектура: FastConformer-энкодер + Transformer-декодер (~978M параметров).
- Форматы: `.wav` и `.flac`, моно 16 кГц.
- Легко интегрируется через NVIDIA NeMo или прямо с Hugging Face.

Где пригодится:
🟢 голосовые ассистенты
🟢 субтитры и перевод видео
🟢 чат-боты с речевым вводом
🟢 real-time анализ речи

Всего ~978M параметров → легче, быстрее и дешевле в использовании, чем большие модели конкурентов.

🟠 Попробовать можно здесь: https://huggingface.co/nvidia/canary-1b-v2
🟠SET: https://huggingface.co/datasets/nvidia/Granary
🟠PARAKEET: https://huggingface.co/nvidia/parakeet-tdt-0.6b-v3

#AI #NVIDIA #SpeechRecognition #ASR #AST #Multilingual #MachineLearning #DeepLearning

@python_be1
Realtime Voice Chat (https://github.com/KoljaB/RealtimeVoiceChat) — пообщайтесь с искусственным интеллектом в естественной разговорной манере!

Этот проект позволяет вам общаться с большой языковой моделью (LLM), используя только свой голос и получая устные ответы практически в режиме реального времени.

@python_be1
🌱 Что помещается в переменную num?

@python_be1
⚡️ DeepCode — открытая AI-платформу для автоматической генерации кода.

DeepCode превращает научные статьи и технические документы в готовые проекты, включая фронтенд, бэкенд и полноценные репозитории.

🔹 Основные возможности:
• Paper2Code — реализация идей из исследований в рабочий код
• Text2Web — генерация интерфейсов по описанию
• Text2Backend — автоматическое создание масштабируемых серверов
• Поддержка длинных документов и многофайловых проектов

🔜 В ближайшее время разработчики обещают:
• Автоматическую проверку и валидацию кода
• Повышение скорости генерации
• Улучшенную работу с требованиями
• Бенчмарки воспроизведения научных статей (PaperBench)

Проект полностью open source: https://github.com/HKUDS/DeepCode

#deepcode #AI #coding

@python_be1
This media is not supported in your browser
VIEW IN TELEGRAM
Откопал годноту для кодеров — CodeViz (https://marketplace.visualstudio.com/items?itemName=CodeViz.codeviz)

Это расширение для VS Code, которое помогает визуализировать кодовую базу, создавая интерактивные карты от общей архитектуры до детальных вызовов функций

К тому же, можно задавать вопросы на естественном языке и получать наглядные диаграммы, связанные напрямую с кодом

Поддерживается множество языков программирования, базовые функции бесплатны, а продвинутые доступны по подписке ✌️

@python_be1
🐍 Изучаем MCP на Python — серия уроков от Microsoft

Пошаговое руководство для Python-разработчиков по Model Context Protocol (MCP):
как понять концепцию и построить свой MCP-сервер в интерактивном формате.

📚Репозиторий с гайдом (https://github.com/microsoft/lets-learn-mcp-python)

#python #MCP #tutorial #developers

@python_be1
GPU Memory Calculator.

Полезный калькулятор GPU, который подскажет, сможете ли вы запустить локальную LLM и насколько эффективно она будет работать

https://calculator.inference.ai/

@python_be1