Python RU

🚀Только что выпущено новое семейство моделей генерации кода Salesforce (SFR-Embedding-Code), занявшее 1-е место на бенчмарке CoIR!

Модель доступна в в 2-х размерах: 2B, 400M.

Основные характеристики:
1️⃣ Модель 2B: Занимает первое место в CoIR.
2️⃣ Модель 400M: демонстрирует лучшие показатели среди моделей на 0,5B параметров.
3️⃣ Поддерживает 12 языков программирования, Python, Java, C++, JavaScript, C# и другие!

Пример Запуска:


import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModel

# Each query needs to be accompanied by an corresponding instruction describing the task.
query_instruction_example = "Given Code or Text, retrieval relevant content"
queries = [
    "how to implement quick sort in Python?"
    ]

# No instruction needed for retrieval passages
passages = [
    "def quick_sort(arr):\n    if len(arr) <= 1:\n        return arr\n    pivot = arr[len(arr) // 2]\n    left = [x for x in arr if x < pivot]\n    middle = [x for x in arr if x == pivot]\n    right = [x for x in arr if x > pivot]\n    return quick_sort(left) + middle + quick_sort(right)",
    "def bubble_sort(arr):\n    n = len(arr)\n    for i in range(n):\n        for j in range(0, n-i-1):\n            if arr[j] > arr[j+1]:\n                arr[j], arr[j+1] = arr[j+1], arr[j]\n    return arr"
]

# load model with tokenizer
model = AutoModel.from_pretrained('Salesforce/SFR-Embedding-Code-2B_R', trust_remote_code=True)

# get the embeddings
max_length = 32768
query_embeddings = model.encode_queries(queries, instruction=query_instruction_example, max_length=max_length)
passage_embeddings = model.encode_corpus(passages, max_length=max_length)

# normalize embeddings
query_embeddings = F.normalize(query_embeddings, p=2, dim=1)
passage_embeddings = F.normalize(passage_embeddings, p=2, dim=1)

scores = (query_embeddings @ passage_embeddings.T) * 100
print(scores.tolist())

✅Документация
✅Модель 400M
✅ Модель 2B

📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.

#CodeAI #MLResearch #SOTA #OpenScience #code #llm #ml

❤4😁2👍1

3.49K views15:15

Python RU

🔥 Обобщение и переобучение в машинном обучении.

- Видео
- Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 /
- Урок6/ Урок7/ Урок 8
- Colab
-Полный курс

#ml #math #mlmath #probability #машинноеобучение

YouTube

Обобщение и переобучение в машинном обучении. Машинное обучение полный курс. Урок 9

🚀 Обобщение — это способность модели правильно работать на новых, ранее не виденных данных.
Мы разберем:
- Обобщение
- Переобучения и его причины
- Методы борьбы с переобучением

🔥 https://t.me/+CTH__X6H21JjMWJi - в нашем телеграм канале собрана вся база…

👍4

2.46K views06:27

Python RU

Forwarded from Анализ данных (Data analysis)

⚡️ Bespoke-Stratos-32B, новая ризонинг модель, разработанную на основе DeepSeek-R1 с использованием Sky-T1 от Berkeley NovaSky.

Модель превосходит Sky-T1 и o1-preview в тестах reasoning (математика и написаний кода) и почти достигает производительности DeepSeek-R1-Distill-Qwen-32B при обучении, котором было использовано 47 раз меньшее количество примеров!

Важно отметить то, что разработчики используют набор данных с открытым исходным кодом.

▪Data: https://huggingface.co/datasets/bespokelabs/Bespoke-Stratos-17k
▪Curator: https://github.com/bespokelabsai/curator/
▪32B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-32B
▪7B model: https://huggingface.co/bespokelabs/Bespoke-Stratos-7B
▪Сode: https://github.com/bespokelabsai/curator/tree/main/examples/bespoke-stratos-data-generation

@data_analysis_ml

❤1👍1

2.22K views13:10

Python RU

Forwarded from Python/ django

🖥

TinyTroupe — это экспериментальная библиотека на Python, которая позволяет моделировать взаимодействие искусственных агентов с различными личностями, интересами и целями!

🌟 Используя мощь больших языковых моделей, таких как GPT-4, TinyTroupe создаёт реалистичные симуляции поведения. Эти агенты могут общаться друг с другом, реагировать на внешние стимулы и существовать в созданных мирах.

🔐 Лицензия: MIT

🖥

Github

@pythonl

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤1

2.81K views17:21

Python RU

👎14

3.32K views05:34

Python RU

😁16🔥2🤔2

3.14K views11:01

Python RU

🖥

srsly — это библиотека для Python, предлагающая высокопроизводительные утилиты сериализации данных!

🌟 Она поддерживает несколько форматов, включая JSON, MessagePack, Pickle и YAML. Библиотека объединяет несколько популярных сериализационных пакетов, таких как ujson, msgpack, и cloudpickle, в одном пакете с удобным API.

🔐 Лицензия: MIT

🖥

Github

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤2

3.66K viewsedited 12:37

Python RU

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

🌟 14 алгоритмов сортировки за одну минуту!

Please open Telegram to view this post

VIEW IN TELEGRAM

👍27🔥7❤5

3.8K viewsedited 14:40

Python RU

🖥 Совет по Python:

🌟 Вы можете использовать словарь вместо длинного оператора if-else, чтобы сделать свой код понятным!

Please open Telegram to view this post

VIEW IN TELEGRAM

👍36👎1

2.89K views11:01

Python RU

⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:

МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Linux: t.me/linuxacademiya
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
Data Science: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Разработка игр: https://t.me/gamedev
Haskell: t.me/haskell_tg

💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.me/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.me/addlist/mzMMG3RPZhY2M2Iy

😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno

🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.me/addlist/BkskQciUW_FhNjEy

👍1

3.21K views11:31

Python RU

2.54K views06:08

Python RU

⭐️

Samhaxr/VTScanner

Комплексный инструмент безопасности на базе Python для сканирования файлов, обнаружения вредоносных программ и анализа в условиях постоянно развивающегося киберландшафта.

▪ Github

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2🔥2❤1

2.54K views08:51

Python RU

Forwarded from Machinelearning

⭐️

LLM-Reasoner

Инструмент, который поможет добавить рассждуения в ваши LLM проекты , подобно OpenAI o1 и deepseek R1.

✨ Функции:
🧠 Пошаговые рассуждения: Больше никаких ответов из «черного ящика»! Узнайте, как именно мыслит ваш LLM, по аналогии с O1.
🔄 Прогресс в реальном времени: позволяет наблюдать за ходом рассуждений с помощью плавных анимаций
🎯 Поддержка множества LLM провайдеров: Работает со всеми провайдерами LiteLLM
🎮 Streamlit: Удобный пользовательский интерфейс
🛠️ Поддердка CLI: для тех, кто любит возиться с командной строкой.
📊 Проверка уверенности ответа: Узнайте, насколько уверен ваш LLM в каждом шаге рассуждений.

⭐️

Установка:
pip install llm-reasoner

Пример с кодом:


from llm_reasoner import ReasonChain
import asyncio

async def main():
    # Create a chain with your preferred settings
    chain = ReasonChain(
        model="gpt-4",                # Choose your model
        min_steps=3,                  # Minimum reasoning steps
        temperature=0.2,              # Control creativity
        timeout=30.0                  # Set your timeout
    )

    # Watch it think step by step!
    async for step in chain.generate_with_metadata("Why is the sky blue?"):
        print(f"\nStep {step.number}: {step.title}")
        print(f"Thinking Time: {step.thinking_time:.2f}s")
        print(f"Confidence: {step.confidence:.2f}")
        print(step.content)

asyncio.run(main())

@ai_machinelearning_big_data

#llm #ml #ai #opensource #reasoning

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤3🔥2👎1

2.27K views10:34

Python RU

🎲

Теория вероятностей играет ключевую роль в машинном обучении, статистике и анализе данных.

В этой статье мы разберем 12 задач, которые помогут лучше понять применение теории вероятностей на практике с использованием Python.

✔️

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤3🔥2🤩1

2.45K views08:51

Python RU

Анализ частых ошибок при написании кода middle-разработчиками и способы их решения

Разработчики уровня middle обладают определённым опытом и знанием технологий, однако на этом этапе всё ещё часто встречаются ошибки, которые могут снижать качество кода, усложнять его поддержку и влиять на производительность приложений.

В этой статье мы разберём наиболее распространённые ошибки и предложим эффективные методы их устранения.

✔️

Читать статью

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥4👍2

2.64K views10:02

Python RU

🧠 Разбираем Функцию Радемахера. Машинное обучение Курс математики

- Видео
- Урок 1 / Урок2 / Урок3 / Урок4 / Урок5 /
- Урок6/ Урок7/ Урок8 / Урок9
- Colab
-Полный курс

@data_math

YouTube

Разбираем Функцию Радемахера. Машинное обучение Курс математики

Средние по Радемахеру — это математический инструмент, который помогает оценить сложность класса функций. Они используются для анализа того, насколько хорошо модель может обобщать данные.
🔥 https://t.me/+CTH__X6H21JjMWJi - в нашем телеграм канале собрана…

❤2🔥1

2.9K views07:04

Python RU

🖥 Копировать-Вставить, с помощью Python.

Please open Telegram to view this post

VIEW IN TELEGRAM

🤔8👍5🔥1

2.59K views11:46

Python RU

💌

Валентина от программиста — краткое руководство всего в трех шагах:

1. Открываем сайт
2. Вставляем код.


Python 
print('\n'.join
 ([''.join
   ([('Name'[(x-y)%4 ]
     if((x*0.05)**2+(y*0.1)**2-1)
      **3-(x*0.05)**2*(y*0.1)
       **3<=0 else ' ')
        for x in range(-30,30)])
         for y in range(15,-15,-1)]))

3. Сохраняем результат и отправляем по адресу 💌

Please open Telegram to view this post

VIEW IN TELEGRAM

🤩7👍4

2.13K views11:05

Python RU

Forwarded from Python/ django

🖥

PdfDing — это менеджер, просмотрщик и редактор PDF-файлов, обеспечивающий удобную работу на различных устройствах!

🌟 Он позволяет просматривать PDF-документы непосредственно в браузере, сохраняя позицию чтения для последующего продолжения с того же места. Пользователи могут организовывать свои PDF-файлы с помощью многоуровневых тегов, добавлять аннотации, выделения и рисунки, а также использовать такие функции, как темный режим, инвертированные цвета и настраиваемые цветовые темы. Кроме того, PdfDing поддерживает единый вход (SSO) через OIDC и предоставляет возможность делиться PDF-файлами с внешними пользователями посредством ссылок или QR-кодов с опциональным контролем доступа.

🔐 Лицензия: GPL-3.0

🖥

Github

@pythonl

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3👍2

2.57K views19:40

Python RU

Forwarded from Machinelearning

1:41

This media is not supported in your browser

VIEW IN TELEGRAM

⭐️ Podcastfy — это open-source инструмент, который преобразует текстовый контент в аудио подкасты с использованием синтеза речи.

Он позволяет легко создавать аудиоверсии статей или блогов, упрощая процесс создания подкастов для контент-мейкеров, блогеров или в целях обучения.

🌟 Поддерживает интеграцию с ElevenLabs, OpenAI и Edge TTS, для преобразования текста в речь.

💡 Примеры можно посмотреть здесь.

💨 Поддерживает продвинутые настройки для работы с голосами, стилем речи и другими параметрами. с генеративным контентом.

Установка:
$ pip install podcastfy

Podcastfy — удобный и простой в использовании инструмент для быстрого прототипирования решений по автоматическому созданию аудиоконтента и интеграции в более крупные ML-проекты.

🔐 Лицензия: Apache-2.0

▪Github
▪Paper
▪Colab

@ai_machinelearning_big_data

#podcast #gemini #openai #elevenlabs #genai #notebooklm

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5❤1🔥1

2.71K views07:55

About

Blog

Apps

Platform