Machinelearning

Complete Guide to Topic Modeling with scikit-learn and gensim

#MachineLearning #NLP #Python

Article: https://buff.ly/2m5586Y

NLP-FOR-HACKERS

Complete Guide to Topic Modeling - NLP-FOR-HACKERS

In this tutorial, we learn all there is to know about the basics of topic modeling. Explore LDA, LSA and NMF algorithms. Learn how to visualize topics.

2.26K viewsedited 15:39

Machinelearning

List of Free Must-Read Machine Learning Books #MachineLearning #DataScience http://bit.ly/2HkAiBb

Towards Data Science

List of Free Must-Read Machine Learning Books

Machine learning is an application of artificial intelligence that gives a system an ability to automatically learn and improve from…

3.22K views11:09

Machinelearning

Multi-Class Text Classification with Scikit-Learn #MachineLearning #DataScience http://bit.ly/2EH5NUc

Towards Data Science

Multi-Class Text Classification with Scikit-Learn

There are lots of applications of text classification in the commercial world. For example, news stories are typically organized by topics…

3.31K views10:38

Machinelearning

Top 20 Python AI and Machine Learning Open Source Projects #MachineLearning #ArtificialIntel ligence http://bit.ly/2sHVk9v

2.68K viewsedited 12:34

Machinelearning

⚡️ RouteLLM - фреймворк с открытым исходным кодом для эффективной маршрутизации между несколькими LLM

Метод построения маршрутов (роутеров) использует данные о предпочтениях для обучения управляющего роутера, который может предсказывать, какие запросы могут быть обработаны слабыми моделями, а какие требуют более мощных.

RouteLLM обещает значительное снижение затрат без ущерба для качества ответов. В тестах, таких как MT Bench и MMLU, RouteLLM достиг высокой производительности при меньшем количестве вызовов на мощные модели.

В фреймворке реализована поддержка вызова по API (OpenAI, Anthropic, Google, Amazon Bedrock) и локального бекэнда (Ollama)

Преднастроены 4 роутера, обученных на паре моделей gpt-4-1106-preview и mixtral-8x7b-instruct-v0.1 :

mf - использует модель матричной факторизации, обученную на данных о предпочтениях
sw_ranking - использует взвешенный расчет ELO для маршрутизации, где каждый голос взвешивается в зависимости от того, насколько он похож на запрос пользователя
bert - использует классификатор BERT
causal_llm - использует классификатор отдельной LLM настроенный на данные о предпочтениях.
random - случайным образом направляет запрос к случайной модели.

🟡

Arxiv

🟡

Страница проекта

🟡

Модели (Augmented for routes) на HF

🖥

Github [ Stars: 686 | Forks: 52 | Issues:2]

#LLM #ML #machinelearning #opensource

@ai_machinelearning_big_data

Please open Telegram to view this post