VIRSUN

🧪ابزار DeepEval؛ چارچوب متن‌باز برای ارزیابی LLMها

ابزار DeepEval یک ابزار ساده و متن‌باز است که برای ارزیابی و تست سیستم‌های مدل زبانی بزرگ طراحی شده. این فریمورک شبیه Pytest عمل می‌کند اما تخصصی برای یونیت‌تست خروجی‌های LLM ساخته شده است.

🔹 ویژگی‌ها:

♻️پشتیبانی از متریک‌های مهم مثل G-Eval، hallucination، answer relevancy، RAGAS و غیره.

♻️اجرای محلی روی سیستم شما بدون وابستگی به سرور خارجی.

♻️مناسب برای RAG pipelineها، چت‌بات‌ها، ایجنت‌ها و پیاده‌سازی با ابزارهایی مثل LangChain یا LlamaIndex.

♻️کمک به بهینه‌سازی مدل‌ها، پرامپت‌ها و معماری برای جلوگیری از prompt drifting یا حتی مهاجرت از OpenAI به میزبانی داخلی مثل DeepSeek R1.

📌 لینک‌ها:
🖥 Github: github.com/confident-ai/deepeval
📕 Colab: Google Colab Notebook
🔗 Project: deepeval.com

@rss_ai_ir
#هوش_مصنوعی #LLM #ارزیابی #DeepEval #AItools

🔥9🥰8❤6👍6🎉6👏5😁4

210 views13:21

About

Blog

Apps

Platform