Awesome-RAG:为生成式AI提供检索增强生成(RAG)应用的资源大列表。
汇集了10多种RAG实现方法,涵盖从基础到高级的多种应用场景;整理了20+框架和工具,助力开发者快速上手;提供了丰富的评估指标和数据库资源,全方位支持RAG开发
#RAG
汇集了10多种RAG实现方法,涵盖从基础到高级的多种应用场景;整理了20+框架和工具,助力开发者快速上手;提供了丰富的评估指标和数据库资源,全方位支持RAG开发
#RAG
GitHub
GitHub - Danielskry/Awesome-RAG: 😎 Awesome list of Retrieval-Augmented Generation (RAG) applications in Generative AI.
😎 Awesome list of Retrieval-Augmented Generation (RAG) applications in Generative AI. - Danielskry/Awesome-RAG
DeepResearcher:通过强化学习在真实世界环境中训练LLM基础的深度研究Agent,让研究更智能、更高效。
实现高达28.9分的性能提升,远超传统方法;独特的端到端训练,让Agent具备规划、验证、反思等认知行为;支持真实网络搜索交互,让研究更贴近实际应用场景
#DeepResearcher #AIAgent
实现高达28.9分的性能提升,远超传统方法;独特的端到端训练,让Agent具备规划、验证、反思等认知行为;支持真实网络搜索交互,让研究更贴近实际应用场景
#DeepResearcher #AIAgent
GitHub
GitHub - GAIR-NLP/DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments.
Scaling Deep Research via Reinforcement Learning in Real-world Environments. - GAIR-NLP/DeepResearcher
AI味去除:让AI生成的文本摆脱机械感,重获人类写作风格。
扩充文字,1000字扩至2000字,AI味仅提升22%;重写文字,5000字重写后AI味可从70%降至17%;提供详细的优化策略和示例,助力文本更自然流畅
#Github #AI
扩充文字,1000字扩至2000字,AI味仅提升22%;重写文字,5000字重写后AI味可从70%降至17%;提供详细的优化策略和示例,助力文本更自然流畅
#Github #AI
GitHub
GitHub - hylarucoder/ai-flavor-remover: AI 味去除 - 仅在 Gemini 2.5 Pro 上测试通过
AI 味去除 - 仅在 Gemini 2.5 Pro 上测试通过. Contribute to hylarucoder/ai-flavor-remover development by creating an account on GitHub.
Open WebUI Artifacts Overhaul:一个用户友好的AI界面,支持Ollama、OpenAI API等多种AI工具。
编码画布功能,代码输出直观展示,方便开发者快速查看和编辑;支持30多种编程语言,满足多样化需求;提供设计视图和代码视图切换,增强用户体验
编码画布功能,代码输出直观展示,方便开发者快速查看和编辑;支持30多种编程语言,满足多样化需求;提供设计视图和代码视图切换,增强用户体验
GitHub
GitHub - nick-tonjum/open-webui-artifacts-overhaul: User-friendly AI Interface (Supports Ollama, OpenAI API, ...)
User-friendly AI Interface (Supports Ollama, OpenAI API, ...) - nick-tonjum/open-webui-artifacts-overhaul
让语言模型具备主动搜索能力的强化学习框架。
通过多轮交互提升模型对长尾和知识密集型任务的性能;支持自定义搜索工具,灵活适配不同需求;采用veRL框架,训练效率更高
Multimodal-Search-R1 | #框架
通过多轮交互提升模型对长尾和知识密集型任务的性能;支持自定义搜索工具,灵活适配不同需求;采用veRL框架,训练效率更高
Multimodal-Search-R1 | #框架
GitHub
GitHub - EvolvingLMMs-Lab/multimodal-search-r1: MMSearch-R1 is an end-to-end RL framework that enables LMMs to perform on-demand…
MMSearch-R1 is an end-to-end RL framework that enables LMMs to perform on-demand, multi-turn search with real-world multimodal search tools. - EvolvingLMMs-Lab/multimodal-search-r1
沉浸式故事书视频生成的多Agent框架。
高质量故事创作,基于输入的故事设定生成精彩故事;多模态内容生成,涵盖图像、语音、音效和音乐;可定制工作流,用户可定义专家工具提升生成质量
MM_StoryAgent | #框架
高质量故事创作,基于输入的故事设定生成精彩故事;多模态内容生成,涵盖图像、语音、音效和音乐;可定制工作流,用户可定义专家工具提升生成质量
MM_StoryAgent | #框架
GitHub
GitHub - X-PLUG/MM_StoryAgent
Contribute to X-PLUG/MM_StoryAgent development by creating an account on GitHub.
AWS MCP Servers:将AWS最佳实践直接融入开发工作流的专用MCP服务器套件。
提供多种专业服务器,如AWS文档、CDK、成本分析等;支持自然语言查询,提升开发效率;与AWS服务深度集成,助力云原生开发
提供多种专业服务器,如AWS文档、CDK、成本分析等;支持自然语言查询,提升开发效率;与AWS服务深度集成,助力云原生开发
GitHub
GitHub - awslabs/mcp: Open source MCP Servers for AWS
Open source MCP Servers for AWS. Contribute to awslabs/mcp development by creating an account on GitHub.
一个强大的多模态模型训练框架,能够将任意模态模型无缝扩展到各种加速器上,极大地提升了训练的灵活性和效率。
支持任意模态模型,无论是单模态还是多模态都能轻松应对;提供多种并行化策略,如DeviceMesh、FSDP等,加速训练过程;无缝集成PyTorch原生功能,确保最佳兼容性和性能
VeOmni | #框架
支持任意模态模型,无论是单模态还是多模态都能轻松应对;提供多种并行化策略,如DeviceMesh、FSDP等,加速训练过程;无缝集成PyTorch原生功能,确保最佳兼容性和性能
VeOmni | #框架
GitHub
GitHub - ByteDance-Seed/VeOmni: VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo
VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo - ByteDance-Seed/VeOmni
Koch v1.1 Low-Cost Robot Arm: Leader:为机器人爱好者和研究人员提供低成本(不到200美元)、高性能的机械臂解决方案
使用高效可靠的Dynamixel XL430和XL330伺服电机,性能卓越;提供完整的构建指南和视频教程,易于上手;支持Hugging Face的LeRobot框架,可快速集成最新机器学习系统
#LeRobot
使用高效可靠的Dynamixel XL430和XL330伺服电机,性能卓越;提供完整的构建指南和视频教程,易于上手;支持Hugging Face的LeRobot框架,可快速集成最新机器学习系统
#LeRobot
ROBOTIS
Koch v1.1 Low-Cost Robot Arm: Leader
ROBOTIS is a global robot solutions provider and one of the leading manufacturers of robotic hardware. ROBOTIS is the exclusive producer of the DYNAMIXEL brand of all-in-one smart servos. We specialize in the manufacture of robotic hardware and full robot…
Open-Qwen2VL:这是一个高效预训练多模态大语言模型的开源项目,旨在利用学术资源进行计算高效的预训练。核心价值在于帮助研究人员和开发者低成本、高效率地训练和应用多模态LLMs。
提供完整的数据筛选和预训练流程,支持大规模图像-文本数据的高效处理;释放了所有预训练模型和指令微调模型的检查点,方便直接使用;支持多种多模态基准测试的评估,助力模型性能验证
提供完整的数据筛选和预训练流程,支持大规模图像-文本数据的高效处理;释放了所有预训练模型和指令微调模型的检查点,方便直接使用;支持多种多模态基准测试的评估,助力模型性能验证
GitHub
GitHub - Victorwz/Open-Qwen2VL: [COLM 2025] Open-Qwen2VL: Compute-Efficient Pre-Training of Fully-Open Multimodal LLMs on Academic…
[COLM 2025] Open-Qwen2VL: Compute-Efficient Pre-Training of Fully-Open Multimodal LLMs on Academic Resources - Victorwz/Open-Qwen2VL
轻松微调Moshi模型的高效工具,让你快速拥有个性化语音交互模型
使用LoRA技术,微调过程轻量高效;支持多GPU加速训练,提升训练速度;提供完整教程和示例代码,新手也能快速上手
Moshi-Finetune | #工具
使用LoRA技术,微调过程轻量高效;支持多GPU加速训练,提升训练速度;提供完整教程和示例代码,新手也能快速上手
Moshi-Finetune | #工具
GitHub
GitHub - kyutai-labs/moshi-finetune
Contribute to kyutai-labs/moshi-finetune development by creating an account on GitHub.
IDA Pro MCP:为IDA Pro打造的MCP Server,让逆向工程更高效。
提供丰富的API接口,支持函数、字符串等信息检索;自动化安装流程,一键配置IDA插件;支持多种客户端,无缝对接Cline、Roo Code等工具
#IDA pro MCP #IDA插件
提供丰富的API接口,支持函数、字符串等信息检索;自动化安装流程,一键配置IDA插件;支持多种客户端,无缝对接Cline、Roo Code等工具
#IDA pro MCP #IDA插件
GitHub
GitHub - mrexodia/ida-pro-mcp: AI-powered reverse engineering assistant that bridges IDA Pro with language models through MCP.
AI-powered reverse engineering assistant that bridges IDA Pro with language models through MCP. - mrexodia/ida-pro-mcp
Awesome-Style-Transfer-with-Diffusion-Models:一个精心整理的扩散模型风格迁移方法列表,助力图像和视频风格化难题。
涵盖图像合成、视频合成、3D生成等多个领域;提供多种风格迁移方法,包括基于文本和图像的驱动方式;汇集了超过50种最新研究成果
涵盖图像合成、视频合成、3D生成等多个领域;提供多种风格迁移方法,包括基于文本和图像的驱动方式;汇集了超过50种最新研究成果
GitHub
GitHub - Westlake-AGI-Lab/Awesome-Style-Transfer-with-Diffusion-Models: A curated list of recent style transfer methods with diffusion…
A curated list of recent style transfer methods with diffusion models - Westlake-AGI-Lab/Awesome-Style-Transfer-with-Diffusion-Models
一个社区驱动的AI自动化框架,结合语言模型与专业工具,助力复杂任务自动化。
集成开源模型如Qwen,支持多层级LLM系统;提供Web搜索、爬虫和Python代码执行等强大功能;采用多Agent协作架构,实现复杂任务的高效分解与执行
LangManus | #框架
集成开源模型如Qwen,支持多层级LLM系统;提供Web搜索、爬虫和Python代码执行等强大功能;采用多Agent协作架构,实现复杂任务的高效分解与执行
LangManus | #框架
GitHub
GitHub - Darwin-lfl/langmanus: A community-driven AI automation framework that builds upon the incredible work of the open source…
A community-driven AI automation framework that builds upon the incredible work of the open source community. Our goal is to combine language models with specialized tools for tasks like web search...
Awesome-MLLM-Reasoning-Collection:一站式多模态推理资源大列表,助力研究人员和开发者轻松掌握前沿技术。
汇集129篇多模态推理领域的前沿论文;提供57个开源项目和数据集,涵盖图像、视频等多种模态;整合多个基准测试,为模型评估提供全面参考
#LLM #开源项目 #AI前沿论文
汇集129篇多模态推理领域的前沿论文;提供57个开源项目和数据集,涵盖图像、视频等多种模态;整合多个基准测试,为模型评估提供全面参考
#LLM #开源项目 #AI前沿论文
GitHub
GitHub - lwpyh/Awesome-MLLM-Reasoning-Collection: A collection of multimodal reasoning papers, codes, datasets, benchmarks and…
A collection of multimodal reasoning papers, codes, datasets, benchmarks and resources. - lwpyh/Awesome-MLLM-Reasoning-Collection
robot_lab:基于IsaacLab的机器人强化学习扩展库,为机器人开发提供强大的支持。
支持多种机器人平台,如Unitree A1、Go2等;提供丰富的学习环境,涵盖四足、轮式和人形机器人;配置灵活,支持自定义机器人和任务
#IsaacLab强化学习 #机器人
支持多种机器人平台,如Unitree A1、Go2等;提供丰富的学习环境,涵盖四足、轮式和人形机器人;配置灵活,支持自定义机器人和任务
#IsaacLab强化学习 #机器人
GitHub
GitHub - fan-ziqi/robot_lab: RL Extension Library for Robots, Based on IsaacLab.
RL Extension Library for Robots, Based on IsaacLab. - fan-ziqi/robot_lab
open-webui/mcpo:一个简单、安全的MCP到OpenAPI代理服务器,让任何MCP工具瞬间变成兼容OpenAPI的HTTP服务器。
无需编写额外代码,即插即用;提供安全、稳定且可扩展的HTTP服务自动生成交互式文档,零配置;
无需编写额外代码,即插即用;提供安全、稳定且可扩展的HTTP服务自动生成交互式文档,零配置;
GitHub
GitHub - open-webui/mcpo: A simple, secure MCP-to-OpenAPI proxy server
A simple, secure MCP-to-OpenAPI proxy server. Contribute to open-webui/mcpo development by creating an account on GitHub.