硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
机器人已成功加入频道
(消息来自 @sososo)
DeepResearcher:通过强化学习在真实世界环境中训练LLM基础的深度研究Agent,让研究更智能、更高效。

实现高达28.9分的性能提升,远超传统方法;独特的端到端训练,让Agent具备规划、验证、反思等认知行为;支持真实网络搜索交互,让研究更贴近实际应用场景
#DeepResearcher #AIAgent
AI味去除:让AI生成的文本摆脱机械感,重获人类写作风格。

扩充文字,1000字扩至2000字,AI味仅提升22%;重写文字,5000字重写后AI味可从70%降至17%;提供详细的优化策略和示例,助力文本更自然流畅
#Github #AI
Open WebUI Artifacts Overhaul:一个用户友好的AI界面,支持Ollama、OpenAI API等多种AI工具。

编码画布功能,代码输出直观展示,方便开发者快速查看和编辑;支持30多种编程语言,满足多样化需求;提供设计视图和代码视图切换,增强用户体验
smartfunc:将文档字符串转化为LLM函数的Python库。

简单易用,只需在函数上添加装饰器即可;支持异步操作,可实现微批处理;集成Pydantic模型,方便定义返回值结构
沉浸式故事书视频生成的多Agent框架。

高质量故事创作,基于输入的故事设定生成精彩故事;多模态内容生成,涵盖图像、语音、音效和音乐;可定制工作流,用户可定义专家工具提升生成质量

MM_StoryAgent | #框架
AWS MCP Servers:将AWS最佳实践直接融入开发工作流的专用MCP服务器套件。

提供多种专业服务器,如AWS文档、CDK、成本分析等;支持自然语言查询,提升开发效率;与AWS服务深度集成,助力云原生开发
一个强大的多模态模型训练框架,能够将任意模态模型无缝扩展到各种加速器上,极大地提升了训练的灵活性和效率。

支持任意模态模型,无论是单模态还是多模态都能轻松应对;提供多种并行化策略,如DeviceMesh、FSDP等,加速训练过程;无缝集成PyTorch原生功能,确保最佳兼容性和性能

VeOmni | #框架
Koch v1.1 Low-Cost Robot Arm: Leader:为机器人爱好者和研究人员提供低成本(不到200美元)、高性能的机械臂解决方案

使用高效可靠的Dynamixel XL430和XL330伺服电机,性能卓越;提供完整的构建指南和视频教程,易于上手;支持Hugging Face的LeRobot框架,可快速集成最新机器学习系统
#LeRobot
DeepSite:为创业者和营销人员提供免费的无代码网站和应用构建工具。

结合Deepseek V3的强大功能与可视化画布,瞬间创建网站和应用;提供更美观的设计和更好的模板文案;100%免费在Hugging Face Spaces上使用
#DeepSite #工具 #无代码网站工具
Open-Qwen2VL:这是一个高效预训练多模态大语言模型的开源项目,旨在利用学术资源进行计算高效的预训练。核心价值在于帮助研究人员和开发者低成本、高效率地训练和应用多模态LLMs。

提供完整的数据筛选和预训练流程,支持大规模图像-文本数据的高效处理;释放了所有预训练模型和指令微调模型的检查点,方便直接使用;支持多种多模态基准测试的评估,助力模型性能验证
轻松微调Moshi模型的高效工具,让你快速拥有个性化语音交互模型

使用LoRA技术,微调过程轻量高效;支持多GPU加速训练,提升训练速度;提供完整教程和示例代码,新手也能快速上手

Moshi-Finetune | #工具
一款强大的网络质量检测脚本,能快速诊断网络问题并提供详细报告。

支持IPv4/IPv6双栈查询;覆盖全球五大洲网速及延迟测试;提供Json输出,便于大数据分析

NetQuality | #脚本
IDA Pro MCP:为IDA Pro打造的MCP Server,让逆向工程更高效。

提供丰富的API接口,支持函数、字符串等信息检索;自动化安装流程,一键配置IDA插件;支持多种客户端,无缝对接Cline、Roo Code等工具
#IDA pro MCP #IDA插件
Awesome-Style-Transfer-with-Diffusion-Models:一个精心整理的扩散模型风格迁移方法列表,助力图像和视频风格化难题。

涵盖图像合成、视频合成、3D生成等多个领域;提供多种风格迁移方法,包括基于文本和图像的驱动方式;汇集了超过50种最新研究成果
一个社区驱动的AI自动化框架,结合语言模型与专业工具,助力复杂任务自动化。

集成开源模型如Qwen,支持多层级LLM系统;提供Web搜索、爬虫和Python代码执行等强大功能;采用多Agent协作架构,实现复杂任务的高效分解与执行

LangManus | #框架
Awesome-MLLM-Reasoning-Collection:一站式多模态推理资源大列表,助力研究人员和开发者轻松掌握前沿技术。

汇集129篇多模态推理领域的前沿论文;提供57个开源项目和数据集,涵盖图像、视频等多种模态;整合多个基准测试,为模型评估提供全面参考
#LLM #开源项目 #AI前沿论文
robot_lab:基于IsaacLab的机器人强化学习扩展库,为机器人开发提供强大的支持。

支持多种机器人平台,如Unitree A1、Go2等;提供丰富的学习环境,涵盖四足、轮式和人形机器人;配置灵活,支持自定义机器人和任务
#IsaacLab强化学习 #机器人
open-webui/mcpo:一个简单、安全的MCP到OpenAPI代理服务器,让任何MCP工具瞬间变成兼容OpenAPI的HTTP服务器。

无需编写额外代码,即插即用;提供安全、稳定且可扩展的HTTP服务自动生成交互式文档,零配置;