Open-Qwen2VL:这是一个高效预训练多模态大语言模型的开源项目,旨在利用学术资源进行计算高效的预训练。核心价值在于帮助研究人员和开发者低成本、高效率地训练和应用多模态LLMs。
提供完整的数据筛选和预训练流程,支持大规模图像-文本数据的高效处理;释放了所有预训练模型和指令微调模型的检查点,方便直接使用;支持多种多模态基准测试的评估,助力模型性能验证
提供完整的数据筛选和预训练流程,支持大规模图像-文本数据的高效处理;释放了所有预训练模型和指令微调模型的检查点,方便直接使用;支持多种多模态基准测试的评估,助力模型性能验证
GitHub
GitHub - Victorwz/Open-Qwen2VL: [COLM 2025] Open-Qwen2VL: Compute-Efficient Pre-Training of Fully-Open Multimodal LLMs on Academic…
[COLM 2025] Open-Qwen2VL: Compute-Efficient Pre-Training of Fully-Open Multimodal LLMs on Academic Resources - Victorwz/Open-Qwen2VL
轻松微调Moshi模型的高效工具,让你快速拥有个性化语音交互模型
使用LoRA技术,微调过程轻量高效;支持多GPU加速训练,提升训练速度;提供完整教程和示例代码,新手也能快速上手
Moshi-Finetune | #工具
使用LoRA技术,微调过程轻量高效;支持多GPU加速训练,提升训练速度;提供完整教程和示例代码,新手也能快速上手
Moshi-Finetune | #工具
GitHub
GitHub - kyutai-labs/moshi-finetune
Contribute to kyutai-labs/moshi-finetune development by creating an account on GitHub.
IDA Pro MCP:为IDA Pro打造的MCP Server,让逆向工程更高效。
提供丰富的API接口,支持函数、字符串等信息检索;自动化安装流程,一键配置IDA插件;支持多种客户端,无缝对接Cline、Roo Code等工具
#IDA pro MCP #IDA插件
提供丰富的API接口,支持函数、字符串等信息检索;自动化安装流程,一键配置IDA插件;支持多种客户端,无缝对接Cline、Roo Code等工具
#IDA pro MCP #IDA插件
GitHub
GitHub - mrexodia/ida-pro-mcp: AI-powered reverse engineering assistant that bridges IDA Pro with language models through MCP.
AI-powered reverse engineering assistant that bridges IDA Pro with language models through MCP. - mrexodia/ida-pro-mcp
Awesome-Style-Transfer-with-Diffusion-Models:一个精心整理的扩散模型风格迁移方法列表,助力图像和视频风格化难题。
涵盖图像合成、视频合成、3D生成等多个领域;提供多种风格迁移方法,包括基于文本和图像的驱动方式;汇集了超过50种最新研究成果
涵盖图像合成、视频合成、3D生成等多个领域;提供多种风格迁移方法,包括基于文本和图像的驱动方式;汇集了超过50种最新研究成果
GitHub
GitHub - Westlake-AGI-Lab/Awesome-Style-Transfer-with-Diffusion-Models: A curated list of recent style transfer methods with diffusion…
A curated list of recent style transfer methods with diffusion models - Westlake-AGI-Lab/Awesome-Style-Transfer-with-Diffusion-Models
一个社区驱动的AI自动化框架,结合语言模型与专业工具,助力复杂任务自动化。
集成开源模型如Qwen,支持多层级LLM系统;提供Web搜索、爬虫和Python代码执行等强大功能;采用多Agent协作架构,实现复杂任务的高效分解与执行
LangManus | #框架
集成开源模型如Qwen,支持多层级LLM系统;提供Web搜索、爬虫和Python代码执行等强大功能;采用多Agent协作架构,实现复杂任务的高效分解与执行
LangManus | #框架
GitHub
GitHub - Darwin-lfl/langmanus: A community-driven AI automation framework that builds upon the incredible work of the open source…
A community-driven AI automation framework that builds upon the incredible work of the open source community. Our goal is to combine language models with specialized tools for tasks like web search...
Awesome-MLLM-Reasoning-Collection:一站式多模态推理资源大列表,助力研究人员和开发者轻松掌握前沿技术。
汇集129篇多模态推理领域的前沿论文;提供57个开源项目和数据集,涵盖图像、视频等多种模态;整合多个基准测试,为模型评估提供全面参考
#LLM #开源项目 #AI前沿论文
汇集129篇多模态推理领域的前沿论文;提供57个开源项目和数据集,涵盖图像、视频等多种模态;整合多个基准测试,为模型评估提供全面参考
#LLM #开源项目 #AI前沿论文
GitHub
GitHub - lwpyh/Awesome-MLLM-Reasoning-Collection: A collection of multimodal reasoning papers, codes, datasets, benchmarks and…
A collection of multimodal reasoning papers, codes, datasets, benchmarks and resources. - lwpyh/Awesome-MLLM-Reasoning-Collection
robot_lab:基于IsaacLab的机器人强化学习扩展库,为机器人开发提供强大的支持。
支持多种机器人平台,如Unitree A1、Go2等;提供丰富的学习环境,涵盖四足、轮式和人形机器人;配置灵活,支持自定义机器人和任务
#IsaacLab强化学习 #机器人
支持多种机器人平台,如Unitree A1、Go2等;提供丰富的学习环境,涵盖四足、轮式和人形机器人;配置灵活,支持自定义机器人和任务
#IsaacLab强化学习 #机器人
GitHub
GitHub - fan-ziqi/robot_lab: RL Extension Library for Robots, Based on IsaacLab.
RL Extension Library for Robots, Based on IsaacLab. - fan-ziqi/robot_lab
open-webui/mcpo:一个简单、安全的MCP到OpenAPI代理服务器,让任何MCP工具瞬间变成兼容OpenAPI的HTTP服务器。
无需编写额外代码,即插即用;提供安全、稳定且可扩展的HTTP服务自动生成交互式文档,零配置;
无需编写额外代码,即插即用;提供安全、稳定且可扩展的HTTP服务自动生成交互式文档,零配置;
GitHub
GitHub - open-webui/mcpo: A simple, secure MCP-to-OpenAPI proxy server
A simple, secure MCP-to-OpenAPI proxy server. Contribute to open-webui/mcpo development by creating an account on GitHub.
基于AI大模型的视频翻译和配音工具,一键部署全流程,轻松搞定多平台内容适配。
支持56种语言翻译,覆盖全球主要语种;一键开始,从视频下载到成品输出全流程搞定;适配抖音、小红书、哔哩哔哩、TikTok等多平台内容格式
KrillinAI | #工具
支持56种语言翻译,覆盖全球主要语种;一键开始,从视频下载到成品输出全流程搞定;适配抖音、小红书、哔哩哔哩、TikTok等多平台内容格式
KrillinAI | #工具
GitHub
GitHub - krillinai/KrillinAI: Video translation and dubbing tool powered by LLMs. The video translator offers 100 language translations…
Video translation and dubbing tool powered by LLMs. The video translator offers 100 language translations and one-click full-process deployment. The video translation output is optimized for platfo...
在线手写模拟器-手写体文稿生成器 #手写 #手写体
一款免费的在线工具,在线手写模拟器,可以将文本一键转换为手写字体,并下载为图片或 PDF 格式。支持多页转换,适合将长文本生成单个 PDF 文件。
https://vtool.pro/handwriting/index.html
一款免费的在线工具,在线手写模拟器,可以将文本一键转换为手写字体,并下载为图片或 PDF 格式。支持多页转换,适合将长文本生成单个 PDF 文件。
https://vtool.pro/handwriting/index.html
vtool.pro
手写体文稿生成器-手写模拟器-vtool工具箱
手写体文稿生成器是一款免费工具,在线手写模拟器,一键生成手写字体文稿。可将文本转换为手写体,并下载为图片或 PDF 格式。还支持多页。如果你有较长的文本,想将多页转换为手写体并下载为单个 PDF 文件,也可以使用它。
WechatDownload:微信公众号文章批量下载工具 #微信公众号 #开源
一款可以批量下载微信公众号文章内容的小工具,不需要安装证书,支持下载微信公众号的历史消息,支持下载word、pdf文件,可以保存文章为html或md文件。
https://github.com/qiye45/wechatDownload
一款可以批量下载微信公众号文章内容的小工具,不需要安装证书,支持下载微信公众号的历史消息,支持下载word、pdf文件,可以保存文章为html或md文件。
https://github.com/qiye45/wechatDownload
GitHub
GitHub - qiye45/wechatDownload: 微信公众号文章批量下载工具,支持评论、合集下载,支持保存html/mhtml/md/pdf/docx/csv文件,保存文章内图片、视频、音频文件,支持MCP/Skill调用
微信公众号文章批量下载工具,支持评论、合集下载,支持保存html/mhtml/md/pdf/docx/csv文件,保存文章内图片、视频、音频文件,支持MCP/Skill调用 - qiye45/wechatDownload
SimpMusic:开源YouTube Music 音乐播放器 支持后台播放 无广告 #音乐播放器 #开源
一款免费开源的YouTube Music音乐播放器,具有多种功能,包括Spotify、Musixmatch、SponsorBlock和ReturnYouTubeDislike等。它的用户界面简单易用,功能丰富,没有广告,并支持后台播放
https://simpmusic.org/
https://github.com/maxrave-dev/SimpMusic
一款免费开源的YouTube Music音乐播放器,具有多种功能,包括Spotify、Musixmatch、SponsorBlock和ReturnYouTubeDislike等。它的用户界面简单易用,功能丰富,没有广告,并支持后台播放
https://simpmusic.org/
https://github.com/maxrave-dev/SimpMusic
GitHub
GitHub - maxrave-dev/SimpMusic: A cross-platform music app using YouTube Music for backend
A cross-platform music app using YouTube Music for backend - maxrave-dev/SimpMusic
Kazumi—开源番剧采集与在线观看神器 #追番
一款基于Flutter开发的番剧采集与在线观看 APP,通过自定义规则采集番剧数据,支持流媒体观看、弹幕显示及基于Anime4K的实时超分辨率。适用于Android、Windows、macOS、Linux等多平台。
目前支持规则编辑器、番剧目录、搜索、时间表、字幕、分集播放、多视频源、硬件加速、高刷适配、追番列表、在线更新、历史记录、倍速播放、配色方案、跨设备同步、无线投屏、外部播放器播放等丰富功能。
https://github.com/Predidit/Kazumi
一款基于Flutter开发的番剧采集与在线观看 APP,通过自定义规则采集番剧数据,支持流媒体观看、弹幕显示及基于Anime4K的实时超分辨率。适用于Android、Windows、macOS、Linux等多平台。
目前支持规则编辑器、番剧目录、搜索、时间表、字幕、分集播放、多视频源、硬件加速、高刷适配、追番列表、在线更新、历史记录、倍速播放、配色方案、跨设备同步、无线投屏、外部播放器播放等丰富功能。
https://github.com/Predidit/Kazumi
DouYin Downloader:免费高效抖音批量下载工具,轻松去水印下载视频图集音乐 #视频下载 #抖音 #开源
一款免费的 抖音批量下载工具,满足用户对抖音视频、图集、合集及原声音乐下载需求,支持自动去除水印。
https://github.com/jiji262/douyin-downloader
一款免费的 抖音批量下载工具,满足用户对抖音视频、图集、合集及原声音乐下载需求,支持自动去除水印。
https://github.com/jiji262/douyin-downloader
金榜题名
⭐️ 网站功能:外语资源
📁 网站简介:一个主要为考生提供免费的学习资料和资源的网站。可以在网站上找到各类考试的复习资料,包括专业课真题、英语四六级资料、高中学习资料等。
🌐 网站网址: 点击打开
#学习资源 #考试外语资源
⭐️ 网站功能:外语资源
📁 网站简介:一个主要为考生提供免费的学习资料和资源的网站。可以在网站上找到各类考试的复习资料,包括专业课真题、英语四六级资料、高中学习资料等。
🌐 网站网址: 点击打开
#学习资源 #考试外语资源
Ysepan
永硕E盘
永硕E盘 专业网络硬盘 --数据存储、交流平台,可以保存您的文件、网址、记事等。以便随时随地调用或与朋友、同事分享
Audiblez
⭐️ 项目功能:电子书转有声书
📁 项目简介:一款开源的将电子书(.epub格式)转换为有声书(.m4b格式)的工具。利用Kokoro的高质量语音合成技术,支持多种语言的自然发音。
🌐 项目地址:点击直达
⭐️ 项目功能:电子书转有声书
📁 项目简介:一款开源的将电子书(.epub格式)转换为有声书(.m4b格式)的工具。利用Kokoro的高质量语音合成技术,支持多种语言的自然发音。
🌐 项目地址:点击直达
GitHub
GitHub - santinic/audiblez: Generate audiobooks from e-books
Generate audiobooks from e-books. Contribute to santinic/audiblez development by creating an account on GitHub.
#开源 #爬虫 #工具
🕷 Crawl4AI - 一款开源的 Web 爬虫工具
Crawl4AI 旨在简化网页数据的爬取与提取过程,专为 LLM 和 AI 应用打造
使用门槛非常低,一行命令就可以开始,爬取新闻类网站比较简单,速度是真的快(如图爬的是NBC的新闻,输出md格式)
🕷 Crawl4AI - 一款开源的 Web 爬虫工具
使用文档
Crawl4AI 旨在简化网页数据的爬取与提取过程,专为 LLM 和 AI 应用打造
使用门槛非常低,一行命令就可以开始,爬取新闻类网站比较简单,速度是真的快(如图爬的是NBC的新闻,输出md格式)
GitHub
GitHub - unclecode/crawl4ai: 🚀🤖 Crawl4AI: Open-source LLM Friendly Web Crawler & Scraper. Don't be shy, join here: https://dis…
🚀🤖 Crawl4AI: Open-source LLM Friendly Web Crawler & Scraper. Don't be shy, join here: https://discord.gg/jP8KfhDhyN - unclecode/crawl4ai
#NVIDIA #开源 #AI绘画 #大模型
⚡️ 快!NVIDIA 发布开源 AI 绘画模型「Sana」
得益于 NVIDIA 对自身硬件的优化能力,在一台 16GB 的 4090 笔记本上运行 Sana 生成 1024×1024 像素的图片仅需 0.37 秒!
⚡️ 快!NVIDIA 发布开源 AI 绘画模型「Sana」
在线体验
得益于 NVIDIA 对自身硬件的优化能力,在一台 16GB 的 4090 笔记本上运行 Sana 生成 1024×1024 像素的图片仅需 0.37 秒!
GitHub
GitHub - NVlabs/Sana: SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer
SANA: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer - NVlabs/Sana