硬核开源智库
812 subscribers
42 photos
1.12K links
提供硬核学习资源,探索开源力量,驾驭AI未来! 本频道精选GitHub优质开源项目、最新人工智能(AI)技术进展、前沿科技资讯以及各类有价值的学习资源,助你站在技术浪潮之巅,实现知识与技能的快速跃迁。无论你是开发者、AI爱好者还是技术探索者,都能在这里找到属于你的宝藏!
Download Telegram
为安全专业人士和爱好者打造的高效Web应用审计工具。

每月至少发布一次新版本,持续更新;提供详细的Roadmap,让用户提前了解新功能;拥有77个Forks,社区活跃度高

Caido | #工具
MoviiGen 1.1:打造电影级画质的视频生成模型,让视频创作更专业、更高效。

超越竞品的电影美学表现,尤其在氛围营造、镜头运动和细节保留上表现卓越;清晰度提升14.6%,真实感增强4.3%,适合高保真场景;支持720P和1080P分辨率,保持高质量输出
#资源参考 #工具 #视频生成模型
nTab

⭐️ 插件功能:新标签页

➡️ 支持平台:#Chrome

📁 插件简介:一款功能强大的新标签页插件,集成了 GitHub 趋势、Hacker News 资讯和精选开源项目,可以根据自己的需求自定义书签,快速访问必备的开发工具,从而提升工作效率。

⬇️ 插件下载:点击下载
serverless-markdown-convertor

⭐️ 项目功能:Markdown转换器

📁 项目简介:一个基于Cloudflare Worker和AI的Markdown转换器,可以将多种文件格式(如PDF、图片、HTML、XML、Microsoft Office文档等)转换为Markdown格式。

支持多种文件类型,并利用Cloudflare的AI模型进行图像处理和对象检测,提供高效的转换服务。

🌐 项目地址:点击直达
Grok Chat

⭐️ 项目功能:开源聊天应用

📁 项目简介:一个基于PHP的开源聊天应用,支持文本和图像输入,集成Cloudflare AI网关,提供会话历史记录。可以上传和预览图像,增强了聊天的互动性。

🌐 项目地址:点击直达
YouTube Transcript Generator

⭐️ 网站功能:YouTube视频转录

📁 网站简介:一个免费的YouTube视频转录生成器,只需粘贴视频链接,即可快速提取和下载视频的完整转录文本。

支持任何公共YouTube视频,无论其语言、长度或内容类别,可以在几秒钟内获得准确的字幕,而无需观看整个视频。

🔗 网站网址:点击打开
网站名称:pod.link

⭐️ 网站功能:播客分享

📁 网站简介:一个专注于播客分享的平台,可以通过该网站轻松生成和分享播客链接。

只需将播客的 RSS 源输入到网站中,便可以生成一个包含所有主要播客平台(如 Apple Podcasts、Spotify、Google Podcasts 等)的链接。

🔗 网站网址:点击打开
Win11Debloat 是一款能清除 Windows 11 中所有垃圾的实用工具。

- 删除所有无用的应用程序和实用程序;
- 禁用广告和遥测等功能;
- 删除起始菜单中所有固定的应用程序;
- 显示隐藏的文件和文件夹;
- 恢复旧的 Windows10 样式上下文菜单;
及其他。

在 PowerShell 终端中运行。

🧬 https://github.com/Raphire/Win11Debloat

#tools
Cursor 免费助手

免费解锁Cursor Pro,告别14天限制!支持MACOS,Windows

自动账号管理:一键获取账号, 不需要你自己的账号, 无须担心机器码问题, 功能简洁但是十分强大
额度重置机制:突破官方限制,实现无限次代码生成与调用
完全免费开源:透明公开,欢迎任何人使用或参与改进


📎开源下载地址
#工具 #Cursor #AI #IDE #编程 #MACOS #WINDOWS
1
NoMoreWalls

⭐️ 项目功能:公开节点自动抓取

📁 项目简介:一款开源的自动抓取和合并互联网上的公开节点的工具。通过自动识别被墙域名并提供分流规则,还提供了多种订阅方式,可以根据自己的需求选择合适的配置。

🌐 项目地址:点击直达
谷歌推出的 AI 设计工具,支持 Gemini 2.5 flash 和 pro 模型,支持微调,完成度很高。

https://stitch.withgoogle.com
Wikipedia近来流量暴增50%、团队以为是大家渐渐开始重视真正的定义与避免幻觉。

结果原来是因为Vibe programming 大爆发、让 AI爬虫疯狂诞生、竟然造成 Wikipedia 服务器持续吃紧!

Wikipedia 赶紧自己打包资料放到kaggle上、还贴心作好json格式、为让服务器不要再过载。

所以下次直接叫模型去kaggle拿、救救Wikipedia 🤣

https://www.kaggle.com/datasets/jacksoncrow/wikipedia-multimodal-dataset-of-good-articles
阿里巴巴开源自主搜索 AI 智能体 WebAgent

阿里巴巴于5月30日在Github上开源其自主搜索AI Agent——WebAgent,该Agent具备端到端的自主信息检索与多步推理能力。WebAgent能够主动搜索学术数据库、筛选文献并进行分析总结。WebAgent包含WebDancer和WebWalker两部分,前者是端到端智能体训练框架,后者是“Web 遍历中的 LLM 基准测试”。WebDancer框架由数据构建、短/长推理、监督微调(SFT)和强化学习(RL)四个阶段组成,采用DAPO算法进行强化学习。WebAgent旨在增强基于网络的AI智能体的多步骤信息搜索能力。

🏷 #WebAgent #阿里巴巴 #开源
Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑

Anthropic于5月29日发布“思维追踪”(Circuit Tracer)开源工具,以图形化方式呈现AI大语言模型的内部思维过程。该工具通过构建“归因图”(Attribution Graph),帮助研究者可视化模型内部运作并进行交互式探索。Circuit Tracer已在GitHub平台以开源库形式发布,研究者可在Decode Research运营的Neuronpedia平台上使用交互式前端查看“归因图”。用户可利用该工具生成自定义归因图,追踪模型内部逻辑,并进行标注、分享和调整特征值以验证研究假设。Anthropic 认为,开源这些工具将促进对语言模型内部运作的更广泛理解。

🏷 #Anthropic #Circuit #Tracer #开源
HUD SDK:为AI Agent评估提供强大支持,助力开发者轻松构建和测试智能Agent。

支持多种环境,包括Web浏览器、桌面环境和自定义场景;提供丰富的预设任务集,如WebVoyager和GAIA;简单易用的API,快速上手
HunyuanVideo-Avatar:腾讯推出的高保真音频驱动多角色动画生成项目,让视频创作更高效、更生动。

支持多风格、多尺度的动态视频生成,涵盖写实、卡通、3D等多种风格;情感可控,通过音频驱动实现精准情感对齐;多角色对话视频生成,满足复杂场景需求
从学术论文到海报的开源多Agent自动化生成工具。

一键将论文转换为专业海报,效率提升显著;支持多种模型组合,灵活适配不同需求;提供完整的评估体系,确保生成质量

Paper2Poster | #工具
一款强大的文件解析工具,专为AI和LLMs设计,能将代码库和网页内容转化为适合AI处理的格式。

支持多种文件类型和网页爬取;提供代码压缩功能,减少token使用;自动估算VRAM需求,确保模型兼容性

Ingest |#工具
Dia-TTS-Server:自托管强大的Dia TTS模型,让文本到语音的转换更加智能和高效。

提供用户友好的Web UI,操作简单便捷;支持SafeTensors/BF16,显著降低内存占用,提升运行效率;语音克隆和对话生成功能强大,可生成自然流畅的多角色对话
#资源参考 #工具 #TTS-Server