MoviiGen 1.1:打造电影级画质的视频生成模型,让视频创作更专业、更高效。
超越竞品的电影美学表现,尤其在氛围营造、镜头运动和细节保留上表现卓越;清晰度提升14.6%,真实感增强4.3%,适合高保真场景;支持720P和1080P分辨率,保持高质量输出
#资源参考 #工具 #视频生成模型
超越竞品的电影美学表现,尤其在氛围营造、镜头运动和细节保留上表现卓越;清晰度提升14.6%,真实感增强4.3%,适合高保真场景;支持720P和1080P分辨率,保持高质量输出
#资源参考 #工具 #视频生成模型
GitHub
GitHub - ZulutionAI/MoviiGen1.1: MoviiGen 1.1: Towards Cinematic-Quality Video Generative Models
MoviiGen 1.1: Towards Cinematic-Quality Video Generative Models - ZulutionAI/MoviiGen1.1
nTab
⭐️ 插件功能:新标签页
➡️ 支持平台:#Chrome
📁 插件简介:一款功能强大的新标签页插件,集成了 GitHub 趋势、Hacker News 资讯和精选开源项目,可以根据自己的需求自定义书签,快速访问必备的开发工具,从而提升工作效率。
⬇️ 插件下载:点击下载
⭐️ 插件功能:新标签页
➡️ 支持平台:#Chrome
📁 插件简介:一款功能强大的新标签页插件,集成了 GitHub 趋势、Hacker News 资讯和精选开源项目,可以根据自己的需求自定义书签,快速访问必备的开发工具,从而提升工作效率。
⬇️ 插件下载:点击下载
nTab
nTab - 每一个新标签页,都给你带来下一个idea。
发现GitHub趋势、Hacker News和精选的开源项目,在你的每个新标签页中激发你的下一个idea。nTab将技术新闻与自定义工具库相结合,以提升你的工作效率。
serverless-markdown-convertor
⭐️ 项目功能:Markdown转换器
📁 项目简介:一个基于Cloudflare Worker和AI的Markdown转换器,可以将多种文件格式(如PDF、图片、HTML、XML、Microsoft Office文档等)转换为Markdown格式。
支持多种文件类型,并利用Cloudflare的AI模型进行图像处理和对象检测,提供高效的转换服务。
🌐 项目地址:点击直达
⭐️ 项目功能:Markdown转换器
📁 项目简介:一个基于Cloudflare Worker和AI的Markdown转换器,可以将多种文件格式(如PDF、图片、HTML、XML、Microsoft Office文档等)转换为Markdown格式。
支持多种文件类型,并利用Cloudflare的AI模型进行图像处理和对象检测,提供高效的转换服务。
🌐 项目地址:点击直达
GitHub
GitHub - xxnuo/serverless-markdown-convertor: Markdown Conversion
Markdown Conversion. Contribute to xxnuo/serverless-markdown-convertor development by creating an account on GitHub.
Grok Chat
⭐️ 项目功能:开源聊天应用
📁 项目简介:一个基于PHP的开源聊天应用,支持文本和图像输入,集成Cloudflare AI网关,提供会话历史记录。可以上传和预览图像,增强了聊天的互动性。
🌐 项目地址:点击直达
⭐️ 项目功能:开源聊天应用
📁 项目简介:一个基于PHP的开源聊天应用,支持文本和图像输入,集成Cloudflare AI网关,提供会话历史记录。可以上传和预览图像,增强了聊天的互动性。
🌐 项目地址:点击直达
GitHub
GitHub - raimbaulty/grok-chat: Grok Chat UI
Grok Chat UI. Contribute to raimbaulty/grok-chat development by creating an account on GitHub.
YouTube Transcript Generator
⭐️ 网站功能:YouTube视频转录
📁 网站简介:一个免费的YouTube视频转录生成器,只需粘贴视频链接,即可快速提取和下载视频的完整转录文本。
支持任何公共YouTube视频,无论其语言、长度或内容类别,可以在几秒钟内获得准确的字幕,而无需观看整个视频。
🔗 网站网址:点击打开
⭐️ 网站功能:YouTube视频转录
📁 网站简介:一个免费的YouTube视频转录生成器,只需粘贴视频链接,即可快速提取和下载视频的完整转录文本。
支持任何公共YouTube视频,无论其语言、长度或内容类别,可以在几秒钟内获得准确的字幕,而无需观看整个视频。
🔗 网站网址:点击打开
transcriptgenerator.org
Transcript Generator - Extract YouTube transcripts
Extract transcripts from any YouTube video instantly. Simply paste the video URL to get accurate subtitles without watching the entire video.
网站名称:pod.link
⭐️ 网站功能:播客分享
📁 网站简介:一个专注于播客分享的平台,可以通过该网站轻松生成和分享播客链接。
只需将播客的 RSS 源输入到网站中,便可以生成一个包含所有主要播客平台(如 Apple Podcasts、Spotify、Google Podcasts 等)的链接。
🔗 网站网址:点击打开
⭐️ 网站功能:播客分享
📁 网站简介:一个专注于播客分享的平台,可以通过该网站轻松生成和分享播客链接。
只需将播客的 RSS 源输入到网站中,便可以生成一个包含所有主要播客平台(如 Apple Podcasts、Spotify、Google Podcasts 等)的链接。
🔗 网站网址:点击打开
Win11Debloat 是一款能清除 Windows 11 中所有垃圾的实用工具。
- 删除所有无用的应用程序和实用程序;
- 禁用广告和遥测等功能;
- 删除起始菜单中所有固定的应用程序;
- 显示隐藏的文件和文件夹;
- 恢复旧的 Windows10 样式上下文菜单;
及其他。
在 PowerShell 终端中运行。
🧬 https://github.com/Raphire/Win11Debloat
#tools
- 删除所有无用的应用程序和实用程序;
- 禁用广告和遥测等功能;
- 删除起始菜单中所有固定的应用程序;
- 显示隐藏的文件和文件夹;
- 恢复旧的 Windows10 样式上下文菜单;
及其他。
在 PowerShell 终端中运行。
🧬 https://github.com/Raphire/Win11Debloat
#tools
GitHub
GitHub - Raphire/Win11Debloat: A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry…
A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other changes to declutter and customize your Windows experience....
Deepfake Audio Detector - 利用深度学习技术检测带有人类语音的音频片段,识别伪造。
准确率达 94%
🧬 https://github.com/zo9999/deepfake-audio-detector
#tools #AI
准确率达 94%
🧬 https://github.com/zo9999/deepfake-audio-detector
#tools #AI
GitHub
GitHub - zo9999/deepfake-audio-detector: Convolutional Neural Network that classifies voice clips as human or AI with 94% accuracy.
Convolutional Neural Network that classifies voice clips as human or AI with 94% accuracy. - zo9999/deepfake-audio-detector
Cursor 免费助手
免费解锁Cursor Pro,告别14天限制!支持MACOS,Windows
📎开源下载地址
#工具 #Cursor #AI #IDE #编程 #MACOS #WINDOWS
免费解锁Cursor Pro,告别14天限制!支持MACOS,Windows
自动账号管理:一键获取账号, 不需要你自己的账号, 无须担心机器码问题, 功能简洁但是十分强大
额度重置机制:突破官方限制,实现无限次代码生成与调用
完全免费开源:透明公开,欢迎任何人使用或参与改进
📎开源下载地址
#工具 #Cursor #AI #IDE #编程 #MACOS #WINDOWS
GitHub
Releases · agentcodee/cursor-free-everyday
完全免费, 自动获取新账号,一键重置新额度, 解决机器码问题, 自动满额度. Contribute to agentcodee/cursor-free-everyday development by creating an account on GitHub.
❤1
NoMoreWalls
⭐️ 项目功能:公开节点自动抓取
📁 项目简介:一款开源的自动抓取和合并互联网上的公开节点的工具。通过自动识别被墙域名并提供分流规则,还提供了多种订阅方式,可以根据自己的需求选择合适的配置。
🌐 项目地址:点击直达
⭐️ 项目功能:公开节点自动抓取
📁 项目简介:一款开源的自动抓取和合并互联网上的公开节点的工具。通过自动识别被墙域名并提供分流规则,还提供了多种订阅方式,可以根据自己的需求选择合适的配置。
🌐 项目地址:点击直达
GitHub
GitHub - peasoft/NoMoreWalls: 自动抓取合并互联网上的公开节点。
自动抓取合并互联网上的公开节点。. Contribute to peasoft/NoMoreWalls development by creating an account on GitHub.
Wikipedia近来流量暴增50%、团队以为是大家渐渐开始重视真正的定义与避免幻觉。
结果原来是因为Vibe programming 大爆发、让 AI爬虫疯狂诞生、竟然造成 Wikipedia 服务器持续吃紧!
Wikipedia 赶紧自己打包资料放到kaggle上、还贴心作好json格式、为让服务器不要再过载。
所以下次直接叫模型去kaggle拿、救救Wikipedia 🤣
https://www.kaggle.com/datasets/jacksoncrow/wikipedia-multimodal-dataset-of-good-articles
结果原来是因为Vibe programming 大爆发、让 AI爬虫疯狂诞生、竟然造成 Wikipedia 服务器持续吃紧!
Wikipedia 赶紧自己打包资料放到kaggle上、还贴心作好json格式、为让服务器不要再过载。
所以下次直接叫模型去kaggle拿、救救Wikipedia 🤣
https://www.kaggle.com/datasets/jacksoncrow/wikipedia-multimodal-dataset-of-good-articles
Kaggle
Wikipedia Multimodal Dataset of Good Articles
Text-Image dataset of Wikipedia Articles
谷歌开源的可运行自家端侧多模态模型 Gemma 3n 的 Android 应用
https://github.com/google-ai-edge/gallery/releases/tag/1.0.3
https://github.com/google-ai-edge/gallery/releases/tag/1.0.3
GitHub
Release 1.0.3 · google-ai-edge/gallery
Fix some potential memory leak in image capture sheet
阿里巴巴开源自主搜索 AI 智能体 WebAgent
阿里巴巴于5月30日在Github上开源其自主搜索AI Agent——WebAgent,该Agent具备端到端的自主信息检索与多步推理能力。WebAgent能够主动搜索学术数据库、筛选文献并进行分析总结。WebAgent包含WebDancer和WebWalker两部分,前者是端到端智能体训练框架,后者是“Web 遍历中的 LLM 基准测试”。WebDancer框架由数据构建、短/长推理、监督微调(SFT)和强化学习(RL)四个阶段组成,采用DAPO算法进行强化学习。WebAgent旨在增强基于网络的AI智能体的多步骤信息搜索能力。
🏷 #WebAgent #阿里巴巴 #开源
阿里巴巴于5月30日在Github上开源其自主搜索AI Agent——WebAgent,该Agent具备端到端的自主信息检索与多步推理能力。WebAgent能够主动搜索学术数据库、筛选文献并进行分析总结。WebAgent包含WebDancer和WebWalker两部分,前者是端到端智能体训练框架,后者是“Web 遍历中的 LLM 基准测试”。WebDancer框架由数据构建、短/长推理、监督微调(SFT)和强化学习(RL)四个阶段组成,采用DAPO算法进行强化学习。WebAgent旨在增强基于网络的AI智能体的多步骤信息搜索能力。
🏷 #WebAgent #阿里巴巴 #开源
GitHub
GitHub - Alibaba-NLP/DeepResearch: Tongyi Deep Research, the Leading Open-source Deep Research Agent
Tongyi Deep Research, the Leading Open-source Deep Research Agent - Alibaba-NLP/DeepResearch
Anthropic 开源“思维追踪”工具,可视化揭秘 AI 内部逻辑
Anthropic于5月29日发布“思维追踪”(Circuit Tracer)开源工具,以图形化方式呈现AI大语言模型的内部思维过程。该工具通过构建“归因图”(Attribution Graph),帮助研究者可视化模型内部运作并进行交互式探索。Circuit Tracer已在GitHub平台以开源库形式发布,研究者可在Decode Research运营的Neuronpedia平台上使用交互式前端查看“归因图”。用户可利用该工具生成自定义归因图,追踪模型内部逻辑,并进行标注、分享和调整特征值以验证研究假设。Anthropic 认为,开源这些工具将促进对语言模型内部运作的更广泛理解。
🏷 #Anthropic #Circuit #Tracer #开源
Anthropic于5月29日发布“思维追踪”(Circuit Tracer)开源工具,以图形化方式呈现AI大语言模型的内部思维过程。该工具通过构建“归因图”(Attribution Graph),帮助研究者可视化模型内部运作并进行交互式探索。Circuit Tracer已在GitHub平台以开源库形式发布,研究者可在Decode Research运营的Neuronpedia平台上使用交互式前端查看“归因图”。用户可利用该工具生成自定义归因图,追踪模型内部逻辑,并进行标注、分享和调整特征值以验证研究假设。Anthropic 认为,开源这些工具将促进对语言模型内部运作的更广泛理解。
🏷 #Anthropic #Circuit #Tracer #开源
Anthropic
Open-sourcing circuit tracing tools
Anthropic is an AI safety and research company that's working to build reliable, interpretable, and steerable AI systems.
HUD SDK:为AI Agent评估提供强大支持,助力开发者轻松构建和测试智能Agent。
支持多种环境,包括Web浏览器、桌面环境和自定义场景;提供丰富的预设任务集,如WebVoyager和GAIA;简单易用的API,快速上手
支持多种环境,包括Web浏览器、桌面环境和自定义场景;提供丰富的预设任务集,如WebVoyager和GAIA;简单易用的API,快速上手
GitHub
GitHub - hud-evals/hud-sdk: HUD SDK
HUD SDK. Contribute to hud-evals/hud-sdk development by creating an account on GitHub.
HunyuanVideo-Avatar:腾讯推出的高保真音频驱动多角色动画生成项目,让视频创作更高效、更生动。
支持多风格、多尺度的动态视频生成,涵盖写实、卡通、3D等多种风格;情感可控,通过音频驱动实现精准情感对齐;多角色对话视频生成,满足复杂场景需求
支持多风格、多尺度的动态视频生成,涵盖写实、卡通、3D等多种风格;情感可控,通过音频驱动实现精准情感对齐;多角色对话视频生成,满足复杂场景需求
GitHub
GitHub - Tencent-Hunyuan/HunyuanVideo-Avatar
Contribute to Tencent-Hunyuan/HunyuanVideo-Avatar development by creating an account on GitHub.
一款强大的文件解析工具,专为AI和LLMs设计,能将代码库和网页内容转化为适合AI处理的格式。
支持多种文件类型和网页爬取;提供代码压缩功能,减少token使用;自动估算VRAM需求,确保模型兼容性
Ingest |#工具
支持多种文件类型和网页爬取;提供代码压缩功能,减少token使用;自动估算VRAM需求,确保模型兼容性
Ingest |#工具
GitHub
GitHub - sammcj/ingest: Parse files (e.g. code repos) and websites to clipboard or a file for ingestions by AI / LLMs
Parse files (e.g. code repos) and websites to clipboard or a file for ingestions by AI / LLMs - sammcj/ingest
Dia-TTS-Server:自托管强大的Dia TTS模型,让文本到语音的转换更加智能和高效。
提供用户友好的Web UI,操作简单便捷;支持SafeTensors/BF16,显著降低内存占用,提升运行效率;语音克隆和对话生成功能强大,可生成自然流畅的多角色对话
#资源参考 #工具 #TTS-Server
提供用户友好的Web UI,操作简单便捷;支持SafeTensors/BF16,显著降低内存占用,提升运行效率;语音克隆和对话生成功能强大,可生成自然流畅的多角色对话
#资源参考 #工具 #TTS-Server
GitHub
GitHub - devnen/Dia-TTS-Server: Self-host the powerful Dia TTS model. This server offers a user-friendly Web UI, flexible API endpoints…
Self-host the powerful Dia TTS model. This server offers a user-friendly Web UI, flexible API endpoints (incl. OpenAI compatible), support for SafeTensors/BF16, voice cloning, dialogue generation, ...