消除信息差
894 subscribers
555 photos
167 videos
344 links
分享AI & Web3干货
Download Telegram
韩国这波 AI 反击有点意思,519B 参数却只用 33B 的算力?

刚发布的 SKT A.X K1,主打一个“大脑子小身板”。

技术很“鸡贼”:用了 MoE(混合专家)架构。这好比公司有 500 个顾问,但每次开会只拉最懂行的 30 个人进场。

韩语语境确实强:用它润色出来的敬语和行业黑话,比 GPT-5 更地道,少了很多“翻译腔”。

定位不同:它更像个“老师傅”,专门用来蒸馏小模型。这意味着以后可能用更低的成本,就能跑出高质量的韩语垂类模型。

#AI工作流 #A_X_K1 #独立开发 #数字游民 #大模型评测
AntV 新开源的 Infographic 引擎,让我体验了一把“文本直接生成可编辑图表”的快乐,做年终汇报少熬了一个通宵。

1️⃣ 不是生成“死图”:跟 NanoBanana 不一样,它吐出的是 SVG/React 代码。这意味着生成的图表文字、颜色都能改,不用因为一个错别字就无限重绘(这点对强迫症太友好了)。

2️⃣ 场景实测:我把它接到了我的自动化脚本里,把每天抓取的 RSS 新闻自动转成“时间轴信息图”发邮箱,阅读率比纯文字高了一倍。

3️⃣ 门槛提醒:目前看它还是个底层引擎,对开发者很香(直接集成进你的 SaaS),但非技术人员想当“傻瓜软件”用还得等一等 GUI 封装。

#数据可视化 #AntV #独立开发 #AI工作流 #前端工具
让 Claude 和 Gemini 在后台“吵架”,帮我把重构耗时砍了一半。

单模型写复杂架构总容易幻觉,最近我试了开源的 Mysti,“多模型互审”的功能,直接把写代码变成了“技术委员会开会”。

原理很简单:让一个 AI 写代码,另一个 AI 专门负责挑刺(Debate),最后综合出最优解。

1️⃣ 真实场景:之前在赶一个支付接口,Gemini 给的方案看似完美,结果被我设为“安全专家”角色的 Claude 指出有一个并发漏洞。要是以前单用 Copilot,这个坑我估计上线后才能发现。

2️⃣ 不花冤枉钱:它不做二道贩子,直接调用你本地已有的 API (Claude/Copilot/Gemini),对我这种本来就订阅了多个服务的开发者来说,相当于免费升级。

3️⃣ 效率对比:体感上,虽然比单次生成慢个几秒,但因为减少了反复修 Bug 的时间,整体返工率大概降了 30%。

大家现在写复杂逻辑是信单个 AI,还是有人工 Review 流程?

#AI工作流 #独立开发 #Mysti #开源工具 #代码审计
哪怕只为了搞定「多镜头一致性」,这个开源项目也值得你折腾一下午。

这两天跑通了字节开源的 StoryMem,感觉它是目前长视频叙事的最佳解:

1️⃣ 它不做「一镜到底」的伪长视频,而是模拟导演思维:生成新镜头时,自动去「记忆库」检索之前的关键帧。

2️⃣ 实测下来,它解决了最头疼的 Cross-shot Consistency 问题。比起我之前用 Wan2.2 盲抽,它能记住主角穿什么衣服、长什么样,不用手动炼 LoRA 也能稳住。

⚠️ 目前还是纯代码库(Python),没界面,依赖本地算力,小白慎入。

但如果你想做短剧,这东西能省下大量修图时间。

#StoryMem #AI视频 #开源项目 #独立开发 #效率工具
🎬 视频转图文最头大的就是逐帧截图+配文,这周挖到一个开源小工具,帮我省掉了至少 80% 的脏活。

ClipSketch AI,一个能把视频瞬间变成手绘故事的工作台。

1️⃣ 工作流闭环:以前我要截图→修图→写文案,这玩意儿直接解析 B 站/红书链接,提取关键帧后用 Gemini 重绘成漫画风,连社媒文案都顺带生成了。

2️⃣ 低成本复用:特别适合做二创或教程拆解。昨天我在机场候机,用它把一个 15 分钟的 Python 教学视频转成了图文教程,既规避了查重,视觉风格还很统一。

3️⃣ 纯本地部署:React 写的纯前端,clone 下来就能跑。目前 Gemini 有免费额度,等于白嫖算力,不过实测长视频解析偶尔会超时,建议先切片。

如果你也是追求“一鱼多吃”的内容创作者,这项目值得花一个周末折腾一下。

#AI工作流 #独立开发 #效率工具 #ClipSketch #开源项目
深度调研不烧钱,实测阶跃星辰刚开源的 32B 模型 Step-DeepResearch。

主打“端到端 Deep Research”,把类似 Gemini 的复杂搜索+报告生成能力,塞进了一个高性价比的单体模型里。

1️⃣ 逻辑像个“多疑”的实习生:普通 RAG 是“搜完即答”,它是“规划-搜索-反思-修正”。我试着让它写一份 Web3 竞品分析,它会自动交叉验证数据源,而不是瞎编。

2️⃣ 成本友好:32B 的参数量,对中小团队很香。官方提到单次任务成本不到 5 毛,我实测下来,确实比自己搭 Agent 调用其他 Deep Research API 便宜太多。

3️⃣ 使用场景:对写长报告、行业综述很稳,但如果你只是想查个实时汇率或天气,用它就有点“大炮打蚊子”,反应也没那么快。

做深度调研,大家最常用是 Perplexity 还是还在手动 Google?

#AI工作流 #开源模型 #深度调研 #StepFun #独立开发
2025年大家用的最多的 AI 工具是什么?

最推荐订购的 AI 工具又是什么?
微软这次有点“急”了,悄悄把 GPT 5.2 塞进了免费的 Copilot (Smart Plus 模式)。👇

这两天我把手头几个重度任务切过去实测,说两个体感最明显的点:

1️⃣ 代码重构:我试着扔了一段陈年老代码,它成功优化了异常处理逻辑。SWE-bench 80% 的分确实能落地,比 5.1 稳很多。

2️⃣ 超长文档:400k 上下文是真好用。几百页的技术文档直接喂进去,提取的关键参数没出现之前的“胡编乱造”(官方说幻觉率降了 38%)。

虽然生成速度比 Instant 模式慢,但这种“思考”后的逻辑密度,完全值得等。

#AI工作流 #GPT5 #独立开发 #微软Copilot #效率工具
试了下刚更的 Qwen Code v0.6.0,体感比之前「顺滑」了不少。

1️⃣ 自定义 Skills 真香:以前每次都要重复教 AI 怎么写符合我习惯的 Unit Test,现在能把这套逻辑封装成 Skill。需要时一行指令调用,感觉像是给 AI 发了个标准 SOP,不用反复费口舌。

2️⃣ 自动压缩省 Token:新版的 /compress 和 /summary 命令终于支持非交互模式了。我跑长脚本时它能自动压缩上下文,不用担心聊着聊着 Token 爆炸,对独立开发者的钱包很友好 💸

3️⃣ 模型选择更灵活:原生支持接入 Gemini 和 Anthropic 了。我这两天实测:复杂架构设计切 Claude,简单搬砖切回 Qwen,配合起来效率最高。

虽然配置新 Provider 时要改下环境变量,但跑通后是真舒服。

#AI工作流 #QwenCode #本地部署 #独立开发 #效率工具
1
元旦快乐!

2025大家都收获了啥?
试了下 Qwen-Image-2512,这可能是目前开源界最顺手的生图模型。

1️⃣ 文字排版真的强:直接 Prompt 生成带字布局,不仅单词拼对率高,连字体设计感都在线,不用再开 Canva 二次加工。

2️⃣ “AI 味”少了很多:以前用 SD 跑真人都自带磨皮滤镜,这个版本把皮肤纹理和光影还原得很“糙”,做 Landing Page 素材反而更有质感。

目前看 AI Arena 的盲测数据,它在开源梯队里确实属于第一梯队。虽然本地部署对显存有点要求,但作为生产力工具,这点配置投入值得。

#AI工作流 #QwenImage #开源模型 #独立开发 #效率工具
我用 Karpathy 刚发的 llm-council 跑了几天代码,复杂任务的一次通过率直接翻倍。

这种让大模型「互喷」的思路,才是我心中未来 Agent 该有的样子。

1️⃣ 像极了公司开会:丢一个 Prompt 进去,不仅让 Claude、Gemini、GPT 各自回答,最绝的是第二步「匿名互评(Peer Review)」。我就亲眼看着 Claude 犀利指出了 GPT 代码里的逻辑漏洞,这在单一大模型里很难遇到。

2️⃣ 实战场景:写某个功能单用 GPT 调试了三次都不通。我把需求丢进 llm-council,一轮辩论后,「主席」模型直接给出了融合各家优点的最终方案,把 Bug 揪出来了。

虽然多花点 Token 钱(毕竟要调多次 API),但比起半夜修 Bug 的痛苦,这笔账绝对算得过来。

#AI工作流 #独立开发 #Karpathy #LLM #效率工具
终于不用在 Twitter、CMC 和 K 线图之间来回切屏了。

我实测了 KuCoin 新出的原生 AI 助手 KIA,帮我把每日复盘的「纯体力活」时间压缩了至少 30%。

它不是那种只会聊闲天的通用 AI,而是个直接长在交易所里的「全职初级分析师」。

1️⃣ 自动写研报(In-depth Research):这是我最常用的功能。以前看一个新币要搜半天,现在扔给它,十来分钟它就能结合实时新闻、链上异动把情绪面和基本面揉成一份简报。

2️⃣ 技术面辅助:随手问它「大饼短期支撑位在哪」,它能结合图表给个大概参考。虽然深度不如老手自己画得精准,但用来快速缩小信息差够用了。

⚠️ 别把它当「带单老师」,它本质是高效的信息过滤器,最终决策还得靠自己。目前普通用户每天有 20 次快问和 2 次深度研报的免费额度(按日重置),对日常盯盘来说够用。

你现在的 Web3 工作流里,有哪些环节已经用 AI 替代了?

#AI工作流 #Web3工具 #KIA #数字游民 #效率提升
This media is not supported in your browser
VIEW IN TELEGRAM
广告投放测素材测到头秃? Arcads 成功实现把“拍视频”变成了“跑脚本”。

靠它 2 小时搞定了原本需要拍两天的 A/B 测试的素材量。

它把“找演员+背词+拍摄”给 API 化了:

1️⃣ 批量裂变:我写好 1 个脚本,选 5 个不同风格 AI 演员,一键生成多语言版本。对于不想露脸的内容创作者,省了制作成本。

2️⃣ 场景避坑:亲测它最适合讲 SaaS 或 App 痛点。如果你是卖衣服鞋子这种强实物展示的,还是得自己拍 B-Roll 混剪,光靠它生成的有点“干”。

虽然成片还得进剪映细调字幕节奏,但作为素材“底料”绝对够了。

大家现在做海外投放,素材本地化是外包还是用 AI 搞?

#AI工作流 #独立开发 #Arcads #增长黑客 #出海营销
字节搞了个叫 AnyGen 的字节版 Manus,支持定时执行,支持连接mcp。

我试了下的确和 Manus 很像,也是直接交付结果,而不是答案。

目前功能有做ppt,调研,数据分析,总结视频,以后估计能干更多活。

目前唯一的缺点不能调用本地浏览器,只能用云端浏览器,干活的时候容易遇到弹登陆,真人验证等问题

https://www.anygen.io/home?invitation_code=988UYPTR1LAXGEI
Google Cloud 发布了《AI Agents Handbook》(AI 代理手册),帮助企业快速将 AI Agent 落地

https://services.google.com/fh/files/misc/ai_agents_handbook.pdf
我测试了下当前AI PPT的办公水平,同一段提示词分别用Claude Code Skills(命令行),MiniMax,智谱,Anygen,Manus,Skywork生成PPT,全部都支持导出PPTS格式到本地。

个人观点,Claude Code Skills有配色,无图表(能用太简陋);MiniMax有背景图,无图表,文字乱码(不能用);智谱无配色,有图表,字体和图排版太小(能用不美观);Anygen有背景图,无图表,有配色(美观能用太简陋);Manus有图表,简单配色(能用);Skywork有背景,有图标,有配色(美观能用)。