开源PDF解析工具olmOCR:百万页处理成本直降32倍,精准提取复杂内容
Ai2推出的开源工具olmOCR基于Qwen2-VL-7B-Instruct模型训练,专为PDF解析设计,可高效提取文本、表格、公式等结构化数据,并以Markdown格式输出。通过25万页多样化数据集微调,其“文档锚定”技术精准处理多栏排版、手写内容及数学公式,处理百万页成本仅190美元(为GPT-4o的1/32)。支持在线使用与本地部署(需英伟达显卡),性能评估显示其Elo评分1800+,用户优选比例超竞品(对比MinerU达71.4%)。开源代码与模型权重,适合学术、法律等场景的高效文档处理。
GitHub | 在线Web
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
Ai2推出的开源工具olmOCR基于Qwen2-VL-7B-Instruct模型训练,专为PDF解析设计,可高效提取文本、表格、公式等结构化数据,并以Markdown格式输出。通过25万页多样化数据集微调,其“文档锚定”技术精准处理多栏排版、手写内容及数学公式,处理百万页成本仅190美元(为GPT-4o的1/32)。支持在线使用与本地部署(需英伟达显卡),性能评估显示其Elo评分1800+,用户优选比例超竞品(对比MinerU达71.4%)。开源代码与模型权重,适合学术、法律等场景的高效文档处理。
GitHub | 在线Web
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
OpenAI计划将视频生成工具Sora整合至ChatGPT,并开发图像生成功能
OpenAI在Discord办公会议上透露,正计划将视频生成工具Sora集成至ChatGPT,以提升用户互动体验。目前Sora仅通过独立网页应用提供,支持生成最长20秒的视频片段,未来在ChatGPT中的版本可能简化编辑功能。产品负责人Rohan Sahai表示,此举旨在扩大Sora的受众群体,并可能通过订阅升级策略吸引用户。此外,OpenAI正在开发基于Sora的AI图像生成器,或比现有DALL-E 3生成更逼真的图像,并计划推出独立移动应用。Sora Turbo模型的更新版本也在开发中,以增强生成能力。
TechCrunch
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
OpenAI在Discord办公会议上透露,正计划将视频生成工具Sora集成至ChatGPT,以提升用户互动体验。目前Sora仅通过独立网页应用提供,支持生成最长20秒的视频片段,未来在ChatGPT中的版本可能简化编辑功能。产品负责人Rohan Sahai表示,此举旨在扩大Sora的受众群体,并可能通过订阅升级策略吸引用户。此外,OpenAI正在开发基于Sora的AI图像生成器,或比现有DALL-E 3生成更逼真的图像,并计划推出独立移动应用。Sora Turbo模型的更新版本也在开发中,以增强生成能力。
TechCrunch
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
皮克斯编剧确认《头脑特工队3》早期开发中,或聚焦主角成年阶段
皮克斯编剧戴夫·霍斯坦(Dave Holstein)在第52届土星奖现场透露,《头脑特工队3》已进入早期构思阶段,计划延续主角Riley的成长故事。新作或将探索其高中毕业或大学入学阶段的情感变化,引入被第二部删减的角色“幸灾乐祸”(Schadenfreude)和“皮裤欢乐”(Lederhosen)。尽管迪士尼尚未官宣,但基于《头脑特工队2》全球17亿美元的票房表现,第三部开发可能性极高。皮克斯CEO皮特·多克特强调,续集需“深入探索人性新维度”,如Joy随年龄增长的身份困惑。此前第二部聚焦青春期情绪,第三部或展现成年初期的自我认知挑战。
The Direct
今天早些时候,《哪吒之魔童闹海》超越《蜘蛛侠:英雄无归》,夺得全球影视票房榜第七名。
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
皮克斯编剧戴夫·霍斯坦(Dave Holstein)在第52届土星奖现场透露,《头脑特工队3》已进入早期构思阶段,计划延续主角Riley的成长故事。新作或将探索其高中毕业或大学入学阶段的情感变化,引入被第二部删减的角色“幸灾乐祸”(Schadenfreude)和“皮裤欢乐”(Lederhosen)。尽管迪士尼尚未官宣,但基于《头脑特工队2》全球17亿美元的票房表现,第三部开发可能性极高。皮克斯CEO皮特·多克特强调,续集需“深入探索人性新维度”,如Joy随年龄增长的身份困惑。此前第二部聚焦青春期情绪,第三部或展现成年初期的自我认知挑战。
The Direct
今天早些时候,《哪吒之魔童闹海》超越《蜘蛛侠:英雄无归》,夺得全球影视票房榜第七名。
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
GT-R R35 正式停产,R36 电动超跑或在 2028 年登场。东风日产致敬电动时代
经过18年的辉煌历史,日产宣布停止接受GT-R R35的订单。自2007年亮相以来,GT-R R35作为“超跑杀手”,经历了多次更新,特别是其3.8升V6双涡轮增压发动机,功率在多次改进中不断提升,成为了众多车迷的经典之作。
随着R35的退役,日产的GT-R血脉将迎来全新转变。预计R36将是一款全电动超跑,采用高科技固态电池技术。然而,由于固态电池尚未准备好,R36预计最早将在2028年面世,成为日产的旗舰车型,展示其最新的技术。
此外,东风日产昨日发博祝贺小米SU7 Ultra成功上市:“纽博格林让我们一战成名,十二年前是我,GT-R;十二年后是你,SU7 Ultra,致敬这个电的时代!”,可能暗示着公司迈入电动汽车新时代,且积极推动未来电动出行发展。
Nissan | Carscoops | 东风日产
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
经过18年的辉煌历史,日产宣布停止接受GT-R R35的订单。自2007年亮相以来,GT-R R35作为“超跑杀手”,经历了多次更新,特别是其3.8升V6双涡轮增压发动机,功率在多次改进中不断提升,成为了众多车迷的经典之作。
随着R35的退役,日产的GT-R血脉将迎来全新转变。预计R36将是一款全电动超跑,采用高科技固态电池技术。然而,由于固态电池尚未准备好,R36预计最早将在2028年面世,成为日产的旗舰车型,展示其最新的技术。
此外,东风日产昨日发博祝贺小米SU7 Ultra成功上市:“纽博格林让我们一战成名,十二年前是我,GT-R;十二年后是你,SU7 Ultra,致敬这个电的时代!”,可能暗示着公司迈入电动汽车新时代,且积极推动未来电动出行发展。
Nissan | Carscoops | 东风日产
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
广东亿万富翁家庭达到17100户
日前,胡润研究院发布《2024胡润财富报告》,显示富裕家庭数量虽然微降,广东依旧是聚集最多高净值家庭的地区。广东领跑千万资产高净值家庭数量,尽管较去年减少了2400户,总数仍达到29.8万户,其中拥有千万可投资资产的家庭为16.8万户;北京、上海分列第二和第三。资产亿元以上的超高净值家庭共13万户,同比减少1.7%,减少了2200户,其中拥有亿元可投资资产的家庭为7.8万户。北京继续保持最多亿元资产超高净值家庭,广东以17100户位居第二,比上年减少了260户,跌幅为1.5%,拥有亿元可投资资产的家庭有10350户。
胡润百富 | 新浪科技
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
日前,胡润研究院发布《2024胡润财富报告》,显示富裕家庭数量虽然微降,广东依旧是聚集最多高净值家庭的地区。广东领跑千万资产高净值家庭数量,尽管较去年减少了2400户,总数仍达到29.8万户,其中拥有千万可投资资产的家庭为16.8万户;北京、上海分列第二和第三。资产亿元以上的超高净值家庭共13万户,同比减少1.7%,减少了2200户,其中拥有亿元可投资资产的家庭为7.8万户。北京继续保持最多亿元资产超高净值家庭,广东以17100户位居第二,比上年减少了260户,跌幅为1.5%,拥有亿元可投资资产的家庭有10350户。
胡润百富 | 新浪科技
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
苹果加速芯片全自研布局 5G调制解调器2026年对标高通
苹果芯片自研版图再扩张,最新路线图显示其正从三大维度重构通信技术生态:首款自研5G调制解调器C1已搭载于iPhone 16e,专注能效优化;2026年C2(代号Ganymede)将支持毫米波与6Gbps下载速度,性能对标高通旗舰产品;2027年C3(Prometheus)计划集成卫星通信与AI功能实现技术反超。同步推进的还有Wi-Fi/蓝牙整合芯片Proxima,预计年内随HomePod mini等设备亮相,支持Wi-Fi 6E并具备路由功能。
为实现芯片高度集成,苹果拟于2028年将调制解调器与主处理器融合设计。该战略不仅涉及手机,更计划2026年为MacBook引入蜂窝网络支持,全面构建端到端通信技术闭环。
9to5mac
📮投稿 ☘️频道 🌸聊天 🗞️𝕏
苹果芯片自研版图再扩张,最新路线图显示其正从三大维度重构通信技术生态:首款自研5G调制解调器C1已搭载于iPhone 16e,专注能效优化;2026年C2(代号Ganymede)将支持毫米波与6Gbps下载速度,性能对标高通旗舰产品;2027年C3(Prometheus)计划集成卫星通信与AI功能实现技术反超。同步推进的还有Wi-Fi/蓝牙整合芯片Proxima,预计年内随HomePod mini等设备亮相,支持Wi-Fi 6E并具备路由功能。
为实现芯片高度集成,苹果拟于2028年将调制解调器与主处理器融合设计。该战略不仅涉及手机,更计划2026年为MacBook引入蜂窝网络支持,全面构建端到端通信技术闭环。
9to5mac
📮投稿 ☘️频道 🌸聊天 🗞️𝕏