AI中文社区
42.3K subscribers
425 photos
95 videos
32 files
346 links
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
只需一句话,就能克隆你的声纹,还可以精细控制情感、口音、节奏、停顿和语调!

⚜️ research.myshell.ai/open-voice

人工智能 2024 开年就卷!来自 MyShell 的开源 TTS - OpenVoice,可以实现 Zero-shot 方式的跨语言即时声音克隆。官方表示计算成本只有商用 API 的几十分之一。

-- 更多详情
Please open Telegram to view this post
VIEW IN TELEGRAM
真是AI应用上的一股清流
AI中文社区
q star info.pdf
一份54页的PDF文档在疯传...

该份文档揭露了OpenAI计划在2027年前开发出人类水平的通用人工智能(AGI)的详细计划

泄露信息显示:OpenAI在2022年就开始训练一个具有125万亿参数的多模态模型的计划,该模型名为Arrakis或Q*...

原本计划在2025年作为GPT-5发布,但因推理成本高昂而取消...Gobi(GPT-4.5)被重新命名为GPT-5,原因是原本的GPT-5计划被取消。

Q*的下一个阶段,原本被称为GPT-6,后来被重新命名为GPT-7(原计划在2026年发布),因埃隆·马斯克最近的诉讼而被搁置。

计划在2027年发布的Q 2025(GPT-8)旨在实现完全的AGI*。

智商评分:
Q* 2023的智商为48。
Q* 2024的智商为96(被延迟)。
Q* 2025的智商为145(被延迟)。

⚜️ 中文译文
Please open Telegram to view this post
VIEW IN TELEGRAM
AI 比人类更有可能改变你的想法

洛桑联邦理工学院研究发现,GPT-4 等大型语言模型的说服力远超人类。研究员通过随机对照试验,为 820 名人类分配了一个人类或 AI 对手,双方可以就争议话题进行多轮辩论;其中额外设置了"个性化说服"组别,其中一方将能得知对手的性别、年龄、种族、教育水平等。

结果发现,在 AI 根据你的个人信息进行定制辩论时,人类最终被说服的几率提高了 81.7%;即便没有个人信息,GPT-4 相较于人类的优势仍然是 21.3%;当人类辩手拥有你的个人信息时,他们往往会变得非常激进,结果更糟。

-- 更多详情
OpenAI 释出首批 Sora 与好莱坞合作作品

Sora 公布以来,OpenAI一直在与视觉艺术家、设计师、创意总监和电影制作人合作,了解 Sora 如何帮助创意人员将想法变为现实。

《气球人》- shy kids 工作室
作品导演 Walter Woodman 评论到: "尽管 Sora 擅长创造看似真实的事物,但令我们兴奋的是它能够创造出完全超现实的事物。"

《金唱片》- Paul Trillo
Paul Trillo 利用 Sora 展示了原始地球材料到人类生命的时间胶囊: "这是我第一次感受到作为一名电影制片人不受束缚,不受时间、金钱、他人许可的限制,我可以以大胆而令人兴奋的方式进行构思和实验。"

《超越我们的现实》- Don Allen III
Don Allen III 将"怪异"视为其最大的优势: "它不受传统物理定律或思维惯例的约束。Sora 将技术障碍转向了纯粹的创造力……开启了即时可视化和快速原型制作的世界。"

--更多来源 OpenAI
This media is not supported in your browser
VIEW IN TELEGRAM
无需登录即可使用ChatGPT

听闻这个消息,搜索引擎巨头们(此处排除百度)都要抖三抖。 时代变迁, 有些人能借助科技效率飞升, 有些人会被加强实名制监管

-- 更多详情
斯坦福 2024 年人工智能指数报告中的人工智能培训成本估算:

原始transformer模型 - 930 美元
GPT-3 - 430 万美元
GPT-4 - 7840 万美元
Gemini Ultra - 1.914 亿美元

-- 更多详情
英伟达人均分摊的市值达到了惊人的1.02亿美元。

公司有29,600名员工,相当于每人占有市值超过1亿美元,是其他大型科技同行的5倍以上,是沃尔玛和亚马逊等劳动密集型公司的数百倍。

-- 来源
Ilya Sutskever离开OpenAI后成立的SSI公司融了10亿刀

据消息人士透露,成立三个月的SSI估值已达50亿美元。资金将用于获取计算能力和顶尖人才。投资者包括Andreessen Horowitz和红杉资本。

-- 更多详情
Media is too big
VIEW IN TELEGRAM
AI眼镜——看一眼就显示任意人的个人详细信息

两个哈佛大学生AnhPhu Nguyen 和 Caine Ardayfio在推上分享他们项目——以一副装有摄像头的 Meta Ray-Bans 智能眼镜产品,该眼镜可以自动快速识别设备摄像头看到的任意人,并返回眼镜所看到的人的详细信息,包括家庭住址、姓名、电话号码等。

I-XRAY 的独特之处在于它完全自动运行,这要归功于 LLMs。 该系统利用 LLMs来理解、处理和编译来自不同来源的大量信息——推断在线来源之间的关系,例如将姓名从一篇文章链接到另一篇文章,以及通过文本逻辑解析一个人的身份和个人详细信息。LLMs允许全自动和全面的数据提取,这在以前单独使用传统方法是不可能的。从LLM 提取的姓名中,FastPeopleSearch 查找可以识别该人的家庭住址、电话号码及其亲属。

-- 来源
AI 虚构的万圣节晚会

上月底万圣节,两个巴基斯坦青年做了一个 网站 ,上面是全世界各地的活动信息。但是,他们没有披露,为了节省数据搜集的成本,这些活动都是 AI 生成的,实际上不存在。

结果,一个不知情的爱尔兰访问者转发了活动信息,更多的人看到后,又转发到 Tiktok 和 Instagram。结果,万圣节那天晚上,爱尔兰首都都柏林的某条大街上,聚集了上千人,都等着参加活动。
大家在街上站了几个小时,发现上当了,根本没有活动。为了避免更多人聚集,警方不得不发出通告。

第二天,这个事件就上了国际媒体,那两个巴基斯坦青年不得不道歉。它凸显了,内容注明“AI 生成”的必要性。

-- 更多详情
攻击字节大模型实习生获顶会最佳论文

因为破坏字节大模型训练,被字节起诉被索赔800万元的北大博士田柯宇,在NeurIPS 2024上,获得Best Paper。

在这篇Best Paper中,田柯宇和其所在团队首次提出了一种新的图像生成框架,这个框架在图像合成的质量、多样性、数据效率和推理速度方面首次超越了强大的扩散模型,并且具有很好的扩展性和零样本任务泛化能力,并且这个项目已经在Github上积累了4.4k多颗星。 ( 🖥 VAR )

-- 更多来源1来源2
Please open Telegram to view this post
VIEW IN TELEGRAM
微软推出 AI Dev Gallery,可便捷运行本地 AI 模型

微软为 Windows 11 AI+ PC 设备推出 AI Dev Gallery 功能,支持开发者集成本地 AI 模型。相比云端服务,该功能通过本地调用 AI 模型,具备更快响应速度。

AI Dev Gallery 兼容 Windows 10、11 系统,支持 x64 和 ARM64 架构,提供超过 25 个示例模型,涵盖文本、图像、代码、音频、视频及智能控制等领域。运行所需配置包括 20 GB 存储空间,处理高密度 AI 资源建议配备 8GB 显存以上显卡。

-- 来源 | GitHub