AI中文社区

只需一句话，就能克隆你的声纹，还可以精细控制情感、口音、节奏、停顿和语调！

⚜️

research.myshell.ai/open-voice

人工智能 2024 开年就卷！来自 MyShell 的开源 TTS - OpenVoice，可以实现 Zero-shot 方式的跨语言即时声音克隆。官方表示计算成本只有商用 API 的几十分之一。

-- 更多详情

Please open Telegram to view this post

VIEW IN TELEGRAM

80.9K views04:12

AI中文社区

真是AI应用上的一股清流

62.2K views11:53

52.4K views06:04

一份54页的PDF文档在疯传...

该份文档揭露了OpenAI计划在2027年前开发出人类水平的通用人工智能（AGI）的详细计划

泄露信息显示：OpenAI在2022年就开始训练一个具有125万亿参数的多模态模型的计划，该模型名为Arrakis或Q*...

原本计划在2025年作为GPT-5发布，但因推理成本高昂而取消...Gobi（GPT-4.5）被重新命名为GPT-5，原因是原本的GPT-5计划被取消。

Q*的下一个阶段，原本被称为GPT-6，后来被重新命名为GPT-7（原计划在2026年发布），因埃隆·马斯克最近的诉讼而被搁置。

计划在2027年发布的Q 2025（GPT-8）旨在实现完全的AGI*。

智商评分：
Q* 2023的智商为48。
Q* 2024的智商为96（被延迟）。
Q* 2025的智商为145（被延迟）。

⚜️

中文译文

Please open Telegram to view this post

VIEW IN TELEGRAM

baoyu.io

揭秘 OpenAI 至 2027 年打造通用人工智能的蓝图 [译]

本文揭示了我搜集到的关于 OpenAI 计划（经过调整）于 2027 年打造达到人类水平的通用人工智能（AGI）的信息。虽然不是所有的信息都容易证实，但希望足够的证据能够让你信服。

67.5K views06:04

AI中文社区

53.4K views04:57

AI中文社区

AI 比人类更有可能改变你的想法

洛桑联邦理工学院研究发现，GPT-4 等大型语言模型的说服力远超人类。研究员通过随机对照试验，为 820 名人类分配了一个人类或 AI 对手，双方可以就争议话题进行多轮辩论；其中额外设置了"个性化说服"组别，其中一方将能得知对手的性别、年龄、种族、教育水平等。

结果发现，在 AI 根据你的个人信息进行定制辩论时，人类最终被说服的几率提高了 81.7%；即便没有个人信息，GPT-4 相较于人类的优势仍然是 21.3%；当人类辩手拥有你的个人信息时，他们往往会变得非常激进，结果更糟。

-- 更多详情

61.6K viewsedited 11:03

AI中文社区

0:46

This media is not supported in your browser

VIEW IN TELEGRAM

1:31

This media is not supported in your browser

VIEW IN TELEGRAM

1:14

This media is not supported in your browser

VIEW IN TELEGRAM

OpenAI 释出首批 Sora 与好莱坞合作作品

Sora 公布以来，OpenAI一直在与视觉艺术家、设计师、创意总监和电影制作人合作，了解 Sora 如何帮助创意人员将想法变为现实。

《气球人》- shy kids 工作室
作品导演 Walter Woodman 评论到: "尽管 Sora 擅长创造看似真实的事物，但令我们兴奋的是它能够创造出完全超现实的事物。"

《金唱片》- Paul Trillo
Paul Trillo 利用 Sora 展示了原始地球材料到人类生命的时间胶囊: "这是我第一次感受到作为一名电影制片人不受束缚，不受时间、金钱、他人许可的限制，我可以以大胆而令人兴奋的方式进行构思和实验。"

《超越我们的现实》- Don Allen III
Don Allen III 将"怪异"视为其最大的优势: "它不受传统物理定律或思维惯例的约束。Sora 将技术障碍转向了纯粹的创造力……开启了即时可视化和快速原型制作的世界。"

--更多来源 OpenAI

92.6K views11:08

AI中文社区

0:23

This media is not supported in your browser

VIEW IN TELEGRAM

无需登录即可使用ChatGPT

听闻这个消息，搜索引擎巨头们(此处排除百度)都要抖三抖。时代变迁，有些人能借助科技效率飞升，有些人会被加强实名制监管

-- 更多详情

95.6K views05:16

AI中文社区

斯坦福 2024 年人工智能指数报告中的人工智能培训成本估算：

原始transformer模型 - 930 美元
GPT-3 - 430 万美元
GPT-4 - 7840 万美元
Gemini Ultra - 1.914 亿美元

-- 更多详情

109.1K viewsedited 15:04

AI中文社区

英伟达人均分摊的市值达到了惊人的1.02亿美元。

公司有29,600名员工，相当于每人占有市值超过1亿美元，是其他大型科技同行的5倍以上，是沃尔玛和亚马逊等劳动密集型公司的数百倍。

-- 来源

101.5K views11:43

AI中文社区

Ilya Sutskever离开OpenAI后成立的SSI公司融了10亿刀

据消息人士透露，成立三个月的SSI估值已达50亿美元。资金将用于获取计算能力和顶尖人才。投资者包括Andreessen Horowitz和红杉资本。

-- 更多详情

73.3K viewsedited 16:09

AI眼镜——看一眼就显示任意人的个人详细信息

两个哈佛大学生AnhPhu Nguyen 和 Caine Ardayfio在推上分享他们项目——以一副装有摄像头的 Meta Ray-Bans 智能眼镜产品，该眼镜可以自动快速识别设备摄像头看到的任意人，并返回眼镜所看到的人的详细信息，包括家庭住址、姓名、电话号码等。

I-XRAY 的独特之处在于它完全自动运行，这要归功于 LLMs。该系统利用 LLMs来理解、处理和编译来自不同来源的大量信息——推断在线来源之间的关系，例如将姓名从一篇文章链接到另一篇文章，以及通过文本逻辑解析一个人的身份和个人详细信息。LLMs允许全自动和全面的数据提取，这在以前单独使用传统方法是不可能的。从LLM 提取的姓名中，FastPeopleSearch 查找可以识别该人的家庭住址、电话号码及其亲属。

-- 来源

64.5K views11:10

AI中文社区

AI 虚构的万圣节晚会

上月底万圣节，两个巴基斯坦青年做了一个网站，上面是全世界各地的活动信息。但是，他们没有披露，为了节省数据搜集的成本，这些活动都是 AI 生成的，实际上不存在。

结果，一个不知情的爱尔兰访问者转发了活动信息，更多的人看到后，又转发到 Tiktok 和 Instagram。结果，万圣节那天晚上，爱尔兰首都都柏林的某条大街上，聚集了上千人，都等着参加活动。
大家在街上站了几个小时，发现上当了，根本没有活动。为了避免更多人聚集，警方不得不发出通告。

第二天，这个事件就上了国际媒体，那两个巴基斯坦青年不得不道歉。它凸显了，内容注明“AI 生成”的必要性。

-- 更多详情

56.4K views06:06

AI中文社区

攻击字节大模型实习生获顶会最佳论文

因为破坏字节大模型训练，被字节起诉被索赔800万元的北大博士田柯宇，在NeurIPS 2024上，获得Best Paper。

在这篇Best Paper中，田柯宇和其所在团队首次提出了一种新的图像生成框架，这个框架在图像合成的质量、多样性、数据效率和推理速度方面首次超越了强大的扩散模型，并且具有很好的扩展性和零样本任务泛化能力，并且这个项目已经在Github上积累了4.4k多颗星。 ( 🖥 VAR )

-- 更多来源1 ，来源2

Please open Telegram to view this post

VIEW IN TELEGRAM

44.8K viewsedited 06:52

AI中文社区

#推荐阅读

与 AI 一起编程-面向非工程师的入门指南

(需通过微信打开观看分享视频)

https://mp.weixin.qq.com/s/xTEluwBU91Hf4fpwG_UF8g

41.4K viewsedited 03:26

AI中文社区

微软推出 AI Dev Gallery，可便捷运行本地 AI 模型

微软为 Windows 11 AI+ PC 设备推出 AI Dev Gallery 功能，支持开发者集成本地 AI 模型。相比云端服务，该功能通过本地调用 AI 模型，具备更快响应速度。

AI Dev Gallery 兼容 Windows 10、11 系统，支持 x64 和 ARM64 架构，提供超过 25 个示例模型，涵盖文本、图像、代码、音频、视频及智能控制等领域。运行所需配置包括 20 GB 存储空间，处理高密度 AI 资源建议配备 8GB 显存以上显卡。

-- 来源 | GitHub

37.1K views11:57

About

Blog

Apps

Platform