扫地僧º笔记
15K subscribers
2.13K photos
52 videos
154 files
3.29K links
一种简洁观点
Download Telegram
世界不要发展这么快 🙈
交互很棒
Forwarded from 风向旗参考快讯
VLC 下载量突破60亿次 预览AI生成的字幕

VLC 媒体播放器,由非营利组织 VideoLAN 开发的流行开源软件,全球下载量已突破六十亿次并预告了一个人工智能驱动的字幕系统。VideoLAN 在 CES 大会上演示了这项新功能,使用在用户设备本地运行的开源人工智能模型自动为任何视频生成实时字幕,然后可以翻译成多种语言,无需互联网连接或云服务。该公司并未透露计划何时推出这项功能。VideoLAN 始于1996年,是巴黎中央理工学院学生的一个项目,尝试在校园内流式传输视频。VideoLAN 总裁肯普夫在领英帖子中写道:“即使在流媒体服务时代,VLC 的活跃用户数量实际上也在增长。”

—— Techcrunch
Cool
百年孤独:变成没有过去的白痴。
Forwarded from 为也行
https://www.threads.net/@cy.4_25
这位女生的声音真的很美,光听一听就让人心情变好。
不知道这样公开分享是否恰当?
今天在 rednote 上发了不下十条 you are beautiful.
Forwarded from Solidot
Meta 朝通用翻译器前进了一大步

2025-01-17 16:51 by 沙皇的邮件

Meta 研究人员研发出一个 AI 模型,能即时翻译多达 101 种语言的语音和文本,包括直接语音到语音翻译。名为 SEAMLESSM4T 的 AI 模型,填补了语言覆盖方面的空白,并且性能优于现有的系统,它支持语音到语音(识别 101 种语言并翻译为 36 种语言)、语音到文本(101 种语言译为 96 种)、文本到语音(96 种语言译为 36 种)、文本到文本(96 种语言)的翻译,以及自动语音识别(96 种语言)。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。研究团队表示,在语音到语音的翻译中,SEAMLESSM4T 的文本翻译比现有系统准确率提升 23%。同时该模型可过滤背景噪音并适应说话者的差异。

https://www.nature.com/articles/s41586-024-08359-z
https://news.sciencenet.cn/htmlnews/2025/1/537626.shtm

#人工智能
Forwarded from 为也行
Please open Telegram to view this post
VIEW IN TELEGRAM