Forwarded from 风向旗参考快讯
VLC 下载量突破60亿次 预览AI生成的字幕
VLC 媒体播放器,由非营利组织 VideoLAN 开发的流行开源软件,全球下载量已突破六十亿次并预告了一个人工智能驱动的字幕系统。VideoLAN 在 CES 大会上演示了这项新功能,使用在用户设备本地运行的开源人工智能模型自动为任何视频生成实时字幕,然后可以翻译成多种语言,无需互联网连接或云服务。该公司并未透露计划何时推出这项功能。VideoLAN 始于1996年,是巴黎中央理工学院学生的一个项目,尝试在校园内流式传输视频。VideoLAN 总裁肯普夫在领英帖子中写道:“即使在流媒体服务时代,VLC 的活跃用户数量实际上也在增长。”
—— Techcrunch
VLC 媒体播放器,由非营利组织 VideoLAN 开发的流行开源软件,全球下载量已突破六十亿次并预告了一个人工智能驱动的字幕系统。VideoLAN 在 CES 大会上演示了这项新功能,使用在用户设备本地运行的开源人工智能模型自动为任何视频生成实时字幕,然后可以翻译成多种语言,无需互联网连接或云服务。该公司并未透露计划何时推出这项功能。VideoLAN 始于1996年,是巴黎中央理工学院学生的一个项目,尝试在校园内流式传输视频。VideoLAN 总裁肯普夫在领英帖子中写道:“即使在流媒体服务时代,VLC 的活跃用户数量实际上也在增长。”
—— Techcrunch
Forwarded from 拾趣
Emby影音推荐,聚合搜索,好用
https://apps.apple.com/us/app/reflix/id6621243955
https://apps.apple.com/us/app/reflix/id6621243955
App Store
Reflix - Smart Aggreg. Client
Reflix - Your Ultimate Movie-Watching Companion, Elevating Your Viewing Experience to New Heights
Explore globally trending entertainment content, track your viewing progress, connect multiple private Emby services, and enjoy smart recommendations for the…
Explore globally trending entertainment content, track your viewing progress, connect multiple private Emby services, and enjoy smart recommendations for the…
Forwarded from Solidot
Meta 朝通用翻译器前进了一大步
2025-01-17 16:51 by 沙皇的邮件
Meta 研究人员研发出一个 AI 模型,能即时翻译多达 101 种语言的语音和文本,包括直接语音到语音翻译。名为 SEAMLESSM4T 的 AI 模型,填补了语言覆盖方面的空白,并且性能优于现有的系统,它支持语音到语音(识别 101 种语言并翻译为 36 种语言)、语音到文本(101 种语言译为 96 种)、文本到语音(96 种语言译为 36 种)、文本到文本(96 种语言)的翻译,以及自动语音识别(96 种语言)。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。研究团队表示,在语音到语音的翻译中,SEAMLESSM4T 的文本翻译比现有系统准确率提升 23%。同时该模型可过滤背景噪音并适应说话者的差异。
https://www.nature.com/articles/s41586-024-08359-z
https://news.sciencenet.cn/htmlnews/2025/1/537626.shtm
#人工智能
2025-01-17 16:51 by 沙皇的邮件
Meta 研究人员研发出一个 AI 模型,能即时翻译多达 101 种语言的语音和文本,包括直接语音到语音翻译。名为 SEAMLESSM4T 的 AI 模型,填补了语言覆盖方面的空白,并且性能优于现有的系统,它支持语音到语音(识别 101 种语言并翻译为 36 种语言)、语音到文本(101 种语言译为 96 种)、文本到语音(96 种语言译为 36 种)、文本到文本(96 种语言)的翻译,以及自动语音识别(96 种语言)。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。研究团队表示,在语音到语音的翻译中,SEAMLESSM4T 的文本翻译比现有系统准确率提升 23%。同时该模型可过滤背景噪音并适应说话者的差异。
https://www.nature.com/articles/s41586-024-08359-z
https://news.sciencenet.cn/htmlnews/2025/1/537626.shtm
#人工智能
Forwarded from 为也行
Please open Telegram to view this post
VIEW IN TELEGRAM