白皮书 | Vision Research PHANTOM 高速摄影机全景解析:从基础定义到多领域技术应用
https://mp.weixin.qq.com/s/gvIETA1Kp32JRZ7TTkCrsA
https://mp.weixin.qq.com/s/gvIETA1Kp32JRZ7TTkCrsA
Forwarded from 无印🐑品 #BeHonest
科技圈🎗在花频道📮
FFmpeg 8.0 合并 Vulkan 硬件加速支持 Apple ProRes RAW 编解码 FFmpeg 开发团队宣布,在即将发布的 FFmpeg 8.0 版本中,已合并对 Apple ProRes RAW 编解码的 Vulkan 硬件加速支持。该实现由开发者 Lynne 完成,支持 ProRes RAW 0 和 1 两个版本,能够在高分辨率(如 5.8k)视频流下实现高并发加速,提升解码效率。 此次更新还包括近期合并的 Vulkan AV1 编码和 VP9 解码功能。基准测试显示,AMD 6900XT…
Ithome
视频背景音自动转为文字描述:多媒体框架 FFmpeg 8.0 引入 OpenAI Whisper 音频 AI 模型 - IT之家
FFmpeg 8.0将整合OpenAI的Whisper语音识别模型,新增Whisper音频过滤器,可自动将视频背景音频转换为文字描述,支持多种输出格式和实时处理。#视频处理##AI技术#
Ray 的 HDR 指北 pinned «白皮书 | Vision Research PHANTOM 高速摄影机全景解析:从基础定义到多领域技术应用 https://mp.weixin.qq.com/s/gvIETA1Kp32JRZ7TTkCrsA»
Ray 的 HDR 指北 pinned «这纪录片,笑死我了 https://www.youtube.com/watch?v=ltgyS8oJC8g https://www.youtube.com/watch?v=1H3xQaf7BFI https://www.bilibili.com/video/BV1D4t8zWEyQ»
Forwarded from Alan的小纸箱
Meta 计划在今年推出一款名为 Hypernova 的智能眼镜,这款眼镜配备了一个小型单目抬头显示器(HUD),这款小型 HUD 将用于显示时间、天气和通知,辅助构图和预览照片,提供逐向导航,显示现实世界语音的字幕和翻译,还可以选择以文本形式而非音频显示 Meta 的人工智能回应。
加入 HUD 后,Hypernova 的重量约为 70 克,相比之下,Ray-Ban Meta 眼镜的重量为 50 克。最终零售价约 800 美元。Meta 计划在今年推出一款名为 Hypernova 的智能眼镜,这款眼镜配备了一个小型单目抬头显示器(HUD),这款小型 HUD 将用于显示时间、天气和通知,辅助构图和预览照片,提供逐向导航,显示现实世界语音的字幕和翻译,还可以选择以文本形式而非音频显示 Meta 的人工智能回应。
加入 HUD 后,Hypernova 的重量约为 70 克,相比之下,Ray-Ban Meta 眼镜的重量为 50 克。最终零售价约 800 美元。
加入 HUD 后,Hypernova 的重量约为 70 克,相比之下,Ray-Ban Meta 眼镜的重量为 50 克。最终零售价约 800 美元。Meta 计划在今年推出一款名为 Hypernova 的智能眼镜,这款眼镜配备了一个小型单目抬头显示器(HUD),这款小型 HUD 将用于显示时间、天气和通知,辅助构图和预览照片,提供逐向导航,显示现实世界语音的字幕和翻译,还可以选择以文本形式而非音频显示 Meta 的人工智能回应。
加入 HUD 后,Hypernova 的重量约为 70 克,相比之下,Ray-Ban Meta 眼镜的重量为 50 克。最终零售价约 800 美元。
Forwarded from Alan的小纸箱
看到 Android 端 Google Photos 上线了基于 Gemini 实现的 AI 照片查找助手。
试了一下官方推荐的 Prompt 查找我自己的车牌号,结果返回的结果全是我在美国拍的车牌,Gemini 疑似有点太想家了🌚。
试了一下官方推荐的 Prompt 查找我自己的车牌号,结果返回的结果全是我在美国拍的车牌,Gemini 疑似有点太想家了🌚。
理光 RICOH GR IV 发布
https://mp.weixin.qq.com/s/_7sr29M_hn9ySsbjvOhssA
“另外,将图像传感器输出的高 SN 比的图像信息通过自主研发的处理器加速器单元进行优化后再送入图像处理引擎,实现了 ISO204800 的高感光度性能。”
对 RAW 进行硬件降噪和以及增益放大这事情,描述得还挺文绉绉的。
https://mp.weixin.qq.com/s/_7sr29M_hn9ySsbjvOhssA
“另外,将图像传感器输出的高 SN 比的图像信息通过自主研发的处理器加速器单元进行优化后再送入图像处理引擎,实现了 ISO204800 的高感光度性能。”
对 RAW 进行硬件降噪和以及增益放大这事情,描述得还挺文绉绉的。
这几天在旅途上,在这些的场景下,会特别有意愿,多次使用到手机上的 3D 相机功能。
在使用过程中,对比 iPhone 的 3D 空间相机,vivo / iQOO 手机上的 3D 相机功能,现在一个最明显的软件层面使用体验问题是:它拍摄后只能生成为 side by side 格式的 JPEG 图片或视频。
而 iPhone 拍摄的 3D 空间照片,正如之前拆解时发现的( https://t.me/rayinhdr/652 ),其实是【一组小尺寸的双目 3D SDR 照片 + 一张常规包含 HDR Gain Map 的 24MP 主摄照片 + 录制 2D Live Photo + 人像模式图层】。换言之,一次拍摄,多重记录。
并且 vivo / iQOO 的手机相册,似乎没做相应配套,无法对这类 side by side 格式的 JPEG 图片或视频,进行裁剪转档,变成 2D 单目方式分享出去。
那么,基于这个 3D 相机拍摄产生的影像内容数据,只能干等着某天使用支持这种 side by side 格式的 AR 眼镜( Rokid AR 眼镜)或 vivo Vision MR 头显设备,才有可能去浏览观赏它们的。
相比之下,Apple 的 3D 空间照片,基于自行定义魔改实现多层 HEIC 文件格式,3D 空间视频使用 MV-HEVC 编码格式,实现一次拍摄,多重记录,多种分享体验。基本不存在使用和分享上的心理负担了。
PS:另外回放素材时发现,vivo X200 Ultra 这个 3D 相机,有非常明显的对焦拉风箱问题。对比之下,这类基础素质的表现,iPhone 相机真的稳很多。
在使用过程中,对比 iPhone 的 3D 空间相机,vivo / iQOO 手机上的 3D 相机功能,现在一个最明显的软件层面使用体验问题是:它拍摄后只能生成为 side by side 格式的 JPEG 图片或视频。
而 iPhone 拍摄的 3D 空间照片,正如之前拆解时发现的( https://t.me/rayinhdr/652 ),其实是【一组小尺寸的双目 3D SDR 照片 + 一张常规包含 HDR Gain Map 的 24MP 主摄照片 + 录制 2D Live Photo + 人像模式图层】。换言之,一次拍摄,多重记录。
并且 vivo / iQOO 的手机相册,似乎没做相应配套,无法对这类 side by side 格式的 JPEG 图片或视频,进行裁剪转档,变成 2D 单目方式分享出去。
那么,基于这个 3D 相机拍摄产生的影像内容数据,只能干等着某天使用支持这种 side by side 格式的 AR 眼镜( Rokid AR 眼镜)或 vivo Vision MR 头显设备,才有可能去浏览观赏它们的。
相比之下,Apple 的 3D 空间照片,基于自行定义魔改实现多层 HEIC 文件格式,3D 空间视频使用 MV-HEVC 编码格式,实现一次拍摄,多重记录,多种分享体验。基本不存在使用和分享上的心理负担了。
PS:另外回放素材时发现,vivo X200 Ultra 这个 3D 相机,有非常明显的对焦拉风箱问题。对比之下,这类基础素质的表现,iPhone 相机真的稳很多。
Telegram
Ray 的 HDR 指北
看了下,iPhone 系统相机的 3D 空间照片,EXIF 显示是 24MP 分辨率的,相册有 HDR 显示效果。实际包括了:
- 一组小尺寸的双目3D照片。两张图分辨率都为 2688x2016。
- 一张常规包含 HDR Gain Map 的 24MP 主摄照片。
- 24MP 主摄照片,同时可以叠加录制 2D Live Photo,以及【人像模式】(能拆出深度图 Depth Map)。
而且 iOS18.1 Beta 更新后,iPhone 15 Pro 系列的系统相机也能拍这种【24MP + 3D…
- 一组小尺寸的双目3D照片。两张图分辨率都为 2688x2016。
- 一张常规包含 HDR Gain Map 的 24MP 主摄照片。
- 24MP 主摄照片,同时可以叠加录制 2D Live Photo,以及【人像模式】(能拆出深度图 Depth Map)。
而且 iOS18.1 Beta 更新后,iPhone 15 Pro 系列的系统相机也能拍这种【24MP + 3D…
❤3
Ray 的 HDR 指北
OPPO 研究院 - [CVPR2024] SeeSR: Towards Semantics-Aware Real-World Image Super-Resolution - 面向语义感知的真实世界图像超分辨率算法 https://github.com/cswry/SeeSR https://www4.comp.polyu.edu.hk/~cslzhang/ 手机大厂寻找 AI 时代的下一张船票 | OPPO SeeSR AI 超分辨率算法 https://mp.weixin.qq.com/s/q1…
OPPO 研究院 - [CVPR2023] 联合 HDR 降噪与融合:一个真实世界手机 HDR 图像数据集
Joint HDR Denoising and Fusion: A Real-World Mobile HDR Image Dataset
https://mp.weixin.qq.com/s/ymKZS6KqGfGSZUT0Cv8RLA
Joint HDR Denoising and Fusion: A Real-World Mobile HDR Image Dataset
https://mp.weixin.qq.com/s/ymKZS6KqGfGSZUT0Cv8RLA
Netflix - 内容制作中使用生成式人工智能的规则
https://partnerhelp.netflixstudios.com/hc/en-us/articles/43393929218323-Using-Generative-AI-in-Content-Production#h_01K1BTNMC4RTXXMXPKW2TJJ2ZJ
中文翻译
https://mp.weixin.qq.com/s/5uMwD_vEK0iBJPflGZQzyA
https://partnerhelp.netflixstudios.com/hc/en-us/articles/43393929218323-Using-Generative-AI-in-Content-Production#h_01K1BTNMC4RTXXMXPKW2TJJ2ZJ
中文翻译
https://mp.weixin.qq.com/s/5uMwD_vEK0iBJPflGZQzyA
Netflix | Partner Help Center
Using Generative AI in Content Production
Introduction
Generative AI tools (GenAI) that allow users to rapidly generate new and creatively unique media (video, sound, text, and image) are increasingly being used across creative workflo...
Generative AI tools (GenAI) that allow users to rapidly generate new and creatively unique media (video, sound, text, and image) are increasingly being used across creative workflo...