当前位置: 首页 > ai >正文

音视频面试题集锦第 29 期

音视频面试题集锦第 29 期:

  • 1、调试 OpenGL 特效的时候图像不对,有什么调试技巧能快速排查原因?
  • 2、在实现类似 OBS 的实时的图片、GIF 贴片叠加和替换效果时遇到了性能瓶颈,请问如何实现快速的 GIF 贴片叠加和替换?
  • 3、iOS 动态图片如何获取原始视频?
  • 4、自己实现播放器时利用 FFmpeg 拿到解码后数据封装成 CVPixelbuffer 缓存用于渲染,但是缓存后数据只有几帧,但为什么内存占用有时候会有几百兆?

图文完整版请阅读:https://gjzkeyframe.github.io/posts/av-interview-qa-29/


想要学习和提升音视频技术的朋友,快来加入我们的【音视频技术社群】,加入后你就能:

  • 1)下载 30+ 个开箱即用的「音视频及渲染 Demo 源代码」
  • 2)下载包含 500+ 知识条目的完整版「音视频知识图谱」
  • 3)下载包含 200+ 题目的完整版「音视频面试题集锦」
  • 4)技术和职业发展咨询 100% 得到回答
  • 5)获得简历优化建议和大厂内推

现在加入,送你一张 20 元优惠券:点击领取优惠券


1、调试 OpenGL 特效的时候图像不对,有什么调试技巧能快速排查原因?

  1. 如果是大面积画面异常(比如黑屏或者绿屏),先看是否在渲染时出现报错,可以使用 glGetError() 函数来调试。
  2. 如果没有报错或者少许图像错误,就在关键节点编写调试代码将纹理转换为 yuv 数据查看具体是哪一个节点出现问题。这些调试技巧可以方便快读定位问题:
    • iOS 可以转换成 CVPixelBuffer,调试模式下打开小眼睛即可看到图像。
    • Android 则需要把数据写入到文件,可用 FFmpeg 打开文件查看。
    • 如果 iOS 想看二进制的数据也可以将二进制数据转换为 NSData,调试模式下打开小眼睛即可看到二进制内容(右下角也有 export 按钮)。
  3. 查看节点的顶点坐标、纹理坐标,vertex Shaderfragment Shader。然后修改调试 shader 内容和坐标数据看哪个环节出现问题。

2、在实现类似 OBS 的实时的图片、GIF 贴片叠加和替换效果时遇到了性能瓶颈,请问如何实现快速的 GIF 贴片叠加和替换?

下面是遇到性能问题所采用的方案:

  • 使用 FFmpeg 的 overlay 滤镜和 SSE 像素计算方法在推流前实时叠加图片。
  • 考虑到用户可能会传入多张图片,不能每一张都实时叠加,因此单开了一个进程利用 FFmpeg 命令先将这些贴片叠加并输出一张 PNG 图片。这样在实时叠加时,只需读取并叠加这张 PNG 图片,速度能够保证在 40ms 内,满足一秒 25 帧的帧率。

遇到的瓶颈:

  • 用户可能会传入十几张静态图或 GIF,FFmpeg 处理成 1 分钟的 MP4 并解析为 PNG 图片大约需要十几分钟,如果直播间并发进行该操作,则会更慢。

解决方案:

想要快速的将这些滤镜和贴纸叠加到视频上需要结合 OpenGL 的能力。

FFmpeg 提供解码原视频和贴纸图片的能力,OpenGL 特效则将所有图片渲染在一起。

首先 OpengGL 将所有贴纸合为一张透明背景且大小与视频大小相同的纹理,然后 OpenGL 将解码后的视频数据转换成另一张纹理,最后视频纹理与贴纸纹理合二为一即可拿到叠加后的纹理。然后再将纹理转换为裸数据进行推流即可。

OpenGL 处理纹理和特效的效率很高,数据与纹理的转换耗时也不多,可以满足对性能的需求,只不过开发成本较高。

3、iOS 动态图片如何获取原始视频?

如果想要获取相册中实况照片对应的视频,可以使用 Photos 框架中的 PHAsset 类来实现。

以下是使用 Objective-C 获取实况照片视频的步骤:

  • 首先,确保你的应用有权限访问用户的相册。您需要在 Info.plist 文件中添加 NSPhotoLibraryUsageDescription 键,并提供一个描述为什么应用需要访问相册的字符串。
  • 使用相册选择页(例如 UIImagePickerController)来拿到你想要的实况照片,获取一个 PHAsset。使用 PHImageManagerrequestLivePhotoForAsset:(PHAsset *)asset... 方法来获取每个实况照片的资源,获取一个 PHLivePhoto 实例。
  • 调用 [PHAssetResource assetResourcesForLivePhoto:livePhoto] 方法即可获得两个 PHAssetResource。一个是对应的是图片,类型对应 PHAssetResourceTypePhoto,一个对应的是视频,类型对应 PHAssetResourceTypePairedVideo

示例代码如下:

- (void)requestLivePhotoForAsset:(PHAsset *)asset {PHLivePhotoRequestOptions *options = [[PHLivePhotoRequestOptions alloc] init];options.deliveryMode = PHImageRequestOptionsDeliveryModeHighQualityFormat;options.networkAccessAllowed = YES;[[PHImageManager defaultManager] requestLivePhotoForAsset:assettargetSize:PHImageManagerMaximumSizecontentMode:PHImageContentModeAspectFilloptions:optionsresultHandler:^(PHLivePhoto * _Nullable livePhoto, NSDictionary * _Nullable info) {if (livePhoto) {[self processLivePhoto:livePhoto ];} else {NSLog(@"Failed to fetch live photo");}}];
}
- (void)processLivePhoto:(PHLivePhoto *)livePhoto  {NSArray<PHAssetResource *> * result = [PHAssetResource assetResourcesForLivePhoto:livePhoto];[result enumerateObjectsUsingBlock:^(PHAssetResource * _Nonnull obj, NSUInteger idx, BOOL * _Nonnull stop) {if (obj.type == PHAssetResourceTypePhoto){//} else if (obj.type == PHAssetResourceTypePairedVideo){//}}];
}

4、自己实现播放器时利用 FFmpeg 拿到解码后数据封装成 CVPixelbuffer 缓存用于渲染,但是缓存后数据只有几帧,但为什么内存占用有时候会有几百兆?

缓存的 CVPixelBuffer 需要使用 CVPixelBufferPool 来进行创建和释放。例如你自己创建 CVPixelBuffer 缓存即使你在程序中及时释放但是系统真正释放的时机可能会延迟,导致占用内存过高。

CVPixelBufferPool 的作用是提供一个缓冲区池,用于缓存一定数量的 CVPixelBuffer 对象,以便重复使用。这样,当你需要一个 CVPixelBuffer 时,你可以从池中获取一个已经分配好的实例,而不是每次都从头开始分配内存。当一个 CVPixelBuffer 不再需要时,它会被返回到池中,而不是被销毁,这样它就可以被再次使用。

http://www.xdnf.cn/news/18289.html

相关文章:

  • JetBrains Mono字体
  • Vue3组件系统完全指南:从入门到面试通关
  • (第二十期下)超链接的更多分类
  • 血缘元数据采集开放标准:OpenLineage Dataset Facets
  • java开发面试题(提高篇)
  • 大数据毕业设计选题推荐-基于大数据的北京气象站数据可视化分析系统-Hadoop-Spark-数据可视化-BigData
  • JavaScript基础语法five
  • Python学习 -- MySQL数据库的查询及案例
  • 计算两幅图像在特定交点位置的置信度评分。置信度评分反映了该位置特征匹配的可靠性,通常用于图像处理任务(如特征匹配、立体视觉等)
  • redis-缓存-双写一致性
  • git 常用命令整理
  • 【倍增 桶排序】后缀数组
  • 【Java后端】Spring Boot 全局异常处理最佳实践
  • Firefox 142 引入 CRLite 用于私有证书撤销
  • LeetCode热题100--101. 对称二叉树--简单
  • 【clion】visual studio的sln转cmakelist并使用clion构建32位
  • 游戏本不插电源适配器不卡设置教程
  • 数据库架构开发知识库体系
  • Pub/Sub是什么意思
  • 常见的学术文献数据库
  • 好家园房产中介网后台管理完整(python+flask+mysql)
  • 开源的实时 Web 日志分析器GoAccess安装使用指南
  • 【数据结构】快速排序算法精髓解析
  • Vue 3 高性能实践 全面提速剖析!
  • Android 资源替换:静态替换 vs 动态替换
  • [GraphRAG]完全自动化处理任何文档为向量知识图谱:AbutionGraph如何让知识自动“活”起来?
  • sourcetree 拉取代码
  • C++篇(2)C++入门(下)
  • 十二,数据结构-链表
  • Docker Compose命令一览(Docker Compose指令、docker-compose命令)