来看一场 AI 重建的 3D 全息世界杯比赛!

来看一场 AI 重建的 3D 全息世界杯比赛!

图 2:重建方法的概览

以 YouTube 视频的帧作为输入,我们使用 field lines 来恢复摄像机参数。然后,提取边界框、姿势和轨迹(跨多个帧)来分割球员。通过在视频游戏数据上训练好的深度网络,我们在游戏环境中重建了每个球员的深度图,这样就可以在 3D 查看器或 AR 设备上呈现出来。

然后,球员们被放在一个虚拟的足球场上。其结果令人惊叹,并且可以通过 3D 查看器或 AR 设备从任何角度观看比赛。

图3:训练数据:从《FIFA》游戏中提取图像和对应的深度,这里展示了几个可视化为深度图和网格的例子。

该团队使用 NVIDIA GeForce GTX 1080 GPU 和 NVIDIA TITAN Xp GPU,以及cuDNN 加速的 PyTorch 深度学习框架,在从世界杯比赛视频中提取的数小时的 3D 球员数据上对卷积神经网络进行训练。

基于这些比赛视频数据,神经网络能够重构球场上的每个球员的深度图,这些图可以在3D 查看器或 AR 设备上呈现。

“事实证明,在玩 EA 的《FIFA》游戏并截取游戏引擎和 GPU 间的调用时,可以从视频游戏中提取深度图。具体来说,我们使用 RenderDoc 来截取游戏引擎和 GPU 之间的调用。” 研究团队表示:“FIFA 与大多数游戏类似,在游戏过程中使用延迟渲染。通过访问 GPU 调用,可以捕获每帧的深度和颜色缓冲区。一旦特定的帧被捕获了深度和颜色,就可以提取出球员。”

图4:合成数据集的结果以及与当前最优技术和 ground truth 的比较,可视化为depth maps 和 3D 网格。我们的方法更准确,实现了更好的网格重构。

为了验证这个系统,研究团队用 YouTube 上找到的 10 个高分辨率的职业足球比赛视频测试他们的方法。值得注意的是,该系统只在合成视频素材上进行训练。但是,在真实的场景中,系统也有非常好的结果。

来自 YouTube 视频的实际图像的结果

从 Youtube 框架开始(顶行),我们网络重建的深度图可以添加到虚拟 3D 球场环境中,这里显示为仅网格和纹理渲染(第 2-4 行)。

研究人员用微软的 HoloLensAR 眼镜进行测试。HoloLens 可以将 3D 重建叠加到真实的桌面上。最终的产品虽然不完美,它无法重建球,不能实时地工作,并且只允许从视频录制的球场侧面观看。但是,这项技术可能比当前 3D 重建运动的最先进方法更具可扩展性,因为当前的方法需要在每一个角度布置相机。研究人员称,这种方法也适用于预定义的其他事件,例如音乐会或剧场。

桌面实际的场景

用HoloLens看到的场景

研究人员承认他们的系统并不完美。他们的下一个项目将专注于训练系统以更好地检测球,并开发可从任何角度观察的系统。

这项研究将于 6 月 18 日至 22 日在犹他州盐湖城举行的年度计算机视觉和模式识别(CVPR)会议上首次亮相。

论文地址:http://grail.cs.washington.edu/projects/soccer/soccer_on_your_tabletop.pdf返回搜狐,查看更多

相关推荐

黑神话,重新带火网吧
365bet官网网址是多少

黑神话,重新带火网吧

🗓️ 06-29 👁️ 5837
我的世界minecraft添加光影教程
365bet官网网址是多少

我的世界minecraft添加光影教程

🗓️ 07-21 👁️ 8598
《巨婴国》作者:武志红(完结)
365bet中文版客户端

《巨婴国》作者:武志红(完结)

🗓️ 08-04 👁️ 6267
王者荣耀如何在快手平台进行直播?
365bet365用址

王者荣耀如何在快手平台进行直播?

🗓️ 08-04 👁️ 7551
LOL英雄数据库 赏金猎人 厄运小姐
365bet官网网址是多少

LOL英雄数据库 赏金猎人 厄运小姐

🗓️ 07-23 👁️ 7719
求大神说下macu盘在哪里
365bet官网网址是多少

求大神说下macu盘在哪里

🗓️ 07-27 👁️ 4156