騰訊互娛內容生態部(ContentDevelopment Department,以下簡稱CDD)正在構建以NVIDIA RTX A6000+ NVIDIA BlueField-2 DPU + Spectrum-3交換機等先進技術為基礎的新一代超大分辨率渲染平臺。雙方團隊沿著視頻流超低延遲傳輸這一方向進行持續的技術攻關,將NVIDIA Rivermax整合到生產軟件環境中,進一步降低了超大分辨率渲染平臺的交互延遲。
本案例主要應用了NVIDIA Rivermax,NVIDIA RTX A6000,NVIDIA BlueField-2 DPU,NVIDIA Spectrum-3交換機。
客戶簡介及應用背景
(資料圖)
作為國內游戲大廠,騰訊早早布局虛擬制片業務。2020年底,騰訊游戲成立內容生態部門(Content Development Department,以下簡稱CDD),旗下擁有虛擬人、虛擬制片等多個業務線。2021年11月CDD在深圳坪山建成了總占地3000平米的LED虛擬影棚。影棚配置有40m*6m 的240° 弧形LED立面屏幕,并配有可上下移動的100多平方米的天幕。LED點間距2.3,支持高速拍攝。
為了在硬件和軟件上持續保持領先,CDD與業內領先企業頻繁交流,不斷改進自研軟件以提升虛擬拍攝影棚的制作體驗。
客戶挑戰
在虛擬影棚中,LED立面屏幕被分割為多個顯示區域,每個顯示區域由不同的工作站驅動,其呈現的內容則由其搭載的GPU渲染完成。在實時拍攝過程中,需要LED光照、實時攝像機追蹤和實時渲染投屏三者的結合,實現前臺演員和虛擬背景之間的完美整合。這種拍攝方案消除了對綠幕合成的需求,讓攝像機直接拍攝最終成像。而所有需要在大型LED立面屏幕上顯示實時渲染內容的行業都面臨著一個普遍挑戰,即每個渲染節點其實是一個獨立運行工作站,在實際拍攝制片過程中,不僅需要消耗大量的計算資源用于渲染高分辨率高幀率的高品質實時內容,還需要同步所有渲染節點間的技術參數,同時推進所有顯示媒介的呈現內容。目前鮮有人在這一領域取得突破,原因可以歸納為以下幾個方面:
· 每臺工作站需要獨立渲染特定顯示區域的內容,在保證高標準畫面渲染細節的同時還需要維持面板刷新一致,對GPU性能提出了極高要求。
· 節點間存在通訊障礙,普通同步方式不能保證所有節點的幀同步,一旦出現不同步就會造成畫面撕裂影響觀看體驗。
· 節點間參數同步和數據傳輸占用了大量的網絡帶寬和CPU資源,進一步造成節點間時間同步的不可預測。
由于上述瓶頸導致渲染平臺整體無法進一步提升成片的幀率和分辨率,無法進一步滿足人們對于高幀率渲染實時內容的需求。
應用方案
客戶的超大分辨率渲染平臺通過集成NVIDIA Rivermax整體方案,解決了這些難題。完成集成后的系統架構如下圖所示:
圖1.系統架構圖
新的平臺由NVIDIA RTX A6000承擔分布式實時渲染任務。RTX A6000擁有48GB顯存,可以將拍攝場景需要的模型和紋理數據全部加載到顯存中,在拍攝過程中按需調用。渲染節點支持多GPU進行視口渲染,此模式支持創作者指定一個GPU渲染特定視口,并通過NVLink將渲染結果直接復制到另一個GPU上顯示輸出。而多個顯示區域則通過NVIDIA Quadro Sync II同步vsync信號,并結合NVIDIA專業顯卡提供的NVAPI swapgroup/barrier技術將渲染結果完美的拼合在一起。此外整個渲染平臺通過添加NVIDIA BlueField-2 DPU 和NVIDIA Spectrum-3 交換機,具備了運行NVIDIA Rivermax整體方案的硬件能力。NVIDIA Rivermax提供了高性能的流媒體傳輸服務,這種服務在Windows平臺上實現了GPU Direct P2P支持,消除了額外的GPU顯存到系統內存的拷貝,降低了操作系統層面的延遲,同時也降低了CPU資源的占用,從而讓整個渲染平臺的運行更為可靠。啟用NVIDIA Rivermax后,單顆CPU核心可以輕松收發100Gbps的媒體流。
圖2.單顆CPU核心收發100Gbps媒體流
而且整個平臺也具備了部署DOCA Firefly的條件。DOCA Firefly是NVIDIA提供的基于硬件的精確時間同步服務。在NVIDIA BlueField-2 DPU 上部署DOCA Firefly可以實現納秒級別的時間同步精度,其典型值如下表所示:
使用效果及影響
騰訊CDD綜合NVIDIA提供的各項產品,使用NVIDIA RTX A6000實時渲染,使用NVIDIA Rivermax在GPU顯存間直接傳輸數據,使用NVIDIA BlueField-2 DPU部署精確時間服務DOCA Firefly來同步所有渲染節點的系統時鐘,使用NVIDIA Spectrum-3交換機復制GPU顯存數據并承載時鐘網絡,通過這一系列改進措施,最終實現了在LED立面屏幕上以超低延遲呈現數字流資產的能力。
技嘉(GIGABYTE) RTX4090 24G 魔鷹超級雕 臺式機電腦電競游戲旗艦獨立顯卡 RTX4090 魔鷹【注冊四年保修】
進入購買
英偉達(NVIDIA) Tesla T4 A40 V100 A100 H100 A800顯卡GPU Quadro GV100 32G
進入購買
關鍵詞:
關于我們 廣告服務 手機版 投訴文章:435 226 40@qq.com
Copyright (C) 1999-2020 m.ymshequn.com 愛好者日報網 版權所有 聯系網站:435 226 40@qq.com