图形引擎实战:HDRP移动版高清渲染管线改造

近年来,随着移动平台硬件的性能不断提升,移动端游戏采用的渲染技术更加先进,整个行业对画质效果的需求也越来越大,我们借此做了一些技术尝试,测试了Unity HDRP是否可以在移动端跑起来,结果是可行的。(后来我们又升级到了2021.1.x版本,对应HDRP 11.0.0版本,以下说明都是基于这个版本的。)先看一下之前某个开发阶段录制的视频,米11上30+ fps:

视频见链接:https://zhuanlan.zhihu.com/p/567981404

管线预览

管线采用了Forward+和TBDS的混合管线,非常适合移动端TDDR GPU架构,对多光源支持较好,比Forward节省光照计算,又比传统的Deferred管线节省带宽;支持物理相机、HDRI Sky、面光源、体积雾、SSR、TAA等多种特性,我们对一些特性做了删减和开关,对相关计算做了优化。先看一下整个管线的大体流程:

a) Pre-Z Pass阶段,写入前向渲染的深度和法线,以及材质对应的 stencil id

b) 写入GBUFFER信息及材质对应的stencil id。固定使用四个GBUFFER缓存。

GBuffer0 :BaseColor+SpecularOcclusion

GBuffer1: Normal+Roughness

GBuffer2: Metallic + RenderingLayer + ShadowMask0 + MaterialFlagsId

GBuffer3: BakeDiffuseLighting/EmissionColor

c) Hi-z 深度图生成,用于后面的 SSR 精确快速的ray marching

d) motionvector map绘制

e) 构建灯光列表和 基于tile的材质id。依屏幕大小等分tile网格,主要构建灯光列表和更大的BigTileLightList。前者用于一般的光照访问,tile大小为32x32;后者用于Volume以及半透物体,或者其他不需要精确光照的渲染阶段,tile大小为64x64。另外,还构建了用于Cluster模式的VoxelLightList。

f) Volumetric voxelization,利用clusterbuffer的bigtile生成3d的DensityBuffer。可用于体积雾以及其他需要3D纹理的渲染效果。

在屏幕体素化到一个低分辨率的3DTexture中,生成VolumetricDensityBuffer,将场景中的local volume数据存入这3DTexture中。使用上一步生成的BigTileList计算所需光照。

g) CSM,开启主光4级级联阴影,关闭了点光、面光阴影

h) SSR &SSPR。主要分为以下两步,SSRTrace和SSRAccum。

SSRTracing:根据之前Stencil记录,没有标记SSR的像素就直接跳过,利用屏幕深度、法线进行RayMarching

SSRAccum:上一步得到的HitPos用于检测相机MotionVector,用相机位移来影响最终的透明度,反射颜色本身则可以使用ColorPyrimid近似累积,根据粗糙度判断使用哪一级ColorBuffer缓存来采样,或者通过近似高斯模糊的方式做PBR累积。累积结果加入间接高光

i) GTAO

AOPackedData

j) Volume Lighting, 根据BigTile的灯光List以及VolumeVoxelization生成的DensityBuffer,计算一个VolumetricLightBuffer。用于之后的折射、雾等效果。

k) Tile Deferred每种材质组合进入自己类型的CS中计算,每种类型的CS只计算指定数量的Tile,分为Tile和Cluster两种类型,优化为四种组合,涵盖点光、聚光、面光、环境光。

l) 前向forward+ 渲染。不透明物体的正常前向渲染。

m) 渲染天空

n) 计算大气散射。有雾就有散射,并支持体积雾,也支持高度分层。体积雾需要采样之前生成的VolumetricLightBuffer,并叠加雾颜色,混合到最终的ColorBuffer。

o) 计算Color Pyramid 用于折射与反射,降采样后的color 做一下高斯模糊,保证低分辨下亮度不丢失。

ColorPyramid: 6 mipLevel,大小呈2次幂递减,每一级都有高斯模糊

p) 透明物体渲染

q) 后处理渲染,移植了UE4中一些后处理做法

主要改造说明

这里主要介绍兼容性和优化方面做的一些工作

兼容性

1) 两种lightlist生成方案,针对不同硬件采用不同算法。这部分主要是针对Adreno GPU与Mali GPU来做的,两种硬件在UBO/SSBO数量、线程localmemory等方面都不同,差别较大,对于复杂的数据和计算在compute shader产生了一些兼容性问题。我们通过大量测试,合并存储计算结果的SSBO,发现Mali GPU更适合Cluster算法,Adreno GPU更适合FPTL算法

2) rt格式修改,移动端遇到了一些效果bug,后来发现是和格式有关,有些是手机兼容性不好,有些是手机不支持。比如:修改RG16为RGB16(RG16真机支持不好)、R16G16_UNorm改用R16G16B16_SFloat、B10G11R11_UFloatPack32改用rgba16、hdr采用rgba16(默认b10g11r11真机兼容性不好)等等

3) 浮点格式修改,主要是针对手机端浮点精度导致的效果错误或格式兼容性报错等

4) 反射球贴图使用普通2dTextureArray(手机端不支持cubemap array),各个probe的贴图依次列到TextureArray的各个slice上

优化

1) 调整GBuffer。原本GBuffer在不同的材质特性Standard/SSS/Anisotropic/Irridescence下存储的内容有所不同。这里只留下standard模式,其余分支都去掉。

2) 在管线的GBUFFER阶段将材质id写入模板缓冲区,在构建灯光列表阶段对不同材质的屏幕tile进行分类。渲染阶段对不同的分类进行针对性的渲染,固定几种组合,对光照计算的各个分支做了部分删减,减少shader编译过程

3) Bindless优化,UBO和SSBO。将一些光照数据从SSBO放入UBO,如DirectionLightData,shadowData。从全局buffer访问到快速访问的内存访问,速度会有所提升。其次,原本使用Texture的地方尽可能用TextureArray代替,比如ReflectionProbe改为预烘焙,在游戏启动时做一次合并到TextureArray。最多支持16个probe,存储的是2d展开的cube。

4) 引入FSR,为了减轻移动端延迟渲染对硬件产生的压力,进一步提升帧率,减少带宽压力和发热功耗,而不过度损失游戏效果,使用AMD的FidelityFX Super Resolution 技术提升画面在低分辨率下的质量。

5) CSM分帧更新,采用了四级级联阴影,分帧更新,第一级每帧更新,其他级隔帧更新

6) 增加缓存以替代实时计算。

PrepareLightsForGPU当中收集准备灯光、阴影、Probe数据。这里可以做一些缓存,启动时只进行一次,避免每帧都去直接收集数据,可以减少一些CPU端的消耗。而如果需要开启TOD,灯光数据LightData的获取则可以分帧来获取

7) 增加遮挡剔除方案。Unity自带的Occlusion Culling在运行时消耗大量CPU时间且不支持动态加载与卸载PVS数据。加入一个针对prefab对象的Occlusion系统,做为遮挡体的Occluder初始完全加载,被遮挡体的Occludee随Prefab动态加载。利用CullingGroup做裁剪

8) 增加灯光剔除,按layer分类,根据相机距离缩减各类灯光的Range比例

9) 扩展添加了给平面反射使用的SSPR,减少SSR中raymatching计算面积,效率更高(场景中大量的使用的是平面反射)SSPR使用模板缓冲区标记屏幕内平面反射区域)

10) 关闭RayTrace、简化PBR光照Feature、删除不必要的计算、限制单个tile灯光数量等等

小结

HDRP管线偏重度一些,集成了多种渲染技术,通过对HDRP管线的移动端改造,我们验证了一些技术方案的可行性,积累了相关经验,并推广到了项目中应用。

欢迎加入我们!

感兴趣的同学可以投递简历至:CYouEngine@cyou-inc.com

#游戏引擎##引擎开发工程师#
搜狐畅游游戏引擎相关 文章被收录于专栏

带来游戏引擎最新知识和内容

全部评论

相关推荐

2025-12-16 22:19
已编辑
南昌市第三中学 Java
个人背景:27届本科 江西普通一本院校个人经历:小厂->用友->蔚来->美团->腾讯不知不觉已经有了五段实习经历,也快在外面漂泊一年半了,在今年也完成了两年前自己想进大厂的目标,可能在别人看来确实就是一段比较传奇的过程,一步一步都在向上走,也会有很多人来问我相关学习实习的一些问题,我看到了也会尽量去回复,但现在我想给大家说的并不是千篇一律的学习路线,而是我认为更为重要的——勇气与抉择。下面我来分享一下这些年的心路历程最初学习背景:我跟很多人一样,都是刚进入大学才开始接触计算机,也刚刚拥有自己的电脑,在刚开始学习的过程没有任何人来帮助我,给予我相关的指导,完全是自己摸索出来的一条学习路线,不会有如今这样有很多完善好的速成路线,而家里人都在想让我考研,似乎本科以我的学历就业是不现实的。我也很早意识到了学历对于我的限制,所以萌生出了大一就开始实习的想法,但这个想法在当时基本上是不存在。所有人都在抨击我(这里感兴趣的话可以看我最早发的帖子),有的人说本科想进大厂痴人说梦,有的人劝我以我的学历考研才是上策,有的人说我屁都不懂就来卷,总之我很难说去看到有支持的。我大一的时候还没卷成如今这样很多大一实习,当我想找到是否有跟我一样下定决心一步一步往上走的人,我当时是没有找到的,要么是秋招的哀嚎,要么就直接是零实习进大厂(现在我知道,这里所谓的普通学历0实习进大厂的水分有很多,排除真正意义上的运气和实力,其他基本上全是造假作弊,大家自己心知肚明,也要放平心态)这就导致了一个没有先例的情况,很多人也都是拿没有先例来抨击我,包括家里人也不支持我去实习,可能很多人的积极性就会下降,但我从来不会信所谓的不可能,如果没有先例,那我就会是第一个,他们不行,是因为他们没能力,他们坚持不下去。勇气是很重要的,当你发现你身边没有人像你一样,就很少会有人相信你,看好你,但好在,我不在乎。最初实习阶段:在最初3000沟通只有零星几个面试的时候,那感觉确实很不好受,沉没成本太大,得到的正反馈却太少,当时基本上都是一天学八个小时从来不间断,没有周末没有节假日,甚至过年我都在学习,这就导致我现在都会因为我周末偶尔休息的时候会有负罪感,我感觉已经是种病了,我也知道我也可以休息会但控制不了。当时我出去实习口袋里有1w块(这是我高中三年加大一一年存下来的,基本上是很抠很抠,一个月生活费有时候有一千多有时候就五六百,但也算得上是成功攒了一点钱)但第一次总会是很害怕,担心租房被骗,担心工作能力不行,担心被公司坑,担心学校原因导致不能实习等等,基本上在前面几段实习是根本不攒钱的,代课已经花了一万多,加上租房来回,基本上只能说堪堪不负支出,后来远赴北京,作为一个南方人,有很多不适应的地方,但现在回过头来一想,已经在北京呆了一年多了。我知道很多人要么担心学校因素,要么担心赚的还没花的多,种种因素导致了实习的困难,我也很害怕,我的钱会不会最终全部打水漂,学校会不会爆雷,我以后还能顺利实习吗等等。但对于我来说,我能对自己狠下心,我能接受通勤时间一个半小时只为节省那么几百块的房租钱,我能控制自己的消费的欲望,我能每个月大把大把把钱给代课,这可能就是我能够初期实习顺利的原因,这需要勇气,也需要对自己狠。实习中的抉择:在有了两段实习经历后,我的目标就朝着大厂进发,在去蔚来的中途,我oc了七八家中小厂公司,这里面不乏一些待遇极其优越的公司(有一家我真的差点就去了),但我最终还是都拒了,因为我清楚的明白想往上走的,只有公司title会帮你说话,没有人有义务理解你的困难你的坚持,好在最后去了蔚来,也算如愿以偿。从蔚来到美团倒是没有过多纠结,因为在最开始的梦中情厂就是美团,但从美团去腾讯这个决定或许是我人生中的转折点。美团多次挽留我,帮我沟通问hr,基本上就是一定能转暑期然后成功转正,仿佛这年薪40w的工作已经触手可得,所以在拿到腾讯offer的那一刻并没有多高兴,因为我意识到这可能是我此生最接近大厂的一次机会,可能大部分人都会选择留在美团,我也认为这一定是一个好的选择。我能够走到如今,是永远相信自己的判断,我的每一步都是在赌一个好的未来,只不过,这次赌注大了点而已,或许未来我再也进不了这些所谓的大厂,但我赌的不是选择错对,我赌我不后悔。所谓信念支撑:都说人要为自己而活,但我或许做不到,毕竟我身处人情社会,有许多爱我的人在等着我成长,我也不能接受因为能力而再次放弃一段感情,最近喜欢一段歌词:爱我的人相信我我一直在努力改变所有失败为你们而存在爱我的人感谢你你们的爱就算人生不是精彩我也要勇敢的姿态最后的最后,我想给大家传递的从来都不是一个普通学历进入大厂的意气风发,我想给大家传递的,是一股相信自己能够向上的信念和可能性。在没有打比赛能力,没有开源能力,没有学历等各个限制下,我帮大家试出了一条能够向上的路。如果没有先例,那我会是第一个。我们不需要弄虚作假,只靠自己一步一步脚踏实地,哪怕慢一点,不赌自己是否成功,只赌自己不后悔,问心无愧。最后送给大家,也送给自己一段话结束2025:生活可能没你想的那么好,也不会像你想的那么糟,人的脆弱和坚强,都超乎了你的想象,有时候可能脆弱的一句话就泪流满面,有时候你发现自己咬咬牙已经走了很长的路了
等闲_:感觉咱们双非的同学都有一个共性,想证明双非也是能进大厂的,我之前所有的标签都喜欢带着双非,仿佛这样可以像别人证明自己的实力,现在我却不再想证明双非到底能不能进大厂,我的生活的所有者是我自己,享受生活,接受结果
2025年终总结
点赞 评论 收藏
分享
评论
2
8
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务