// Copyright (C) 2009-present, Panagiotis Christopoulos Charitos and contributors. // All rights reserved. // Code licensed under the BSD License. // http://www.anki3d.org/LICENSE #include #include #include #include using namespace anki; static void clearSwapchain(CommandBufferPtr cmdb = CommandBufferPtr()) { const Bool continueCmdb = cmdb.isCreated(); TexturePtr presentTex = GrManager::getSingleton().acquireNextPresentableTexture(); if(!continueCmdb) { CommandBufferInitInfo cinit; cinit.m_flags = CommandBufferFlag::kGeneralWork | CommandBufferFlag::kSmallBatch; cmdb = GrManager::getSingleton().newCommandBuffer(cinit); } const TextureBarrierInfo barrier = {TextureView(presentTex.get(), TextureSubresourceDesc::all()), TextureUsageBit::kNone, TextureUsageBit::kFramebufferWrite}; cmdb->setPipelineBarrier({&barrier, 1}, {}, {}); RenderTarget rt; rt.m_textureView = TextureView(presentTex.get(), TextureSubresourceDesc::all()); rt.m_clearValue.m_colorf = {1.0f, F32(rand()) / F32(RAND_MAX), 1.0f, 1.0f}; cmdb->beginRenderPass({rt}); cmdb->endRenderPass(); const TextureBarrierInfo barrier2 = {TextureView(presentTex.get(), TextureSubresourceDesc::all()), TextureUsageBit::kFramebufferWrite, TextureUsageBit::kPresent}; cmdb->setPipelineBarrier({&barrier2, 1}, {}, {}); if(!continueCmdb) { cmdb->endRecording(); GrManager::getSingleton().submit(cmdb.get()); } } ANKI_TEST(Gr, WorkGraphHelloWorld) { // CVarSet::getSingleton().setMultiple(Array{"Device", "1"}); commonInit(); { const Char* kSrc = R"( struct FirstNodeRecord { uint3 m_gridSize : SV_DispatchGrid; uint m_value; }; struct SecondNodeRecord { uint3 m_gridSize : SV_DispatchGrid; uint m_value; }; struct ThirdNodeRecord { uint m_value; }; RWStructuredBuffer g_buff : register(u0); [Shader("node")] [NodeLaunch("broadcasting")] [NodeIsProgramEntry] [NodeMaxDispatchGrid(1, 1, 1)] [NumThreads(16, 1, 1)] void main(DispatchNodeInputRecord inp, [MaxRecords(2)] NodeOutput secondNode, uint svGroupIndex : SV_GroupIndex) { GroupNodeOutputRecords rec = secondNode.GetGroupNodeOutputRecords(2); if(svGroupIndex < 2) { rec[svGroupIndex].m_gridSize = uint3(16, 1, 1); rec[svGroupIndex].m_value = inp.Get().m_value; } rec.OutputComplete(); } [Shader("node")] [NodeLaunch("broadcasting")] [NumThreads(16, 1, 1)] [NodeMaxDispatchGrid(16, 1, 1)] void secondNode(DispatchNodeInputRecord inp, [MaxRecords(32)] NodeOutput thirdNode, uint svGroupIndex : SV_GROUPINDEX) { GroupNodeOutputRecords recs = thirdNode.GetGroupNodeOutputRecords(32); recs[svGroupIndex * 2 + 0].m_value = inp.Get().m_value; recs[svGroupIndex * 2 + 1].m_value = inp.Get().m_value; recs.OutputComplete(); } [Shader("node")] [NodeLaunch("coalescing")] [NumThreads(16, 1, 1)] void thirdNode([MaxRecords(32)] GroupNodeInputRecords inp, uint svGroupIndex : SV_GroupIndex) { if (svGroupIndex * 2 < inp.Count()) InterlockedAdd(g_buff[0], inp[svGroupIndex * 2].m_value); if (svGroupIndex * 2 + 1 < inp.Count()) InterlockedAdd(g_buff[0], inp[svGroupIndex * 2 + 1].m_value); } )"; ShaderPtr shader = createShader(kSrc, ShaderType::kWorkGraph); ShaderProgramInitInfo progInit; progInit.m_workGraph.m_shader = shader.get(); WorkGraphNodeSpecialization wgSpecialization = {"main", UVec3(4, 1, 1)}; progInit.m_workGraph.m_nodeSpecializations = ConstWeakArray(&wgSpecialization, 1); ShaderProgramPtr prog = GrManager::getSingleton().newShaderProgram(progInit); BufferPtr counterBuff = createBuffer(BufferUsageBit::kAllStorage | BufferUsageBit::kTransferSource, 0u, 1, "CounterBuffer"); BufferInitInfo scratchInit("scratch"); scratchInit.m_size = prog->getWorkGraphMemoryRequirements(); scratchInit.m_usage = BufferUsageBit::kAllStorage; BufferPtr scratchBuff = GrManager::getSingleton().newBuffer(scratchInit); struct FirstNodeRecord { UVec3 m_gridSize; U32 m_value; }; Array records; for(U32 i = 0; i < records.getSize(); ++i) { records[i].m_gridSize = UVec3(4, 1, 1); records[i].m_value = (i + 1) * 10; } CommandBufferPtr cmdb = GrManager::getSingleton().newCommandBuffer(CommandBufferInitInfo(CommandBufferFlag::kSmallBatch)); cmdb->bindShaderProgram(prog.get()); cmdb->bindStorageBuffer(ANKI_REG(u0), BufferView(counterBuff.get())); cmdb->dispatchGraph(BufferView(scratchBuff.get()), records.getBegin(), records.getSize(), sizeof(records[0])); cmdb->endRecording(); FencePtr fence; GrManager::getSingleton().submit(cmdb.get(), {}, &fence); fence->clientWait(kMaxSecond); validateBuffer(counterBuff, ConstWeakArray(Array{122880})); } commonDestroy(); } ANKI_TEST(Gr, WorkGraphAmplification) { constexpr Bool benchmark = true; // CVarSet::getSingleton().setMultiple(Array{"Device", "2"}); commonInit(!benchmark); { const Char* kSrc = R"( struct FirstNodeRecord { uint3 m_dispatchGrid : SV_DispatchGrid; }; struct SecondNodeRecord { uint3 m_dispatchGrid : SV_DispatchGrid; uint m_objectIndex; }; struct Aabb { uint m_min; uint m_max; }; struct Object { uint m_positionsStart; // Points to g_positions uint m_positionCount; }; RWStructuredBuffer g_aabbs : register(u0); StructuredBuffer