Description

Changes proposed in this pull request:

Add virtual get_mpi_offload_support function to base communicator - defaults to false in nearly all cases
Add logic to get_mpi_offload_support function in mpi/communicator.h to check mpi libs for correct symbol and determine if level zero is supported
Add conditional in detail/communicator.cpp that uses result of get_mpi_offload_support to determine whether to convert data to host (previous default) or leave as is (yields performance improvements if GPU offload support in MPI)
Modify sendrecv_replace args to include optional additional buffer to accommodate MPICH workaround to call sendrecv with 2 GPU buffers

Nov 14 '23 21:11 ethanglaser

/intelci: run

Nov 14 '23 21:11 ethanglaser

Looks as a great opportunity to get more speedup across all algorithms

Thanks! Yeah its pretty ugly right now, working towards functional first then will clean things up. But good points.

Nov 15 '23 22:11 ethanglaser

/intelci: run

Dec 19 '23 14:12 ethanglaser

/intelci: run

Jan 02 '24 14:01 ethanglaser

/intelci: run

Jan 02 '24 16:01 ethanglaser

/intelci: run

Jan 02 '24 17:01 ethanglaser

/intelci: run

Jan 03 '24 22:01 ethanglaser

/intelci: run

Jan 08 '24 16:01 ethanglaser

/intelci: run

Jan 11 '24 16:01 ethanglaser

/intelci: run

Jan 29 '24 19:01 ethanglaser

/intelci: run

Jan 30 '24 18:01 ethanglaser

/intelci: run

Feb 13 '24 18:02 ethanglaser

/intelci: run

Mar 06 '24 15:03 ethanglaser

/intelci: run

Mar 06 '24 16:03 ethanglaser

/intelci: run

Mar 06 '24 21:03 ethanglaser

/intelci: run

Mar 07 '24 01:03 ethanglaser

Nightly combined with infra branch: http://intel-ci.intel.com/eedcda75-51a4-f11e-8bab-a4bf010d0e2e

Mar 07 '24 23:03 ethanglaser

/intelci: run

Apr 03 '24 09:04 Alexandr-Solovev

/intelci: run

Apr 09 '24 15:04 ethanglaser

/intelci: run

Apr 25 '24 17:04 ethanglaser

/intelci: run

May 02 '24 19:05 ethanglaser

/intelci: run

May 06 '24 17:05 ethanglaser

Final steps are to check MPICH scalability with alternative approach, confirm infra changes, and determine whether its necessary to add any additional conditions to use offloading

May 06 '24 22:05 ethanglaser

/intelci: run

May 08 '24 21:05 ethanglaser

/intelci: run

May 08 '24 22:05 ethanglaser

/intelci: run

May 08 '24 23:05 ethanglaser

/intelci: run

May 09 '24 17:05 ethanglaser

/intelci: run

May 09 '24 17:05 ethanglaser

/intelci: run

May 09 '24 18:05 ethanglaser

/intelci: run

May 09 '24 19:05 ethanglaser

MPI GPU interface refactoring

Description