doxygen/_k_space_first_order3_d_solver_8cpp_source.html

 /**
  * @file      KSpaceFirstOrder3DSolver.cpp
  *
  * @author    Jiri Jaros \n
  *            Faculty of Information Technology \n
  *            Brno University of Technology \n
  *            jarosjir@fit.vutbr.cz
  *
  * @brief     The implementation file containing the main class of the project responsible for the entire simulation.
  *
  * @version   kspaceFirstOrder3D 2.16
  *
  * @date      12 July      2012, 10:27 (created) \n
  *            04 September 2017, 10:59 (revised)
  *
  * @copyright Copyright (C) 2017 Jiri Jaros and Bradley Treeby.
  *
  * This file is part of the C++ extension of the [k-Wave Toolbox](http://www.k-wave.org).
  *
  * This file is part of the k-Wave. k-Wave is free software: you can redistribute it and/or modify it under the terms
  * of the GNU Lesser General Public License as published by the Free Software Foundation, either version 3 of the
  * License, or (at your option) any later version.
  *
  * k-Wave is distributed in the hope that it will be useful, but WITHOUT ANY WARRANTY; without even the implied
  * warranty of MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU Lesser General Public License for
  * more details.
  *
  * You should have received a copy of the GNU Lesser General Public License along with k-Wave.
  * If not, see [http://www.gnu.org/licenses/](http://www.gnu.org/licenses/).
  */

 // Linux build
 #ifdef __linux__
   #include <sys/resource.h>
 #endif

 // Windows build
 #ifdef _WIN64
   #define _USE_MATH_DEFINES
   #include <Windows.h>
   #include <Psapi.h>
   #pragma comment(lib, "Psapi.lib")
 #endif

 #ifdef _OPENMP
   #include <omp.h>
 #endif

 #include <immintrin.h>
 #include <cmath>
 #include <ctime>
 #include <limits>

 #include <KSpaceSolver/KSpaceFirstOrder3DSolver.h>
 #include <Containers/MatrixContainer.h>
 #include <Containers/OutputStreamContainer.h>

 #include <MatrixClasses/FftwComplexMatrix.h>
 #include <Logger/Logger.h>

 using std::ios;

 //--------------------------------------------------------------------------------------------------------------------//
 //---------------------------------------------------- Constants -----------------------------------------------------//
 //--------------------------------------------------------------------------------------------------------------------//

 //--------------------------------------------------------------------------------------------------------------------//
 //------------------------------------------------- Public methods ---------------------------------------------------//
 //--------------------------------------------------------------------------------------------------------------------//

 /**
  * Constructor of the class.
  */
 KSpaceFirstOrder3DSolver::KSpaceFirstOrder3DSolver():
         mMatrixContainer(), mOutputStreamContainer(),
         mParameters(Parameters::getInstance()),
         mActPercent(0l),
         mTotalTime(), mPreProcessingTime(), mDataLoadTime (), mSimulationTime(),
         mPostProcessingTime(), mIterationTime()
 {
   mTotalTime.start();

   //Switch off HDF5 error messages
   H5Eset_auto(H5E_DEFAULT, NULL, NULL);
 }// end of KSpaceFirstOrder3DSolver
 //----------------------------------------------------------------------------------------------------------------------


 /**
  * Destructor of the class.
  */
 KSpaceFirstOrder3DSolver::~KSpaceFirstOrder3DSolver()
 {
   freeMemory();
 }// end of KSpaceFirstOrder3DSolver
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * The method allocates the matrix container, creates all matrices and creates all output streams
  * (however not allocating memory).
  */
 void KSpaceFirstOrder3DSolver::allocateMemory()
 {
   Logger::log(Logger::LogLevel::kBasic, kOutFmtMemoryAllocation);
   Logger::flush(Logger::LogLevel::kBasic);

   // create container, then all matrices
   mMatrixContainer.addMatrices();
   mMatrixContainer.createMatrices();

   // add output streams into container
   //@todo Think about moving under LoadInputData routine...
   mOutputStreamContainer.addStreams(mMatrixContainer);

   Logger::log(Logger::LogLevel::kBasic, kOutFmtDone);
 }// end of allocateMemory
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * The method frees all memory allocated by the class.
  */
 void KSpaceFirstOrder3DSolver::freeMemory()
 {
   mMatrixContainer.freeMatrices();
   mOutputStreamContainer.freeStreams();
 }// end of freeMemory
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Load data from the input file provided by the Parameter class and creates the output time series streams.
  */
 void KSpaceFirstOrder3DSolver::loadInputData()
 {
   Logger::log(Logger::LogLevel::kBasic, kOutFmtDataLoading);
   Logger::flush(Logger::LogLevel::kBasic);
   // Start timer
   mDataLoadTime.start();

   // get handles
   Hdf5File& inputFile      = mParameters.getInputFile(); // file is opened (in Parameters)
   Hdf5File& outputFile     = mParameters.getOutputFile();
   Hdf5File& checkpointFile = mParameters.getCheckpointFile();

   // Load data from disk
   Logger::log(Logger::LogLevel::kFull, kOutFmtNoDone);
   Logger::log(Logger::LogLevel::kFull, kOutFmtReadingInputFile);
   Logger::flush(Logger::LogLevel::kFull);

   // Load data from disk
   mMatrixContainer.loadDataFromInputFile();

   // close the input file since we don't need it anymore.
   inputFile.close();

   Logger::log(Logger::LogLevel::kFull, kOutFmtDone);

   // The simulation does not use checkpointing or this is the first turn
   bool recoverFromCheckpoint = (mParameters.isCheckpointEnabled() &&
                                 Hdf5File::canAccess(mParameters.getCheckpointFileName()));

   if (recoverFromCheckpoint)
   {
     //------------------------------------- Read data from the checkpoint file ---------------------------------------//
     Logger::log(Logger::LogLevel::kFull, kOutFmtReadingCheckpointFile);
     Logger::flush(Logger::LogLevel::kFull);

     // Open checkpoint file
     checkpointFile.open(mParameters.getCheckpointFileName());

     // Check the checkpoint file
     checkCheckpointFile();

     // read the actual value of t_index
     size_t checkpointedTimeIndex;
     checkpointFile.readScalarValue(checkpointFile.getRootGroup(), kTimeIndexName, checkpointedTimeIndex);
     mParameters.setTimeIndex(checkpointedTimeIndex);

     // Read necessary matrices from the checkpoint file
     mMatrixContainer.loadDataFromCheckpointFile();

     checkpointFile.close();
     Logger::log(Logger::LogLevel::kFull, kOutFmtDone);

     //--------------------------------------- Read data from the output file -----------------------------------------//
     Logger::log(Logger::LogLevel::kFull, kOutFmtReadingOutputFile);
     Logger::flush(Logger::LogLevel::kFull);

     // Reopen output file for RW access
     outputFile.open(mParameters.getOutputFileName(), H5F_ACC_RDWR);
     //Read file header of the output file
     mParameters.getFileHeader().readHeaderFromOutputFile(outputFile);
     // Check the checkpoint file
     checkOutputFile();
     // Restore elapsed time
     loadElapsedTimeFromOutputFile();

     mOutputStreamContainer.reopenStreams();
     Logger::log(Logger::LogLevel::kFull, kOutFmtDone);
   }
   else
   { //------------------------------------ First round of multi-leg simulation ---------------------------------------//
     // Create the output file
     Logger::log(Logger::LogLevel::kFull, kOutFmtCreatingOutputFile);
     Logger::flush(Logger::LogLevel::kFull);

     outputFile.create(mParameters.getOutputFileName());
     Logger::log(Logger::LogLevel::kFull, kOutFmtDone);

     // Create the steams, link them with the sampled matrices, however DO NOT allocate memory!
     mOutputStreamContainer.createStreams();
   }

  // Stop timer
   mDataLoadTime.stop();
   if (Logger::getLevel() != Logger::LogLevel::kFull)
   {
     Logger::log(Logger::LogLevel::kBasic, kOutFmtDone);
   }
 }// end of loadInputData
 //----------------------------------------------------------------------------------------------------------------------


 /**
 * This method computes k-space First Order 3D simulation.
  */
 void KSpaceFirstOrder3DSolver::compute()
 {
   // fft initialisation and preprocessing
   try
   {
     mPreProcessingTime.start();

     // initilaise all FFTW plans
     InitializeFftwPlans();

     // preprocessing phase generating necessary variables
     preProcessing();

     mPreProcessingTime.stop();
   }
   catch (const std::exception& e)
   {
     Logger::log(Logger::LogLevel::kBasic, kOutFmtFailed);
     Logger::log(Logger::LogLevel::kBasic, kOutFmtLastSeparator);

     Logger::errorAndTerminate(Logger::wordWrapString(e.what(),kErrFmtPathDelimiters, 9));
   }

   // Logger header for simulation
   Logger::log(Logger::LogLevel::kBasic, kOutFmtElapsedTime, mPreProcessingTime.getElapsedTime());
   Logger::log(Logger::LogLevel::kBasic, kOutFmtCompResourcesHeader);
   Logger::log(Logger::LogLevel::kBasic, kOutFmtCurrentMemory,   getMemoryUsage());

   // Main loop
   try
   {
     mSimulationTime.start();

     computeMainLoop();

     mSimulationTime.stop();

     Logger::log(Logger::LogLevel::kBasic,kOutFmtSimulationEndSeparator);
   }
   catch (const std::exception& e)
   {
     Logger::log(Logger::LogLevel::kBasic, kOutFmtSimulatoinFinalSeparator);
     Logger::errorAndTerminate(Logger::wordWrapString(e.what(),kErrFmtPathDelimiters, 9));
   }

   // Post processing region
   mPostProcessingTime.start();
   try
   {
     if (isCheckpointInterruption())
     { // Checkpoint
       Logger::log(Logger::LogLevel::kBasic, kOutFmtElapsedTime, mSimulationTime.getElapsedTime());
       Logger::log(Logger::LogLevel::kBasic, kOutFmtCheckpointTimeSteps, mParameters.getTimeIndex());
       Logger::log(Logger::LogLevel::kBasic, kOutFmtCheckpointHeader);
       Logger::log(Logger::LogLevel::kBasic, kOutFmtCreatingCheckpoint);
       Logger::flush(Logger::LogLevel::kBasic);

       if (Logger::getLevel() == Logger::LogLevel::kFull)
       {
         Logger::log(Logger::LogLevel::kBasic, kOutFmtNoDone);
       }

       saveCheckpointData();

       if (Logger::getLevel() != Logger::LogLevel::kFull)
       {
         Logger::log(Logger::LogLevel::kBasic, kOutFmtDone);
       }
     }
     else
     { // Finish
       Logger::log(Logger::LogLevel::kBasic, kOutFmtElapsedTime, mSimulationTime.getElapsedTime());
       Logger::log(Logger::LogLevel::kBasic, kOutFmtSeparator);
       Logger::log(Logger::LogLevel::kBasic, kOutFmtPostProcessing);
       Logger::flush(Logger::LogLevel::kBasic);

       postProcessing();

       // if checkpointing is enabled and the checkpoint file was created in the past, delete it
       if (mParameters.isCheckpointEnabled())
       {
         std::remove(mParameters.getCheckpointFileName().c_str());
       }
       Logger::log(Logger::LogLevel::kBasic, kOutFmtDone);
     }
   }
   catch (const std::exception &e)
   {
     Logger::log(Logger::LogLevel::kBasic, kOutFmtFailed);
     Logger::log(Logger::LogLevel::kBasic, kOutFmtLastSeparator);

     Logger::errorAndTerminate(Logger::wordWrapString(e.what(), kErrFmtPathDelimiters,9));
   }
   mPostProcessingTime.stop();

   // Final data written
   try
   {
     writeOutputDataInfo();
     mParameters.getOutputFile().close();

     Logger::log(Logger::LogLevel::kBasic, kOutFmtElapsedTime, mPostProcessingTime.getElapsedTime());
     }
   catch (const std::exception &e)
   {
     Logger::log(Logger::LogLevel::kBasic, kOutFmtLastSeparator);
     Logger::errorAndTerminate(Logger::wordWrapString(e.what(), kErrFmtPathDelimiters, 9));
   }
 }// end of compute()
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Get peak memory usage.
  */
 size_t KSpaceFirstOrder3DSolver::getMemoryUsage() const
 {
   // Linux build
   #ifdef __linux__
     struct rusage mem_usage;
     getrusage(RUSAGE_SELF, &mem_usage);

     return mem_usage.ru_maxrss >> 10;
   #endif

   // Windows build
   #ifdef _WIN64
     HANDLE hProcess;
     PROCESS_MEMORY_COUNTERS pmc;

     hProcess = OpenProcess(PROCESS_QUERY_INFORMATION | PROCESS_VM_READ,
                            FALSE,
                            GetCurrentProcessId());

     GetProcessMemoryInfo(hProcess, &pmc, sizeof(pmc));
     CloseHandle(hProcess);

     return pmc.PeakWorkingSetSize >> 20;
   #endif
 }// end of getMemoryUsage
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Get release code version.
  */
 std::string KSpaceFirstOrder3DSolver::getCodeName() const
 {
   return std::string(kOutFmtKWaveVersion);
 }// end of getCodeName
 //----------------------------------------------------------------------------------------------------------------------


 /**
  * Print full code name and the license.
  */
 void KSpaceFirstOrder3DSolver::printFullCodeNameAndLicense() const
 {
   Logger::log(Logger::LogLevel::kBasic, kOutFmtBuildNoDataTime, 10, 11, __DATE__, 8, 8, __TIME__);

   if (mParameters.getGitHash() != "")
   {
     Logger::log(Logger::LogLevel::kBasic, kOutFmtVersionGitHash, mParameters.getGitHash().c_str());
   }
   Logger::log(Logger::LogLevel::kBasic, kOutFmtSeparator);


   // OS detection
   #ifdef __linux__
     Logger::log(Logger::LogLevel::kBasic, kOutFmtLinuxBuild);
   #elif __APPLE__
     Logger::log(Logger::LogLevel::kBasic, kOutFmtMacOsBuild);
   #elif _WIN32
     Logger::log(Logger::LogLevel::kBasic, kOutFmtWindowsBuild);
   #endif

   // Compiler detections
   #if (defined(__GNUC__) || defined(__GNUG__)) && !(defined(__clang__) || defined(__INTEL_COMPILER))
     Logger::log(Logger::LogLevel::kBasic, kOutFmtGnuCompiler, __VERSION__);
   #endif
   #ifdef __INTEL_COMPILER
     Logger::log(Logger::LogLevel::kBasic, kOutFmtIntelCompiler, __INTEL_COMPILER);
   #endif
   #ifdef _MSC_VER
   Logger::log(Logger::LogLevel::kBasic, kOutFmtVisualStudioCompiler, _MSC_VER);
   #endif

      // instruction set
   #if (defined (__AVX2__))
     Logger::log(Logger::LogLevel::kBasic, kOutFmtAVX2);
   #elif (defined (__AVX__))
     Logger::log(Logger::LogLevel::kBasic, kOutFmtAVX);
   #elif (defined (__SSE4_2__))
     Logger::log(Logger::LogLevel::kBasic, kOutFmtSSE42);
   #elif (defined (__SSE4_1__))
     Logger::log(Logger::LogLevel::kBasic, kOutFmtSSE41);
   #elif (defined (__SSE3__))
     Logger::log(Logger::LogLevel::kBasic, kOutFmtSSE3);
   #elif (defined (__SSE2__))
     Logger::log(Logger::LogLevel::kBasic, kOutFmtSSE2);
   #endif

   Logger::log(Logger::LogLevel::kBasic, kOutFmtLicense);

 }// end of printFullCodeNameAndLicense
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Set processor affinity.
  */
 void KSpaceFirstOrder3DSolver::setProcessorAffinity()
 {
   // Linux Build
   #ifdef __linux__
     //GNU compiler
     #if (defined(__GNUC__) || defined(__GNUG__)) && !(defined(__clang__) || defined(__INTEL_COMPILER))
       setenv("OMP_PROC_BIND","TRUE", 1);
     #endif

     #ifdef __INTEL_COMPILER
       setenv("KMP_AFFINITY","none", 1);
     #endif
   #endif

   // Windows build is always compiled by the Intel Compiler
   #ifdef _WIN64
     _putenv_s("KMP_AFFINITY","none");
   #endif
 }//end of setProcessorAffinity
 //----------------------------------------------------------------------------------------------------------------------


 //--------------------------------------------------------------------------------------------------------------------//
 //------------------------------------------------ Protected methods -------------------------------------------------//
 //--------------------------------------------------------------------------------------------------------------------//

 /**
  * Initialize FFTW plans.
  */
 void KSpaceFirstOrder3DSolver::InitializeFftwPlans()
 {

   // initialization of FFTW library
   #ifdef _OPENMP
     fftwf_init_threads();
     fftwf_plan_with_nthreads(mParameters.getNumberOfThreads());
   #endif

   // The simulation does not use checkpointing or this is the first turn
   bool recoverFromPrevState = (mParameters.isCheckpointEnabled() &&
                                Hdf5File::canAccess(mParameters.getCheckpointFileName()));


   #if (defined(__GNUC__) || defined(__GNUG__)) && !(defined(__clang__) || defined(__INTEL_COMPILER))
     // import FFTW wisdom if it is here
     if (recoverFromPrevState)
     {


       Logger::log(Logger::LogLevel::kFull, kOutFmtLoadingFftwWisdom);
       Logger::flush(Logger::LogLevel::kFull);
       // import FFTW wisdom
       try
       {
         // try to find the wisdom in the file that has the same name as the checkpoint file (different extension)
         FftwComplexMatrix::importWisdom();
         Logger::log(Logger::LogLevel::kFull, kOutFmtDone);
       }
       catch (const std::runtime_error& e)
       {
         Logger::log(Logger::LogLevel::kFull, kOutFmtFailed);
       }
     }
   #endif

   Logger::log(Logger::LogLevel::kBasic, kOutFmtFftPlans);
   Logger::flush(Logger::LogLevel::kBasic);

   // create real to complex plans
   getTempFftwX().createR2CFftPlan3D(getP());
   getTempFftwY().createR2CFftPlan3D(getP());
   getTempFftwZ().createR2CFftPlan3D(getP());

   // create real to complex plans
   getTempFftwX().createC2RFftPlan3D(getP());
   getTempFftwY().createC2RFftPlan3D(getP());
   getTempFftwZ().createC2RFftPlan3D(getP());

   // if necessary, create 1D shift plans.
   // in this case, the matrix has a bit bigger dimensions to be able to store
   // shifted matrices.
   if (Parameters::getInstance().getStoreVelocityNonStaggeredRawFlag())
   {
     // X shifts
     getTempFftwShift().createR2CFftPlan1DX(getP());
     getTempFftwShift().createC2RFftPlan1DX(getP());

     // Y shifts
     getTempFftwShift().createR2CFftPlan1DY(getP());
     getTempFftwShift().createC2RFftPlan1DY(getP());

     // Z shifts
     getTempFftwShift().createR2CFftPlan1DZ(getP());
     getTempFftwShift().createC2RFftPlan1DZ(getP());
   }// end u_non_staggered

   Logger::log(Logger::LogLevel::kBasic, kOutFmtDone);
 }// end of InitializeFftwPlans
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute pre-processing phase.
  */
 void KSpaceFirstOrder3DSolver::preProcessing()
 {
   Logger::log(Logger::LogLevel::kBasic,kOutFmtPreProcessing);
   Logger::flush(Logger::LogLevel::kBasic);

   // get the correct sensor mask and recompute indices
   if (mParameters.getSensorMaskType() == Parameters::SensorMaskType::kIndex)
   {
     getSensorMaskIndex().recomputeIndicesToCPP();
   }

   if (mParameters.getSensorMaskType() == Parameters::SensorMaskType::kCorners)
   {
     getSensorMaskCorners().recomputeIndicesToCPP();
   }

   if ((mParameters.getTransducerSourceFlag() != 0) ||
       (mParameters.getVelocityXSourceFlag() != 0)  ||
       (mParameters.getVelocityYSourceFlag() != 0)  ||
       (mParameters.getVelocityZSourceFlag() != 0)
      )
   {
     getVelocitySourceIndex().recomputeIndicesToCPP();
   }

   if (mParameters.getTransducerSourceFlag() != 0)
   {
     getDelayMask().recomputeIndicesToCPP();
   }

   if (mParameters.getPressureSourceFlag() != 0)
   {
     getPressureSourceIndex().recomputeIndicesToCPP();
   }


   // compute dt / rho0_sg...
   if (!mParameters.getRho0ScalarFlag())
   { // non-uniform grid cannot be pre-calculated :-(
     // rho is matrix
     if (mParameters.getNonUniformGridFlag())
     {
       generateInitialDenisty();
     }
     else
     {
       getDtRho0Sgx().scalarDividedBy(mParameters.getDt());
       getDtRho0Sgy().scalarDividedBy(mParameters.getDt());
       getDtRho0Sgz().scalarDividedBy(mParameters.getDt());
     }
   }

   // generate different matrices
   if (mParameters.getAbsorbingFlag() != 0)
   {
     generateKappaAndNablas();
     generateTauAndEta();
   }
   else
   {
     generateKappa();
   }

   // calculate c^2. It has to be after kappa gen... because of c modification
   computeC2();

   Logger::log(Logger::LogLevel::kBasic, kOutFmtDone);
 }// end of preProcessing
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute the main time loop of KSpaceFirstOrder3D.
  */
 void KSpaceFirstOrder3DSolver::computeMainLoop()
 {
   mActPercent = 0;
   // set ActPercent to correspond the t_index after recovery
   if (mParameters.getTimeIndex() > 0)
   {
     mActPercent = (100 * mParameters.getTimeIndex()) / mParameters.getNt();
   }

   // Progress header
   Logger::log(Logger::LogLevel::kBasic,kOutFmtSimulationHeader);

   mIterationTime.start();

   while ((mParameters.getTimeIndex() < mParameters.getNt()) && (!isTimeToCheckpoint()))
   {
     const size_t timeIndex = mParameters.getTimeIndex();

     // compute velocity
     computeVelocity();
     // add in the velocity source term
     addVelocitySource();

     // add in the transducer source term (t = t1) to ux
     if (mParameters.getTransducerSourceFlag() > timeIndex)
     {
       // transducer source is added only to the x component of the particle velocity
       addTransducerSource();
     }

     // compute gradient of velocity
     computeVelocityGradient();

     if (mParameters.getNonLinearFlag())
     {
       computeDensityNonliner();
     }
     else
     {
       computeDensityLinear();
     }


      // add in the source pressure term
      addPressureSource();

     if (mParameters.getNonLinearFlag())
     {
       computePressureNonlinear();
     }
     else
     {
       computePressureLinear();
     }

     // calculate initial pressure
     if ((timeIndex == 0) && (mParameters.getInitialPressureSourceFlag() == 1)) addInitialPressureSource();

     storeSensorData();
     printStatistics();
     mParameters.incrementTimeIndex();
   }// time loop
 }// end of computeMainLoop
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Post processing the quantities, closing the output streams and storing the sensor mask.
  */
 void KSpaceFirstOrder3DSolver::postProcessing()
 {
   if (mParameters.getStorePressureFinalAllFlag())
   {
     getP().writeData(mParameters.getOutputFile(), kPressureFinalName, mParameters.getCompressionLevel());
   }// p_final

   if (mParameters.getStoreVelocityFinalAllFlag())
   {
     getUxSgx().writeData(mParameters.getOutputFile(), kUxFinalName, mParameters.getCompressionLevel());
     getUySgy().writeData(mParameters.getOutputFile(), kUyFinalName, mParameters.getCompressionLevel());
     getUzSgz().writeData(mParameters.getOutputFile(), kUzFinalName, mParameters.getCompressionLevel());
   }// u_final

   // Apply post-processing and close
   mOutputStreamContainer.postProcessStreams();
   mOutputStreamContainer.closeStreams();


   // store sensor mask if wanted
   if (mParameters.getCopySensorMaskFlag())
   {
     if (mParameters.getSensorMaskType() == Parameters::SensorMaskType::kIndex)
     {
       getSensorMaskIndex().recomputeIndicesToMatlab();
       getSensorMaskIndex().writeData(mParameters.getOutputFile(),kSensorMaskIndexName,
                                      mParameters.getCompressionLevel());
     }
     if (mParameters.getSensorMaskType() == Parameters::SensorMaskType::kCorners)
     {
       getSensorMaskCorners().recomputeIndicesToMatlab();
       getSensorMaskCorners().writeData(mParameters.getOutputFile(),kSensorMaskCornersName,
                                        mParameters.getCompressionLevel());
     }
   }
 }// end of postProcessing
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Store sensor data.
  */
 void KSpaceFirstOrder3DSolver::storeSensorData()
 {
   // Unless the time for sampling has come, exit
   if (mParameters.getTimeIndex() >= mParameters.getSamplingStartTimeIndex())
   {
     if (mParameters.getStoreVelocityNonStaggeredRawFlag())
     {
       computeShiftedVelocity();
     }
     mOutputStreamContainer.sampleStreams();
   }
 }// end of storeSensorData
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Write statistics and the header into the output file.
  */
 void KSpaceFirstOrder3DSolver::writeOutputDataInfo()
 {
   // write timeIndex into the output file
   mParameters.getOutputFile().writeScalarValue(mParameters.getOutputFile().getRootGroup(),
                                                kTimeIndexName,
                                                mParameters.getTimeIndex());

   // Write scalars
   mParameters.saveScalarsToOutputFile();
   Hdf5FileHeader& fileHeader = mParameters.getFileHeader();

   // Write File header
   fileHeader.setCodeName(getCodeName());
   fileHeader.setMajorFileVersion();
   fileHeader.setMinorFileVersion();
   fileHeader.setActualCreationTime();
   fileHeader.setFileType(Hdf5FileHeader::FileType::kOutput);
   fileHeader.setHostName();

   fileHeader.setMemoryConsumption(getMemoryUsage());

   // Stop total timer here
   mTotalTime.stop();
   fileHeader.setExecutionTimes(getCumulatedTotalTime(),
                                getCumulatedDataLoadTime(),
                                getCumulatedPreProcessingTime(),
                                getCumulatedSimulationTime(),
                                getCumulatedPostProcessingTime());

   fileHeader.setNumberOfCores();
   fileHeader.writeHeaderToOutputFile(mParameters.getOutputFile());
 }// end of writeOutputDataInfo
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Save checkpoint data into the checkpoint file, flush aggregated outputs into the output file.
  */
 void KSpaceFirstOrder3DSolver::saveCheckpointData()
 {
   #if (defined(__GNUC__) || defined(__GNUG__)) && !(defined(__clang__) || defined(__INTEL_COMPILER))
      Logger::log(Logger::LogLevel::kFull, kOutFmtStoringFftwWisdom);
      Logger::flush(Logger::LogLevel::kFull);
     // export FFTW wisdom
      try
      {
        FftwComplexMatrix::exportWisdom();
        Logger::log(Logger::LogLevel::kFull, kOutFmtDone);
      }
      catch (const std::runtime_error& e)
      {
        Logger::log(Logger::LogLevel::kFull, kOutFmtFailed);
      }
   #endif

   // Create Checkpoint file
   Hdf5File& checkpointFile = mParameters.getCheckpointFile();
   // if it happens and the file is opened (from the recovery, close it)
   if (checkpointFile.isOpen()) checkpointFile.close();

   Logger::log(Logger::LogLevel::kFull, kOutFmtStoringCheckpointData);
   Logger::flush(Logger::LogLevel::kFull);

   // Create the new file (overwrite the old one)
   checkpointFile.create(mParameters.getCheckpointFileName());


   //------------------------------------------------ Store Matrices --------------------------------------------------//
   // Store all necessary matrices in Checkpoint file
   mMatrixContainer.storeDataIntoCheckpointFile();

   // Write t_index
   checkpointFile.writeScalarValue(checkpointFile.getRootGroup(), kTimeIndexName, mParameters.getTimeIndex());

   // store basic dimension sizes (Nx, Ny, Nz) - Nt is not necessary
   checkpointFile.writeScalarValue(checkpointFile.getRootGroup(), kNxName, mParameters.getFullDimensionSizes().nx);
   checkpointFile.writeScalarValue(checkpointFile.getRootGroup(), kNyName, mParameters.getFullDimensionSizes().ny);
   checkpointFile.writeScalarValue(checkpointFile.getRootGroup(), kNzName, mParameters.getFullDimensionSizes().nz);


   // Write checkpoint file header
   Hdf5FileHeader fileHeader = mParameters.getFileHeader();

   fileHeader.setFileType(Hdf5FileHeader::FileType::kCheckpoint);
   fileHeader.setCodeName(getCodeName());
   fileHeader.setActualCreationTime();

   fileHeader.writeHeaderToCheckpointFile(checkpointFile);

   // Close the checkpoint file
   checkpointFile.close();
   Logger::log(Logger::LogLevel::kFull, kOutFmtDone);

   // checkpoint output streams only if necessary (t_index > start_index) - here we're at  step + 1
   if (mParameters.getTimeIndex() > mParameters.getSamplingStartTimeIndex())
   {
     Logger::log(Logger::LogLevel::kFull,kOutFmtStoringSensorData);
     Logger::flush(Logger::LogLevel::kFull);

     mOutputStreamContainer.checkpointStreams();

     Logger::log(Logger::LogLevel::kFull, kOutFmtDone);
   }
   mOutputStreamContainer.closeStreams();
 }// end of saveCheckpointData
 //----------------------------------------------------------------------------------------------------------------------


  /**
  * Compute new values of acoustic velocity in all three dimensions (UxSgx, UySgy, UzSgz).
  *
  * <b>Matlab code:</b> \n
  *
  * \verbatim
    p_k = fftn(p);
    ux_sgx = bsxfun(@times, pml_x_sgx, ...
        bsxfun(@times, pml_x_sgx, ux_sgx) ...
        - dt .* rho0_sgx_inv .* real(ifftn( bsxfun(@times, ddx_k_shift_pos, kappa .* fftn(p)) )) ...
        );
    uy_sgy = bsxfun(@times, pml_y_sgy, ...
        bsxfun(@times, pml_y_sgy, uy_sgy) ...
        - dt .* rho0_sgy_inv .* real(ifftn( bsxfun(@times, ddy_k_shift_pos, kappa .* fftn(p)) )) ...
        );
    uz_sgz = bsxfun(@times, pml_z_sgz, ...
        bsxfun(@times, pml_z_sgz, uz_sgz) ...
        - dt .* rho0_sgz_inv .* real(ifftn( bsxfun(@times, ddz_k_shift_pos, kappa .* fftn(p)) )) ...
        );
  \endverbatim
  */
  void KSpaceFirstOrder3DSolver::computeVelocity()
  {
     // bsxfun(@times, ddx_k_shift_pos, kappa .* fftn(p)), for all 3 dims
     computePressureGradient();

     getTempFftwX().computeC2RFft3D(getTemp1Real3D());
     getTempFftwY().computeC2RFft3D(getTemp2Real3D());
     getTempFftwZ().computeC2RFft3D(getTemp3Real3D());

     if (mParameters.getRho0ScalarFlag())
     { // scalars
       if (mParameters.getNonUniformGridFlag())
       {
         computeVelocityHomogeneousNonuniform();
        }
       else
       {
         computeVelocityHomogeneousUniform();
       }
     }
     else
     {// matrices
       computeVelocityHeterogeneous();

     }
 }// end of computeVelocity
 //----------------------------------------------------------------------------------------------------------------------

  /**
  * Compute new values for duxdx, duydy, duzdz.
  */
 void  KSpaceFirstOrder3DSolver::computeVelocityGradient()
 {
   getTempFftwX().computeR2CFft3D(getUxSgx());
   getTempFftwY().computeR2CFft3D(getUySgy());
   getTempFftwZ().computeR2CFft3D(getUzSgz());

   const DimensionSizes& reducedDimensionSizes = mParameters.getReducedDimensionSizes();
   const float divider = 1.0f / static_cast<float>(mParameters.getFullDimensionSizes().nElements());

   const float* kappa = getKappa().getData();

   FloatComplex* tempFftX = getTempFftwX().getComplexData();
   FloatComplex* tempFftY = getTempFftwY().getComplexData();
   FloatComplex* tempFftZ = getTempFftwZ().getComplexData();

   FloatComplex* ddxKShiftNeg = getDdxKShiftNeg().getComplexData();
   FloatComplex* ddyKShiftNeg = getDdyKShiftNeg().getComplexData();
   FloatComplex* ddzKShiftNeg = getDdzKShiftNeg().getComplexData();

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < reducedDimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < reducedDimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < reducedDimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, reducedDimensionSizes);
         const float eKappa = divider * kappa[i];

         tempFftX[i] *=  ddxKShiftNeg[x] * eKappa;
         tempFftY[i] *=  ddyKShiftNeg[y] * eKappa;
         tempFftZ[i] *=  ddzKShiftNeg[z] * eKappa;
       } // x
     } // y
   } // z


   getTempFftwX().computeC2RFft3D(getDuxdx());
   getTempFftwY().computeC2RFft3D(getDuydy());
   getTempFftwZ().computeC2RFft3D(getDuzdz());

  //------------------------------------------------- Non linear grid -------------------------------------------------//
   if (mParameters.getNonUniformGridFlag() != 0)
   {
     float* duxdx = getDuxdx().getData();
     float* duydy = getDuydy().getData();
     float* duzdz = getDuzdz().getData();

     const float* duxdxn = getDxudxn().getData();
     const float* duydyn = getDyudyn().getData();
     const float* duzdzn = getDzudzn().getData();

     const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();

     #pragma omp parallel for schedule(static)
     for (size_t z = 0; z < dimensionSizes.nz; z++)
     {
       for (size_t y = 0; y < dimensionSizes.ny; y++)
       {
         #pragma omp simd
         for (size_t x = 0; x < dimensionSizes.nx; x++)
         {
           const size_t i = get1DIndex(z, y, x, dimensionSizes);
           duxdx[i] *= duxdxn[x];
           duydy[i] *= duydyn[y];
           duzdz[i] *= duzdzn[z];
         } // x
       } // y
     } // z
  }// nonlinear
 }// end of computeVelocityGradient
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Calculate new values of acoustic density for nonlinear case (rhoX, rhoy and rhoZ).
  *
  * <b>Matlab code:</b> \n
  *
  *\verbatim
     rho0_plus_rho = 2 .* (rhox + rhoy + rhoz) + rho0;
     rhox = bsxfun(@times, pml_x, bsxfun(@times, pml_x, rhox) - dt .* rho0_plus_rho .* duxdx);
     rhoy = bsxfun(@times, pml_y, bsxfun(@times, pml_y, rhoy) - dt .* rho0_plus_rho .* duydy);
     rhoz = bsxfun(@times, pml_z, bsxfun(@times, pml_z, rhoz) - dt .* rho0_plus_rho .* duzdz);
  \endverbatim
  */
 void KSpaceFirstOrder3DSolver::computeDensityNonliner()
 {
   const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();

   const float dt  = mParameters.getDt();

   float* rhoX  = getRhoX().getData();
   float* rhoY  = getRhoY().getData();
   float* rhoZ  = getRhoZ().getData();

   const float* pmlX  = getPmlX().getData();
   const float* pmlY  = getPmlY().getData();
   const float* pmlZ  = getPmlZ().getData();

   const float* duxdx = getDuxdx().getData();
   const float* duydy = getDuydy().getData();
   const float* duzdz = getDuzdz().getData();

   //----------------------------------------------- rho0 is scalar -------------------------------------------------//
   if (mParameters.getRho0ScalarFlag())
   {
     const float rho0 = mParameters.getRho0Scalar();

     #pragma omp parallel for schedule(static)
     for (size_t z = 0; z < dimensionSizes.nz; z++)
     {
       for (size_t y = 0; y < dimensionSizes.ny; y++)
       {
         #pragma omp simd
         for (size_t x = 0; x < dimensionSizes.nx; x++)
         {
           const size_t i = get1DIndex(z, y, x, dimensionSizes);
           const float sumRhosDt = (2.0f * (rhoX[i] + rhoY[i] + rhoZ[i]) + rho0) * dt;

           rhoX[i] = pmlX[x] * ((pmlX[x] * rhoX[i]) - sumRhosDt * duxdx[i]);
           rhoY[i] = pmlY[y] * ((pmlY[y] * rhoY[i]) - sumRhosDt * duydy[i]);
           rhoZ[i] = pmlZ[z] * ((pmlZ[z] * rhoZ[i]) - sumRhosDt * duzdz[i]);
         }// x
       }// y
     }// z
   }
   else
   { //---------------------------------------------- rho0 is matrix ------------------------------------------------//
     // rho0 is a matrix
     const float* rho0  = getRho0().getData();

     #pragma omp parallel for schedule(static)
     for (size_t z = 0; z < dimensionSizes.nz; z++)
     {
       for (size_t y = 0; y < dimensionSizes.ny; y++)
       {
         #pragma omp simd
         for (size_t x = 0; x < dimensionSizes.nx; x++)
         {
           const size_t i = get1DIndex(z, y, x, dimensionSizes);
           const float sumRhosDt = (2.0f * (rhoX[i] + rhoY[i] + rhoZ[i]) + rho0[i]) * dt;

           rhoX[i] = pmlX[x] * ((pmlX[x] * rhoX[i]) - sumRhosDt * duxdx[i]);
           rhoY[i] = pmlY[y] * ((pmlY[y] * rhoY[i]) - sumRhosDt * duydy[i]);
           rhoZ[i] = pmlZ[z] * ((pmlZ[z] * rhoZ[i]) - sumRhosDt * duzdz[i]);
         } // x
       }// y
     }// z
   } // end rho is matrix
 }// end of computeDensityNonliner
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Calculate new values of acoustic density for linear case (rhoX, rhoy and rhoZ).
  *
  * <b>Matlab code:</b> \n
  *
  *\verbatim
     rhox = bsxfun(@times, pml_x, bsxfun(@times, pml_x, rhox) - dt .* rho0 .* duxdx);
     rhoy = bsxfun(@times, pml_y, bsxfun(@times, pml_y, rhoy) - dt .* rho0 .* duydy);
     rhoz = bsxfun(@times, pml_z, bsxfun(@times, pml_z, rhoz) - dt .* rho0 .* duzdz);
 \endverbatim
  *
  */
 void KSpaceFirstOrder3DSolver::computeDensityLinear()
 {
   const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();
   const float dt = mParameters.getDt();

   float* rhoX  = getRhoX().getData();
   float* rhoY  = getRhoY().getData();
   float* rhoZ  = getRhoZ().getData();

   const float* pmlX  = getPmlX().getData();
   const float* pmlY  = getPmlY().getData();
   const float* pmlZ  = getPmlZ().getData();

   const float* duxdx = getDuxdx().getData();
   const float* duydy = getDuydy().getData();
   const float* duzdz = getDuzdz().getData();

   //----------------------------------------------- rho0 is scalar -------------------------------------------------//
   if (mParameters.getRho0ScalarFlag())
   { // rho0 is a scalar
     const float dtRho0 = mParameters.getRho0Scalar() * dt;

     #pragma omp parallel for schedule(static)
     for (size_t z = 0; z < dimensionSizes.nz; z++)
     {
       for (size_t y = 0; y < dimensionSizes.ny; y++)
       {
         #pragma omp simd
         for (size_t x = 0; x < dimensionSizes.nx; x++)
         {
           const size_t i = get1DIndex(z, y, x, dimensionSizes);

           rhoX[i] = pmlX[x] * (((pmlX[x] * rhoX[i]) - (dtRho0 * duxdx[i])));
           rhoY[i] = pmlY[y] * (((pmlY[y] * rhoY[i]) - (dtRho0 * duydy[i])));
           rhoZ[i] = pmlZ[z] * (((pmlZ[z] * rhoZ[i]) - (dtRho0 * duzdz[i])));
         } // x
       }// y
     }// z
   }
   else
   { //---------------------------------------------- rho0 is matrix ------------------------------------------------//
     // rho0 is a matrix
     const float* rho0  = getRho0().getData();

     #pragma omp parallel for schedule(static)
     for (size_t z = 0; z < dimensionSizes.nz; z++)
     {
       for (size_t y = 0; y < dimensionSizes.ny; y++)
       {
         #pragma omp simd
         for (size_t x = 0; x < dimensionSizes.nx; x++)
         {
           const size_t i = get1DIndex(z, y, x, dimensionSizes);
           const float dtRho0 = dt * rho0[i];

           rhoX[i] = pmlX[x] * (((pmlX[x] * rhoX[i]) - (dtRho0 * duxdx[i])));
           rhoY[i] = pmlY[y] * (((pmlY[y] * rhoY[i]) - (dtRho0 * duydy[i])));
           rhoZ[i] = pmlZ[z] * (((pmlZ[z] * rhoZ[i]) - (dtRho0 * duzdz[i])));
         } // x
       }// y
     }// z
   } // end rho is a matrix
 }// end of computeDensityLinear
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute acoustic pressure for non-linear case.
  *
  * <b>Matlab code:</b> \n
  *
  *\verbatim
     case 'lossless'
         % calculate p using a nonlinear adiabatic equation of state
         p = c.^2 .* (rhox + rhoy + rhoz + medium.BonA .* (rhox + rhoy + rhoz).^2 ./ (2 .* rho0));

     case 'absorbing'
         % calculate p using a nonlinear absorbing equation of state
         p = c.^2 .* (...
             (rhox + rhoy + rhoz) ...
             + absorb_tau .* real(ifftn( absorb_nabla1 .* fftn(rho0 .* (duxdx + duydy + duzdz)) ))...
             - absorb_eta .* real(ifftn( absorb_nabla2 .* fftn(rhox + rhoy + rhoz) ))...
             + medium.BonA .*(rhox + rhoy + rhoz).^2 ./ (2 .* rho0) ...
             );

  \endverbatim
  */
  void KSpaceFirstOrder3DSolver::computePressureNonlinear()
 {
   if (mParameters.getAbsorbingFlag())
   { // absorbing case

     RealMatrix& densitySum         = getTemp1Real3D();
     RealMatrix& nonlinearTerm      = getTemp2Real3D();
     RealMatrix& velocitGradientSum = getTemp3Real3D();

     // reusing of the temp variables
     RealMatrix& absorbTauTerm = velocitGradientSum;
     RealMatrix& absorbEtaTerm = densitySum;

     // different templated variants of computePressureTermsNonlinear
     if ( mParameters.getBOnAScalarFlag())
     {
       if (mParameters.getRho0ScalarFlag())
       {
         computePressureTermsNonlinear<true, true>(densitySum, nonlinearTerm, velocitGradientSum);
       }
       else
       {
         computePressureTermsNonlinear<true, false>(densitySum, nonlinearTerm, velocitGradientSum);
       }
     }
     else
     {
       if (mParameters.getRho0ScalarFlag())
       {
         computePressureTermsNonlinear<false, true>(densitySum, nonlinearTerm, velocitGradientSum);
       }
       else
       {
         computePressureTermsNonlinear<false, false>(densitySum, nonlinearTerm, velocitGradientSum);
       }
     }

     // ifftn( absorb_nabla1 * fftn (rho0 * (duxdx+duydy+duzdz))
     getTempFftwX().computeR2CFft3D(velocitGradientSum);
     getTempFftwY().computeR2CFft3D(densitySum);

     computeAbsorbtionTerm(getTempFftwX(), getTempFftwY());

     getTempFftwX().computeC2RFft3D(absorbTauTerm);
     getTempFftwY().computeC2RFft3D(absorbEtaTerm);

     // different templated variants of sumPressureTermsNonlinear
     if (mParameters.getC0ScalarFlag())
     {
       if (mParameters.getAlphaCoeffScalarFlag())
       {
         sumPressureTermsNonlinear<true, true>(absorbTauTerm, absorbEtaTerm, nonlinearTerm);
       }
       else
       {
         sumPressureTermsNonlinear<true, false>(absorbTauTerm, absorbEtaTerm, nonlinearTerm);
       }
     }
     else
     {
       sumPressureTermsNonlinear<false, false>(absorbTauTerm, absorbEtaTerm, nonlinearTerm);
     }

   }
   else
   { //------------------------------------------------ lossless case--------------------------------------------------//
     if (mParameters.getC0ScalarFlag())
     {
       if (mParameters.getBOnAScalarFlag())
       {
         if (mParameters.getRho0ScalarFlag())
         {
           sumPressureTermsNonlinearLossless<true, true, true>();
         }
         else
         {
           sumPressureTermsNonlinearLossless<true, true, false>();
         }
       }
       else
       {
         if (mParameters.getRho0ScalarFlag())
         {
           sumPressureTermsNonlinearLossless<true, false, true>();
         }
         else
         {
           sumPressureTermsNonlinearLossless<true, false, false>();
         }
       }
     }
     else
     {
       if (mParameters.getBOnAScalarFlag())
       {
         if (mParameters.getRho0ScalarFlag())
         {
           sumPressureTermsNonlinearLossless<false, true, true>();
         }
         else
         {
           sumPressureTermsNonlinearLossless<false, true, false>();
         }
       }
       else
       {
         if (mParameters.getRho0ScalarFlag())
         {
           sumPressureTermsNonlinearLossless<false, false, true>();
         }
         else
         {
           sumPressureTermsNonlinearLossless<false, false, false>();
         }
       }
     }
   }
 }// end of computePressureNonlinear
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute new p for linear case.
  *
  * <b>Matlab code:</b> \n
  *
  *\verbatim
     case 'lossless'

         % calculate p using a linear adiabatic equation of state
         p = c.^2 .* (rhox + rhoy + rhoz);

     case 'absorbing'

         % calculate p using a linear absorbing equation of state
         p = c.^2 .* ( ...
             (rhox + rhoy + rhoz) ...
             + absorb_tau .* real(ifftn( absorb_nabla1 .* fftn(rho0 .* (duxdx + duydy + duzdz)) )) ...
             - absorb_eta .* real(ifftn( absorb_nabla2 .* fftn(rhox + rhoy + rhoz) )) ...
             );
  \endverbatim
  */
  void KSpaceFirstOrder3DSolver::computePressureLinear()
  {
   // rhox + rhoy + rhoz
   if (mParameters.getAbsorbingFlag())
   { // absorbing case

     RealMatrix& densitySum           = getTemp1Real3D();
     RealMatrix& velocityGradientTerm = getTemp2Real3D();

     RealMatrix& absorbTauTerm        = getTemp2Real3D();
     RealMatrix& absorbEtaTerm        = getTemp3Real3D();

     computePressureTermsLinear(densitySum, velocityGradientTerm);

     // ifftn ( absorb_nabla1 * fftn (rho0 * (duxdx+duydy+duzdz))

     getTempFftwX().computeR2CFft3D(velocityGradientTerm);
     getTempFftwY().computeR2CFft3D(densitySum);

     computeAbsorbtionTerm(getTempFftwX(), getTempFftwY());

     getTempFftwX().computeC2RFft3D(absorbTauTerm);
     getTempFftwY().computeC2RFft3D(absorbEtaTerm);

     if (mParameters.getC0ScalarFlag())
     {
       if (mParameters.getAlphaCoeffScalarFlag())
       {
         sumPressureTermsLinear<true, true>(absorbTauTerm, absorbEtaTerm, densitySum);
       }
       else
       {
         sumPressureTermsLinear<true, false>(absorbTauTerm, absorbEtaTerm, densitySum);
       }
     }
     else
     {
       sumPressureTermsLinear<false, false>(absorbTauTerm, absorbEtaTerm, densitySum);
     }
   }
   else
   {
     // lossless case
     sumPressureTermsLinearLossless();
   }
  }// end of computePressureLinear
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Add u source to the particle velocity.
  */
 void KSpaceFirstOrder3DSolver::addVelocitySource()
 {
   const size_t timeIndex = mParameters.getTimeIndex();

   if (mParameters.getVelocityXSourceFlag() > timeIndex)
   {
     computeVelocitySourceTerm(getUxSgx(), GetVelocityXSourceInput(), getVelocitySourceIndex());
   }

   if (mParameters.getVelocityYSourceFlag() > timeIndex)
   {
     computeVelocitySourceTerm(getUySgy(), GetVelocityYSourceInput(), getVelocitySourceIndex());
   }

   if (mParameters.getVelocityZSourceFlag() > timeIndex)
   {
     computeVelocitySourceTerm(getUzSgz(), getVelocityZSourceInput(), getVelocitySourceIndex());
   }
 }// end of addVelocitySource
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Add in velocity source terms.
  */
 void KSpaceFirstOrder3DSolver::computeVelocitySourceTerm(RealMatrix&        velocityMatrix,
                                                          const RealMatrix&  velocitySourceInput,
                                                          const IndexMatrix& velocitySourceIndex)
 {

   const size_t timeIndex  = mParameters.getTimeIndex();
   const size_t sourceSize = velocitySourceIndex.size();
   const size_t index2D    = (mParameters.getVelocitySourceMany() != 0) ? timeIndex * sourceSize : timeIndex;

   const bool velocitySourceMode = mParameters.getVelocitySourceMode();
   const bool velocitySourceMany = mParameters.getVelocitySourceMany();

   if (velocitySourceMode == 0)
   {
     #pragma omp parallel for if (sourceSize > 16384)
     for (size_t i = 0; i < sourceSize; i++)
     {
       const size_t signalIndex = (velocitySourceMany != 0) ? index2D + i : index2D;
       velocityMatrix[velocitySourceIndex[i]] = velocitySourceInput[signalIndex];
     }
   }// end of Dirichlet

   if (velocitySourceMode == 1)
   {
     #pragma omp parallel for if (sourceSize > 16384)
     for (size_t i = 0; i < sourceSize; i++)
     {
       const size_t signalIndex = (velocitySourceMany != 0) ? index2D + i : index2D;
       velocityMatrix[velocitySourceIndex[i]] += velocitySourceInput[signalIndex];
     }
   }// end of add
 }// end of computeVelocitySourceTerm
 //----------------------------------------------------------------------------------------------------------------------

  /**
   * Add in pressure source.
   */
 void KSpaceFirstOrder3DSolver::addPressureSource()
 {
   const size_t timeIndex = mParameters.getTimeIndex();

   if (mParameters.getPressureSourceFlag() > timeIndex)
   {
     float* rhox = getRhoX().getData();
     float* rhoy = getRhoY().getData();
     float* rhoz = getRhoZ().getData();

     const float*  sourceInput = getPressureSourceInput().getData();
     const size_t* sourceIndex = getPressureSourceIndex().getData();

     const bool   isManyFlag  = (mParameters.getPressureSourceMany() != 0);
     const size_t sourceSize  = getPressureSourceIndex().size();
     const size_t index2D     = (isManyFlag) ? timeIndex * sourceSize : timeIndex;

     // replacement
     if (mParameters.getPressureSourceMode() == 0)
     {
       #pragma omp parallel for if (sourceSize > 16384)
       for (size_t i = 0; i < sourceSize; i++)
       {
         const size_t signalIndex = (isManyFlag) ? index2D + i : index2D;

         rhox[sourceIndex[i]] = sourceInput[signalIndex];
         rhoy[sourceIndex[i]] = sourceInput[signalIndex];
         rhoz[sourceIndex[i]] = sourceInput[signalIndex];
       }
     }
     // Addition
     else
     {
       #pragma omp parallel for if (sourceSize > 16384)
       for (size_t i = 0; i < sourceSize; i++)
       {
         const size_t signalIndex = (isManyFlag) ? index2D + i : index2D;

         rhox[sourceIndex[i]] += sourceInput[signalIndex];
         rhoy[sourceIndex[i]] += sourceInput[signalIndex];
         rhoz[sourceIndex[i]] += sourceInput[signalIndex];
       }
     }// type of replacement
   }// if do at all
 }// end of addPressureSource
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Calculate p0 source when necessary.
  *
  * <b>Matlab code:</b> \n
  *
  *\verbatim
     % add the initial pressure to rho as a mass source
     p = source.p0;
     rhox = source.p0 ./ (3 .* c.^2);
     rhoy = source.p0 ./ (3 .* c.^2);
     rhoz = source.p0 ./ (3 .* c.^2);

     % compute u(t = t1 + dt/2) based on the assumption u(dt/2) = -u(-dt/2)
     % which forces u(t = t1) = 0
     ux_sgx = dt .* rho0_sgx_inv .* real(ifftn( bsxfun(@times, ddx_k_shift_pos, kappa .* fftn(p)) )) / 2;
     uy_sgy = dt .* rho0_sgy_inv .* real(ifftn( bsxfun(@times, ddy_k_shift_pos, kappa .* fftn(p)) )) / 2;
     uz_sgz = dt .* rho0_sgz_inv .* real(ifftn( bsxfun(@times, ddz_k_shift_pos, kappa .* fftn(p)) )) / 2;
  \endverbatim
  */
 void KSpaceFirstOrder3DSolver::addInitialPressureSource()
 {
   getP().copyData(getInitialPressureSourceInput());

   const float* sourceInput = getInitialPressureSourceInput().getData();

   const bool   c0ScalarFlag = mParameters.getC0ScalarFlag();
   const float  c2Scalar     = (c0ScalarFlag) ? mParameters.getC2Scalar() : 0;
   const float* c2Matrix     = (c0ScalarFlag) ? nullptr : getC2().getData();

   float* rhoX = getRhoX().getData();
   float* rhoY = getRhoY().getData();
   float* rhoZ = getRhoZ().getData();

   const size_t nElements = mParameters.getFullDimensionSizes().nElements();

   #pragma omp parallel for simd schedule(static)
   for (size_t i = 0; i < nElements; i++)
   {
     const float tmp = sourceInput[i] / (3.0f * ((c0ScalarFlag) ? c2Scalar : c2Matrix[i]));
     rhoX[i] = tmp;
     rhoY[i] = tmp;
     rhoZ[i] = tmp;
   }

   //------------------------------------------------------------------------//
   //--  compute u(t = t1 + dt/2) based on the assumption u(dt/2) = -u(-dt/2) --//
   //--    which forces u(t = t1) = 0 --//
   //------------------------------------------------------------------------//
   computePressureGradient();

   if (mParameters.getRho0ScalarFlag())
   {
     if (mParameters.getNonUniformGridFlag())
     { // non uniform grid, homogeneous case
       computeInitialVelocityHomogeneousNonuniform();
     }
     else
     { //uniform grid, heterogeneous
       computeInitialVelocityHomogeneousUniform();
     }
   }
   else
   { // homogeneous, unifrom grid
     // divide the matrix by 2 and multiply with st./rho0_sg
     computeInitialVelocityHeterogeneous();
   }
 }// end of addInitialPressureSource
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Add transducer data source to velocity x component.
  */
 void KSpaceFirstOrder3DSolver::addTransducerSource()
 {
   float* uxSgx = getUxSgx().getData();

   const size_t* velocitySourceIndex   = getVelocitySourceIndex().getData();
   const float*  transducerSourceInput = getTransducerSourceInput().getData();
   const size_t* delayMask             = getDelayMask().getData();

   const size_t timeIndex  = mParameters.getTimeIndex();
   const size_t sourceSize = getVelocitySourceIndex().size();

   #pragma omp parallel for schedule(static) if (sourceSize > 16384)
   for (size_t i = 0; i < sourceSize; i++)
   {
     uxSgx[velocitySourceIndex[i]] += transducerSourceInput[delayMask[i] + timeIndex];
   }
 }// end of addTransducerSource
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Generate kappa matrix for lossless medium.
  */
 void KSpaceFirstOrder3DSolver::generateKappa()
 {
   const float dx2Rec = 1.0f / (mParameters.getDx() * mParameters.getDx());
   const float dy2Rec = 1.0f / (mParameters.getDy() * mParameters.getDy());
   const float dz2Rec = 1.0f / (mParameters.getDz() * mParameters.getDz());

   const float cRefDtPi = mParameters.getCRef() * mParameters.getDt() * static_cast<float>(M_PI);

   const float nxRec = 1.0f / static_cast<float>(mParameters.getFullDimensionSizes().nx);
   const float nyRec = 1.0f / static_cast<float>(mParameters.getFullDimensionSizes().ny);
   const float nzRec = 1.0f / static_cast<float>(mParameters.getFullDimensionSizes().nz);

   const DimensionSizes& reducedDimensionSizes = mParameters.getReducedDimensionSizes();

   float* kappa = getKappa().getData();

   #pragma omp parallel for schedule (static)
   for (size_t z = 0; z < reducedDimensionSizes.nz; z++)
   {
     const float zf    = static_cast<float>(z);
           float zPart = 0.5f - fabs(0.5f - zf * nzRec);
                 zPart = (zPart * zPart) * dz2Rec;

     for (size_t y = 0; y < reducedDimensionSizes.ny; y++)
     {
       const float yf    = static_cast<float>(y);
             float yPart = 0.5f - fabs(0.5f - yf * nyRec);
                   yPart = (yPart * yPart) * dy2Rec;

       const float yzPart = zPart + yPart;
       for (size_t x = 0; x < reducedDimensionSizes.nx; x++)
       {
         const float xf = static_cast<float>(x);
               float xPart = 0.5f - fabs(0.5f - xf * nxRec);
                     xPart = (xPart * xPart) * dx2Rec;

               float k = cRefDtPi * sqrt(xPart + yzPart);

         const size_t i = get1DIndex(z, y, x, reducedDimensionSizes);

         // kappa element
         kappa[i] = (k == 0.0f) ? 1.0f : sin(k) / k;
       }//x
     }//y
   }// z
 }// end of generateKappa
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Generate kappa, absorb_nabla1, absorb_nabla2 for absorbing medium.
  */
 void KSpaceFirstOrder3DSolver::generateKappaAndNablas()
 {
   const float dxSqRec    = 1.0f / (mParameters.getDx() * mParameters.getDx());
   const float dySqRec    = 1.0f / (mParameters.getDy() * mParameters.getDy());
   const float dzSqRec    = 1.0f / (mParameters.getDz() * mParameters.getDz());

   const float cRefDt2    = mParameters.getCRef() * mParameters.getDt() * 0.5f;
   const float pi2        = static_cast<float>(M_PI) * 2.0f;

   const size_t nx        = mParameters.getFullDimensionSizes().nx;
   const size_t ny        = mParameters.getFullDimensionSizes().ny;
   const size_t nz        = mParameters.getFullDimensionSizes().nz;

   const float nxRec      = 1.0f / static_cast<float>(nx);
   const float nyRec      = 1.0f / static_cast<float>(ny);
   const float nzRec      = 1.0f / static_cast<float>(nz);

   const DimensionSizes& reducedDimensionSizes = mParameters.getReducedDimensionSizes();

   float* kappa           = getKappa().getData();
   float* absorbNabla1    = getAbsorbNabla1().getData();
   float* absorbNabla2    = getAbsorbNabla2().getData();
   const float alphaPower = mParameters.getAlphaPower();

   #pragma omp parallel for schedule (static)
   for (size_t z = 0; z < reducedDimensionSizes.nz; z++)
   {
     const float zf    = static_cast<float>(z);
           float zPart = 0.5f - fabs(0.5f - zf * nzRec);
                 zPart = (zPart * zPart) * dzSqRec;

     for (size_t y = 0; y < reducedDimensionSizes.ny; y++)
     {
       const float yf    = static_cast<float>(y);
             float yPart = 0.5f - fabs(0.5f - yf * nyRec);
                   yPart = (yPart * yPart) * dySqRec;

       const float yzPart = zPart + yPart;

       for (size_t x = 0; x < reducedDimensionSizes.nx; x++)
       {
         const float xf    = static_cast<float>(x);
               float xPart = 0.5f - fabs(0.5f - xf * nxRec);
                     xPart = (xPart * xPart) * dxSqRec;

               float k     = pi2 * sqrt(xPart + yzPart);
               float cRefK = cRefDt2 * k;

         const size_t i = get1DIndex(z, y, x, reducedDimensionSizes);

         kappa[i]          = (cRefK == 0.0f) ? 1.0f : sin(cRefK) / cRefK;

         absorbNabla1[i] = pow(k, alphaPower - 2);
         absorbNabla2[i] = pow(k, alphaPower - 1);

         if (absorbNabla1[i] ==  std::numeric_limits<float>::infinity()) absorbNabla1[i] = 0.0f;
         if (absorbNabla2[i] ==  std::numeric_limits<float>::infinity()) absorbNabla2[i] = 0.0f;
       }//x
     }//y
   }// z

 }// end of generateKappaAndNablas
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Generate absorbTau and absorbEta in for heterogenous medium.
  */
 void KSpaceFirstOrder3DSolver::generateTauAndEta()
 {
   if ((mParameters.getAlphaCoeffScalarFlag()) && (mParameters.getC0ScalarFlag()))
   { // scalar values
     const float alphaPower       = mParameters.getAlphaPower();
     const float tanPi2AlphaPower = tan(static_cast<float> (M_PI_2) * alphaPower);
     const float alphaNeperCoeff  = (100.0f * pow(1.0e-6f / (2.0f * static_cast<float>(M_PI)), alphaPower)) /
                                    (20.0f * static_cast<float>(M_LOG10E));

     const float alphaCoeff2      = 2.0f * mParameters.getAlphaCoeffScalar() * alphaNeperCoeff;

     mParameters.setAbsorbTauScalar((-alphaCoeff2) * pow(mParameters.getC0Scalar(), alphaPower - 1));
     mParameters.setAbsorbEtaScalar(  alphaCoeff2  * pow(mParameters.getC0Scalar(), alphaPower) * tanPi2AlphaPower);
   }
   else
   { // matrix

     const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();

     float* absorbTau = getAbsorbTau().getData();
     float* absorbEta = getAbsorbEta().getData();

     const bool   alphaCoeffScalarFlag = mParameters.getAlphaCoeffScalarFlag();
     const float  alphaCoeffScalar     = (alphaCoeffScalarFlag) ? mParameters.getAlphaCoeffScalar() : 0;
     const float* alphaCoeffMatrix     = (alphaCoeffScalarFlag) ? nullptr : getTemp1Real3D().getData();


     const bool   c0ScalarFlag = mParameters.getC0ScalarFlag();
     const float  c0Scalar     = (c0ScalarFlag) ? mParameters.getC0Scalar() : 0;
     // here c2 still holds just c0!
     const float* cOMatrix     = (c0ScalarFlag) ? nullptr : getC2().getData();


     const float alphaPower       = mParameters.getAlphaPower();
     const float tanPi2AlphaPower = tan(static_cast<float>(M_PI_2) * alphaPower);

     //alpha = 100*alpha.*(1e-6/(2*pi)).^y./
     //                  (20*log10(exp(1)));
     const float alphaNeperCoeff = (100.0f * pow(1.0e-6f / (2.0f * static_cast<float>(M_PI)), alphaPower)) /
                                   (20.0f * static_cast<float>(M_LOG10E));


     #pragma omp parallel for schedule (static)
     for (size_t z = 0; z < dimensionSizes.nz; z++)
     {
       for (size_t y = 0; y < dimensionSizes.ny; y++)
       {
         for (size_t x = 0; x < dimensionSizes.nx; x++)
         {
           const size_t i = get1DIndex(z, y, x, dimensionSizes);

           const float alphaCoeff2 = 2.0f * alphaNeperCoeff *
                                     ((alphaCoeffScalarFlag) ? alphaCoeffScalar : alphaCoeffMatrix[i]);

           absorbTau[i] = (-alphaCoeff2) * pow(((c0ScalarFlag) ? c0Scalar : cOMatrix[i]), alphaPower - 1);
           absorbEta[i] =   alphaCoeff2  * pow(((c0ScalarFlag) ? c0Scalar : cOMatrix[i]),
                                                 alphaPower) * tanPi2AlphaPower;

         }//x
       }//y
     }// z
   } // matrix
 }// end of generateTauAndEta
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Prepare dt./ rho0  for non-uniform grid.
  */
 void KSpaceFirstOrder3DSolver::generateInitialDenisty()
 {
   float* dtRho0Sgx   = getDtRho0Sgx().getData();
   float* dtRho0Sgy   = getDtRho0Sgy().getData();
   float* dtRho0Sgz   = getDtRho0Sgz().getData();

   const float dt = mParameters.getDt();

   const float* duxdxnSgx = getDxudxnSgx().getData();
   const float* duydynSgy = getDyudynSgy().getData();
   const float* duzdznSgz = getDzudznSgz().getData();

   const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         dtRho0Sgx[i] = (dt * duxdxnSgx[x]) / dtRho0Sgx[i];
         dtRho0Sgy[i] = (dt * duydynSgy[y]) / dtRho0Sgy[i];
         dtRho0Sgz[i] = (dt * duzdznSgz[z]) / dtRho0Sgz[i];
       } // x
     } // y
   } // z

 }// end of generateInitialDenisty
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute c^2.
  */
 void KSpaceFirstOrder3DSolver::computeC2()
 {
   if (!mParameters.getC0ScalarFlag())
   {
     float* c2 =  getC2().getData();

     #pragma omp parallel for simd schedule(static) aligned(c2)
     for (size_t i=0; i < getC2().size(); i++)
     {
       c2[i] = c2[i] * c2[i];
     }
   }// matrix
 }// computeC2
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute acoustic velocity for initial pressure problem.
  */
 void KSpaceFirstOrder3DSolver::computeInitialVelocityHeterogeneous()
 {
   getTempFftwX().computeC2RFft3D(getUxSgx());
   getTempFftwY().computeC2RFft3D(getUySgy());
   getTempFftwZ().computeC2RFft3D(getUzSgz());

   const size_t nElements = mParameters.getFullDimensionSizes().nElements();
   const float  divider   = 1.0f / (2.0f * static_cast<float>(nElements));

   float* uxSgx = getUxSgx().getData();
   float* uySgy = getUySgy().getData();
   float* uzSgz = getUzSgz().getData();

   const float* dtRho0Sgx = getDtRho0Sgx().getData();
   const float* dtRho0Sgy = getDtRho0Sgy().getData();
   const float* dtRho0Sgz = getDtRho0Sgz().getData();


   #pragma omp parallel for simd schedule(static) \
           aligned(uxSgx, uySgy, uzSgz, dtRho0Sgx, dtRho0Sgy, dtRho0Sgz)
   for (size_t i = 0; i < nElements; i++)
   {
     uxSgx[i] *= dtRho0Sgx[i] * divider;
     uySgy[i] *= dtRho0Sgy[i] * divider;
     uzSgz[i] *= dtRho0Sgz[i] * divider;
   }
 }// end of computeInitialVelocityHeterogeneous
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute velocity for the initial pressure problem, homogeneous medium, uniform grid.
  */
 void KSpaceFirstOrder3DSolver::computeInitialVelocityHomogeneousUniform()
 {
   getTempFftwX().computeC2RFft3D(getUxSgx());
   getTempFftwY().computeC2RFft3D(getUySgy());
   getTempFftwZ().computeC2RFft3D(getUzSgz());

   const size_t nElements = mParameters.getFullDimensionSizes().nElements();
   const float dividerX = 1.0f / (2.0f * static_cast<float>(nElements)) * mParameters.getDtRho0SgxScalar();
   const float dividerY = 1.0f / (2.0f * static_cast<float>(nElements)) * mParameters.getDtRho0SgyScalar();
   const float dividerZ = 1.0f / (2.0f * static_cast<float>(nElements)) * mParameters.getDtRho0SgzScalar();

   float* uxSgx = getUxSgx().getData();
   float* uySgy = getUySgy().getData();
   float* uzSgz = getUzSgz().getData();

   #pragma omp parallel for simd schedule(static) aligned(uxSgx, uySgy, uzSgz)
   for (size_t i = 0; i < nElements; i++)
   {
     uxSgx[i] *= dividerX;
     uySgy[i] *= dividerY;
     uzSgz[i] *= dividerZ;
   }
 }// end of computeInitialVelocityHomogeneousUniform
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute acoustic velocity for initial pressure problem, homogenous medium, nonuniform grid.
  */
 void KSpaceFirstOrder3DSolver::computeInitialVelocityHomogeneousNonuniform()
 {
   getTempFftwX().computeC2RFft3D(getUxSgx());
   getTempFftwY().computeC2RFft3D(getUySgy());
   getTempFftwZ().computeC2RFft3D(getUzSgz());

   const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();
   const size_t nElements              = dimensionSizes.nElements();

   const float dividerX = 1.0f / (2.0f * static_cast<float>(nElements)) * mParameters.getDtRho0SgxScalar();
   const float dividerY = 1.0f / (2.0f * static_cast<float>(nElements)) * mParameters.getDtRho0SgyScalar();
   const float dividerZ = 1.0f / (2.0f * static_cast<float>(nElements)) * mParameters.getDtRho0SgzScalar();

   const float* dxudxnSgx = getDxudxnSgx().getData();
   const float* dyudynSgy = getDyudynSgy().getData();
   const float* dzudznSgz = getDzudznSgz().getData();

   float* uxSgx = getUxSgx().getData();
   float* uySgy = getUySgy().getData();
   float* uzSgz = getUzSgz().getData();


   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);
         uxSgx[i] *= dividerX * dxudxnSgx[x];
         uySgy[i] *= dividerY * dyudynSgy[y];
         uzSgz[i] *= dividerZ * dzudznSgz[z] ;
       } // x
     } // y
   } // z
 }// end of computeInitialVelocityHomogeneousNonuniform
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute acoustic velocity for heterogeneous medium and a uniform grid, x direction.
  */
 void KSpaceFirstOrder3DSolver::computeVelocityHeterogeneous()
 {
   const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();
   const size_t nElements   = dimensionSizes.nElements();
   const float  divider     = 1.0f / static_cast<float>(nElements);

   const float* ifftX = getTemp1Real3D().getData();
   const float* ifftY = getTemp2Real3D().getData();
   const float* ifftZ = getTemp3Real3D().getData();

   const float* dtRho0Sgx = getDtRho0Sgx().getData();
   const float* dtRho0Sgy = getDtRho0Sgy().getData();
   const float* dtRho0Sgz = getDtRho0Sgz().getData();

   const float* pmlX = getPmlXSgx().getData();
   const float* pmlY = getPmlYSgy().getData();
   const float* pmlZ = getPmlZSgz().getData();

   float* uxSgx = getUxSgx().getData();
   float* uySgy = getUySgy().getData();
   float* uzSgz = getUzSgz().getData();

   // long loops are replicated for every dimension to save SIMD registers
   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uxSgx[i] = (uxSgx[i] * pmlX[x] - divider * ifftX[i] * dtRho0Sgx[i]) * pmlX[x];
       } // x
     } // y
   } // z

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       const float ePmlY = pmlY[y];
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uySgy[i] = (uySgy[i] * ePmlY - divider * ifftY[i] * dtRho0Sgy[i]) * ePmlY;
       } // x
     } // y
   } // z

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     const float ePmlZ = pmlZ[z];
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uzSgz[i] = (uzSgz[i] * ePmlZ - divider * ifftZ[i] * dtRho0Sgz[i]) * ePmlZ;
       } // x
     } // y
   } // z
 }// end of computeVelocityHeterogeneous
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute acoustic velocity for homogeneous medium and a uniform grid.
  */
 void KSpaceFirstOrder3DSolver::computeVelocityHomogeneousUniform()
 {
   const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();
   const size_t nElements = dimensionSizes.nElements();

   const float dividerX = mParameters.getDtRho0SgxScalar() / static_cast<float>(nElements);
   const float dividerY = mParameters.getDtRho0SgyScalar() / static_cast<float>(nElements);
   const float dividerZ = mParameters.getDtRho0SgzScalar() / static_cast<float>(nElements);

   const float* ifftX = getTemp1Real3D().getData();
   const float* ifftY = getTemp2Real3D().getData();
   const float* ifftZ = getTemp3Real3D().getData();

   const float* pmlX = getPmlXSgx().getData();
   const float* pmlY = getPmlYSgy().getData();
   const float* pmlZ = getPmlZSgz().getData();

   float* uxSgx = getUxSgx().getData();
   float* uySgy = getUySgy().getData();
   float* uzSgz = getUzSgz().getData();

   // long loops are replicated for every dimension to save SIMD registers
   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uxSgx[i] = (uxSgx[i] * pmlX[x] - dividerX * ifftX[i]) * pmlX[x];
       } // x
     } // y
   } // z

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uySgy[i] = (uySgy[i] * pmlY[y] - dividerY * ifftY[i]) * pmlY[y];
       } // x
     } // y
   } // z

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uzSgz[i] = (uzSgz[i] * pmlZ[z] - dividerZ * ifftZ[i]) * pmlZ[z];
       } // x
     } // y
   } // z
 }// end of computeVelocityXHomogeneousUniform
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Compute acoustic velocity for homogenous medium and nonuniform grid, x direction.
  */
 void KSpaceFirstOrder3DSolver::computeVelocityHomogeneousNonuniform()
 {
   const DimensionSizes& dimensionSizes = mParameters.getFullDimensionSizes();
   const size_t nElements = dimensionSizes.nElements();

   const float dividerX = mParameters.getDtRho0SgxScalar() / static_cast<float>(nElements);
   const float dividerY = mParameters.getDtRho0SgyScalar() / static_cast<float>(nElements);
   const float dividerZ = mParameters.getDtRho0SgzScalar() / static_cast<float>(nElements);

   const float* ifftX = getTemp1Real3D().getData();
   const float* ifftY = getTemp2Real3D().getData();
   const float* ifftZ = getTemp3Real3D().getData();

   const float* dxudxnSgx = getDxudxnSgx().getData();
   const float* dyudynSgy = getDyudynSgy().getData();
   const float* dzudznSgz = getDzudznSgz().getData();

   const float* pmlX = getPmlXSgx().getData();
   const float* pmlY = getPmlYSgy().getData();
   const float* pmlZ = getPmlZSgz().getData();

   float* uxSgx = getUxSgx().getData();
   float* uySgy = getUySgy().getData();
   float* uzSgz = getUzSgz().getData();

   // long loops are replicated for every dimension to save SIMD registers
   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uxSgx[i] = (uxSgx[i] * pmlX[x] - (dividerX * dxudxnSgx[x] * ifftX[i])) * pmlX[x];
       } // x
     } // y
   } // z

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uySgy[i] = (uySgy[i] * pmlY[y] - (dividerY * dyudynSgy[y] * ifftY[i])) * pmlY[y];
       } // x
     } // y
   } // z

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < dimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < dimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < dimensionSizes.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, dimensionSizes);

         uzSgz[i] = (uzSgz[i] * pmlZ[z] - (dividerZ * dzudznSgz[z] * ifftZ[i])) * pmlZ[z];
       } // x
     } // y
   } // z
 }// end of computeVelocityHomogeneousNonuniform
 //----------------------------------------------------------------------------------------------------------------------

 /**
  *  Compute part of the new velocity term - gradient of pressure.
  * <b>Matlab code:</b> \n
  *
  *\verbatim
     bsxfun(\@times, ddx_k_shift_pos, kappa .* fftn(p))
   \endverbatim
  */
 void KSpaceFirstOrder3DSolver::computePressureGradient()
 {
   // Compute FFT of pressure
   getTempFftwX().computeR2CFft3D(getP());

   FloatComplex* ifftX = getTempFftwX().getComplexData();
   FloatComplex* ifftY = getTempFftwY().getComplexData();
   FloatComplex* ifftZ = getTempFftwZ().getComplexData();

   const FloatComplex* ddxKShiftPos = getDdxKShiftPos().getComplexData();
   const FloatComplex* ddyKShiftPos = getDdyKShiftPos().getComplexData();
   const FloatComplex* ddzKShiftPos = getDdzKShiftPos().getComplexData();

   const float* kappa  = getKappa().getData();

   const DimensionSizes& reducedDimensionSizes= mParameters.getReducedDimensionSizes();

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < reducedDimensionSizes.nz; z++)
   {
     for (size_t y = 0; y < reducedDimensionSizes.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < reducedDimensionSizes.nx;  x++)
       {
         const size_t i = get1DIndex(z, y, x, reducedDimensionSizes);

         const FloatComplex eKappa = ifftX[i] * kappa[i];

         ifftX[i] = eKappa * ddxKShiftPos[x];
         ifftY[i] = eKappa * ddyKShiftPos[y];
         ifftZ[i] = eKappa * ddzKShiftPos[z];
       } // x
     } // y
   } // z
 }// end of computePressureGradient
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Calculate three temporary sums in the new pressure formula non-linear absorbing case.
  */
 template<bool bOnAScalarFlag, bool rho0ScalarFlag>
 void KSpaceFirstOrder3DSolver::computePressureTermsNonlinear(RealMatrix& densitySum,
                                                              RealMatrix& nonlinearTerm,
                                                              RealMatrix& velocityGradientSum)
 {
   const float* rhoX = getRhoX().getData();
   const float* rhoY = getRhoY().getData();
   const float* rhoZ = getRhoZ().getData();

   const float* duxdx = getDuxdx().getData();
   const float* duydy = getDuydy().getData();
   const float* duzdz = getDuzdz().getData();

   const float  bOnAScalar     = (bOnAScalarFlag) ? mParameters.getBOnAScalar() : 0;
   const float* bOnAMatrix     = (bOnAScalarFlag) ? nullptr : getBOnA().getData();

   const float  rho0Scalar     = (rho0ScalarFlag) ? mParameters.getRho0Scalar() : 0;
   const float* rho0Matrix     = (rho0ScalarFlag) ? nullptr : getRho0().getData();


   float* eDensitySum          = densitySum.getData();
   float* eNonlinearTerm       = nonlinearTerm.getData();
   float* eVelocityGradientSum = velocityGradientSum.getData();

   const size_t nElements = mParameters.getFullDimensionSizes().nElements();

   #pragma omp parallel for simd schedule(static) \
           aligned(eDensitySum, eNonlinearTerm, eVelocityGradientSum, \
                   rhoX, rhoY, rhoZ, bOnAMatrix, rho0Matrix, duxdx, duydy, duzdz)
   for (size_t i = 0; i < nElements ; i++)
   {
     const float rhoSum = rhoX[i] + rhoY[i] + rhoZ[i];
     const float bOnA   = (bOnAScalarFlag) ? bOnAScalar : bOnAMatrix[i];
     const float rho0   = (rho0ScalarFlag) ? rho0Scalar : rho0Matrix[i];

     eDensitySum[i]          = rhoSum;
     eNonlinearTerm[i]       = (bOnA * rhoSum * rhoSum) / (2.0f * rho0) + rhoSum;
     eVelocityGradientSum[i] = rho0 * (duxdx[i] + duydy[i] + duzdz[i]);
   }
 } // end of computePressureTermsNonlinear
 //----------------------------------------------------------------------------------------------------------------------

  /**
   * Calculate two temporary sums in the new pressure formula, linear absorbing case.
   */
 void KSpaceFirstOrder3DSolver::computePressureTermsLinear(RealMatrix& densitySum,
                                                           RealMatrix& velocityGradientSum)
 {
   const size_t size = mParameters.getFullDimensionSizes().nElements();

   const float* rhoX = getRhoX().getData();
   const float* rhoY = getRhoY().getData();
   const float* rhoZ = getRhoZ().getData();

   const float* duxdx = getDuxdx().getData();
   const float* duydy = getDuydy().getData();
   const float* duzdz = getDuzdz().getData();

   float* pDensitySum          = densitySum.getData();
   float* pVelocityGradientSum = velocityGradientSum.getData();

   #pragma omp parallel for simd schedule(static) aligned (pDensitySum, rhoX, rhoY, rhoZ)
   for (size_t i = 0; i < size; i++)
   {
     pDensitySum[i] = rhoX[i] + rhoY[i] + rhoZ[i];
   }

   if (mParameters.getRho0ScalarFlag())
   { // scalar
     const float eRho0 = mParameters.getRho0Scalar();
     #pragma omp parallel for simd schedule(static) aligned (pDensitySum, duxdx, duydy, duzdz)
     for (size_t i = 0; i < size; i++)
     {
       pVelocityGradientSum[i] = eRho0 * (duxdx[i] + duydy[i] + duzdz[i]);
     }
   }
   else
   { // matrix
     const float* rho0 = getRho0().getData();
     #pragma omp parallel for simd schedule(static) aligned (pDensitySum, rho0, duxdx, duydy, duzdz)
     for (size_t i = 0; i < size; i++)
     {
       pVelocityGradientSum[i] = rho0[i] * (duxdx[i] + duydy[i] + duzdz[i]);
     }
   }
 }// end of computePressureTermsLinear
 //----------------------------------------------------------------------------------------------------------------------


  /**
   * Compute absorbing term with abosrbNabla1 and absorbNabla2.
   */
 void KSpaceFirstOrder3DSolver::computeAbsorbtionTerm(FftwComplexMatrix& fftPart1,
                                                      FftwComplexMatrix& fftPart2)
 {
   const size_t nElements    = mParameters.getReducedDimensionSizes().nElements();

   FloatComplex* pFftPart1 = fftPart1.getComplexData();
   FloatComplex* pFftPart2 = fftPart2.getComplexData();

   float* absorbNabla1 = getAbsorbNabla1().getData();
   float* absorbNabla2 = getAbsorbNabla2().getData();

   #pragma omp parallel for simd schedule(static) aligned(pFftPart1, pFftPart2, absorbNabla1, absorbNabla2)
   for (size_t i = 0; i < nElements; i++)
   {
     pFftPart1[i] *= absorbNabla1[i];
     pFftPart2[i] *= absorbNabla2[i];
   }
 } // end of computeAbsorbtionTerm
 //----------------------------------------------------------------------------------------------------------------------

  /**
   * @brief Sum sub-terms to calculate new pressure, after FFTs, non-linear case.
   */
 template<bool c0ScalarFlag, bool areTauAndEtaScalars>
 void KSpaceFirstOrder3DSolver::sumPressureTermsNonlinear(const RealMatrix& absorbTauTerm,
                                                          const RealMatrix& absorbEtaTerm,
                                                          const RealMatrix& nonlinearTerm)
 {
   const float* pAbsorbTauTerm = absorbTauTerm.getData();
   const float* pAbsorbEtaTerm = absorbEtaTerm.getData();

   const size_t nElements = mParameters.getFullDimensionSizes().nElements();
   const float  divider = 1.0f / static_cast<float>(nElements);

   const float  c2Scalar     = (c0ScalarFlag) ? mParameters.getC2Scalar() : 0;
   const float* c2Matrix     = (c0ScalarFlag) ? nullptr : getC2().getData();

   const float  absorbTauScalar = (areTauAndEtaScalars) ? mParameters.getAbsorbTauScalar() : 0;
   const float* absorbTauMatrix = (areTauAndEtaScalars) ? nullptr : getAbsorbTau().getData();

   const float  absorbEtaScalar = (areTauAndEtaScalars) ? mParameters.getAbsorbEtaScalar() : 0;
   const float* absorbEtaMatrix = (areTauAndEtaScalars) ? nullptr : getAbsorbEta().getData();;

   const float* bOnA = nonlinearTerm.getData();
   float*       p    = getP().getData();

   #pragma omp parallel for simd schedule(static) \
           aligned(p, c2Matrix, pAbsorbTauTerm, absorbTauMatrix, pAbsorbEtaTerm, absorbEtaMatrix)
   for (size_t i = 0; i < nElements; i++)
   {
     const float c2        = (c0ScalarFlag) ?        c2Scalar        : c2Matrix[i];
     const float absorbTau = (areTauAndEtaScalars) ? absorbTauScalar : absorbTauMatrix[i];
     const float absorbEta = (areTauAndEtaScalars) ? absorbEtaScalar : absorbEtaMatrix[i];

     p[i] = c2 *(bOnA[i] + (divider * ((pAbsorbTauTerm[i] * absorbTau) - (pAbsorbEtaTerm[i] * absorbEta))));
   }
 }// end of sumPressureTermsNonlinear
 //----------------------------------------------------------------------------------------------------------------------

  /**
   * Sum sub-terms to calculate new pressure, after FFTs, linear case.
   */
 template<bool c0ScalarFlag, bool areTauAndEtaScalars>
 void KSpaceFirstOrder3DSolver::sumPressureTermsLinear(const RealMatrix& absorbTauTerm,
                                                       const RealMatrix& absorbEtaTerm,
                                                       const RealMatrix& densitySum)
 {
   const float* pAbsorbTauTerm = absorbTauTerm.getData();
   const float* pAbsorbEtaTerm = absorbEtaTerm.getData();

   const size_t nElements = mParameters.getFullDimensionSizes().nElements();
   const float  divider = 1.0f / static_cast<float>(nElements);

   const float  c2Scalar     = (c0ScalarFlag) ? mParameters.getC2Scalar() : 0;
   const float* c2Matrix     = (c0ScalarFlag) ? nullptr : getC2().getData();

   const float  absorbTauScalar     = (areTauAndEtaScalars) ? mParameters.getAbsorbTauScalar() : 0;
   const float* absorbTauMatrix     = (areTauAndEtaScalars) ? nullptr : getAbsorbTau().getData();

   const float  absorbEtaScalar     = (areTauAndEtaScalars) ? mParameters.getAbsorbEtaScalar() : 0;
   const float* absorbEtaMatrix     = (areTauAndEtaScalars) ? nullptr : getAbsorbEta().getData();;

   const float* pDenistySum = densitySum.getData();
         float* p           = getP().getData();

   #pragma omp parallel for simd schedule(static) \
           aligned (p, pDenistySum, c2Matrix, absorbTauMatrix, absorbEtaMatrix, pAbsorbTauTerm, pAbsorbEtaTerm)
   for (size_t i = 0; i < nElements; i++)
   {
     const float c2        = (c0ScalarFlag) ?        c2Scalar        : c2Matrix[i];
     const float absorbTau = (areTauAndEtaScalars) ? absorbTauScalar : absorbTauMatrix[i];
     const float absorbEta = (areTauAndEtaScalars) ? absorbEtaScalar : absorbEtaMatrix[i];

     p[i] = c2 * (pDenistySum[i] + (divider * ((pAbsorbTauTerm[i] * absorbTau) - (pAbsorbEtaTerm[i] * absorbEta))));
   }
 }// end of sumPressureTermsLinear
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Sum sub-terms for new p, nonlinear lossless case.
  */
 template<bool c0ScalarFlag, bool nonlinearFlag, bool rho0ScalarFlag>
 void KSpaceFirstOrder3DSolver::sumPressureTermsNonlinearLossless()
 {
   const size_t nElements = mParameters.getFullDimensionSizes().nElements();

   float* p = getP().getData();

   const float* rhoX = getRhoX().getData();
   const float* rhoY = getRhoY().getData();
   const float* rhoZ = getRhoZ().getData();

   const float  c2Scalar     = (c0ScalarFlag) ? mParameters.getC2Scalar() : 0;
   const float* c2Matrix     = (c0ScalarFlag) ? nullptr : getC2().getData();

   const float  bOnAScalar    = (nonlinearFlag) ? mParameters.getBOnAScalar(): 0;
   const float* bOnAMatrix    = (nonlinearFlag) ? nullptr : getBOnA().getData();

   const float  rho0Scalar     = (rho0ScalarFlag) ? mParameters.getRho0Scalar() : 0;
   const float* rho0Matrix     = (rho0ScalarFlag) ? nullptr : getRho0().getData();

   #pragma omp parallel for simd schedule (static)
   for (size_t i = 0; i < nElements; i++)
   {
     const float c2   = (c0ScalarFlag)   ? c2Scalar   : c2Matrix[i];
     const float bOnA = (nonlinearFlag)  ? bOnAScalar : bOnAMatrix[i];
     const float rho0 = (rho0ScalarFlag) ? rho0Scalar : rho0Matrix[i];

     const float sumDensity = rhoX[i] + rhoY[i] + rhoZ[i];

     p[i] = c2 * (sumDensity + (bOnA * (sumDensity * sumDensity) / (2.0f * rho0)));
   }
 }// end of sumPressureTermsNonlinearLossless
 //----------------------------------------------------------------------------------------------------------------------

  /**
   * Sum sub-terms for new pressure, linear lossless case.
   */
  void KSpaceFirstOrder3DSolver::sumPressureTermsLinearLossless()
 {
   const float* rhoX = getRhoX().getData();
   const float* rhoY = getRhoY().getData();
   const float* rhoZ = getRhoZ().getData();
         float* p    = getP().getData();

   const size_t nElements = mParameters.getFullDimensionSizes().nElements();

   if (mParameters.getC0ScalarFlag())
   {
     const float c2 = mParameters.getC2Scalar();

     #pragma omp parallel for simd schedule(static) aligned(p, rhoX, rhoY, rhoZ)
     for (size_t i = 0; i < nElements; i++)
     {
       p[i] = c2 * (rhoX[i] + rhoY[i] + rhoZ[i]);
     }
   }
   else
   {
     const float* c2 = getC2().getData();

     #pragma omp parallel for simd schedule(static) aligned(p, c2, rhoX, rhoY, rhoZ)
     for (size_t i = 0; i < nElements; i++)
     {
       p[i] = c2[i] * (rhoX[i] + rhoY[i] + rhoZ[i]);
     }
   }

 }// end of sumPressureTermsLinearLossless()
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Calculated shifted velocities.
  *
  * <b>Matlab code:</b> \n
  *
  * \verbatim
     ux_shifted = real(ifft(bsxfun(\@times, x_shift_neg, fft(ux_sgx, [], 1)), [], 1));
     uy_shifted = real(ifft(bsxfun(\@times, y_shift_neg, fft(uy_sgy, [], 2)), [], 2));
     uz_shifted = real(ifft(bsxfun(\@times, z_shift_neg, fft(uz_sgz, [], 3)), [], 3));
   \endverbatim
  */

 void KSpaceFirstOrder3DSolver::computeShiftedVelocity()
 {
   const FloatComplex* xShiftNegR  = getXShiftNegR().getComplexData();
   const FloatComplex* yShiftNegR  = getYShiftNegR().getComplexData();
   const FloatComplex* zShiftNegR  = getZShiftNegR().getComplexData();

         FloatComplex* tempFftShift = getTempFftwShift().getComplexData();


   // sizes of frequency spaces
   DimensionSizes xShiftDims    = mParameters.getFullDimensionSizes();
                  xShiftDims.nx = xShiftDims.nx / 2 + 1;

   DimensionSizes yShiftDims    = mParameters.getFullDimensionSizes();
                  yShiftDims.ny = yShiftDims.ny / 2 + 1;

   DimensionSizes zShiftDims    = mParameters.getFullDimensionSizes();
                  zShiftDims.nz = zShiftDims.nz / 2 + 1;

   // normalization constants for FFTs
   const float dividerX = 1.0f / static_cast<float>(mParameters.getFullDimensionSizes().nx);
   const float dividerY = 1.0f / static_cast<float>(mParameters.getFullDimensionSizes().ny);
   const float dividerZ = 1.0f / static_cast<float>(mParameters.getFullDimensionSizes().nz);

   //-------------------------------------------------- ux_shifted ----------------------------------------------------//
   getTempFftwShift().computeR2CFft1DX(getUxSgx());

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < xShiftDims.nz; z++)
   {
     for (size_t y = 0; y < xShiftDims.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < xShiftDims.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, xShiftDims);

         tempFftShift[i] = tempFftShift[i] * xShiftNegR[x] * dividerX;
       } // x
     } // y
   }//z*/
   getTempFftwShift().computeC2RFft1DX(getUxShifted());


   //-------------------------------------------------- uy shifted ----------------------------------------------------//
   getTempFftwShift().computeR2CFft1DY(getUySgy());

   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < yShiftDims.nz; z++)
   {
     for (size_t y = 0; y < yShiftDims.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < yShiftDims.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, yShiftDims);

         tempFftShift[i] = (tempFftShift[i] * yShiftNegR[y]) * dividerY;
       } // x
     } // y
   }//z
   getTempFftwShift().computeC2RFft1DY(getUyShifted());


   //-------------------------------------------------- uz_shifted ----------------------------------------------------//
   getTempFftwShift().computeR2CFft1DZ(getUzSgz());
   #pragma omp parallel for schedule(static)
   for (size_t z = 0; z < zShiftDims.nz; z++)
   {
     for (size_t y = 0; y < zShiftDims.ny; y++)
     {
       #pragma omp simd
       for (size_t x = 0; x < zShiftDims.nx; x++)
       {
         const size_t i = get1DIndex(z, y, x, zShiftDims);

         tempFftShift[i] = (tempFftShift[i] * zShiftNegR[z]) * dividerZ;
       } // x
     } // y
   }//z
   getTempFftwShift().computeC2RFft1DZ(getUzShifted());
 }// end of computeShiftedVelocity
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Print progress statistics.
  */
 void KSpaceFirstOrder3DSolver::printStatistics()
 {
   const size_t nt =  mParameters.getNt();
   const size_t timeIndex = mParameters.getTimeIndex();


   if (timeIndex > (mActPercent * nt * 0.01f))
   {
     mActPercent += mParameters.getProgressPrintInterval();

     mIterationTime.stop();

     const double elTime = mIterationTime.getElapsedTime();
     const double elTimeWithLegs = mIterationTime.getElapsedTime() + mSimulationTime.getElapsedTimeOverPreviousLegs();
     const double toGo   = ((elTimeWithLegs / static_cast<double>((timeIndex + 1)) *  nt)) - elTimeWithLegs;

     struct tm *current;
     time_t now;
     time(&now);
     now += toGo;
     current = localtime(&now);

     Logger::log(Logger::LogLevel::kBasic,
                 kOutFmtSimulationProgress,
                 static_cast<size_t>(((timeIndex) / (nt * 0.01f))),'%',
                 elTime, toGo,
                 current->tm_mday, current->tm_mon+1, current->tm_year-100,
                 current->tm_hour, current->tm_min, current->tm_sec);
     Logger::flush(Logger::LogLevel::kBasic);
   }
 }// end of printStatistics
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Is time to checkpoint?
  */
 bool KSpaceFirstOrder3DSolver::isTimeToCheckpoint()
 {
   if (!mParameters.isCheckpointEnabled()) return false;

   mTotalTime.stop();

   return (mTotalTime.getElapsedTime() > static_cast<float>(mParameters.getCheckpointInterval()));

 }// end of isTimeToCheckpoint
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Was the loop interrupted to checkpoint?
  */
 bool KSpaceFirstOrder3DSolver::isCheckpointInterruption() const
 {
   return (mParameters.getTimeIndex() != mParameters.getNt());
 }// end of isCheckpointInterruption
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Check the output file has the correct format and version.
  */
 void KSpaceFirstOrder3DSolver::checkOutputFile()
 {
   // The header has already been read
   Hdf5FileHeader& fileHeader = mParameters.getFileHeader();
   Hdf5File&        outputFile = mParameters.getOutputFile();

   // test file type
   if (fileHeader.getFileType() != Hdf5FileHeader::FileType::kOutput)
   {
     throw ios::failure(Logger::formatMessage(kErrFmtBadOutputFileFormat, mParameters.getOutputFileName().c_str()));
   }

   // test file major version
   if (!fileHeader.checkMajorFileVersion())
   {
     throw ios::failure(Logger::formatMessage(kErrFmtBadMajorFileVersion,
                                              mParameters.getCheckpointFileName().c_str(),
                                              fileHeader.getFileMajorVersion().c_str()));
   }

   // test file minor version
   if (!fileHeader.checkMinorFileVersion())
   {
     throw ios::failure(Logger::formatMessage(kErrFmtBadMinorFileVersion,
                                              mParameters.getCheckpointFileName().c_str(),
                                              fileHeader.getFileMinorVersion().c_str()));
   }


   // Check dimension sizes
   DimensionSizes outputDimSizes;
   outputFile.readScalarValue(outputFile.getRootGroup(),
                              kNxName,
                              outputDimSizes.nx);

   outputFile.readScalarValue(outputFile.getRootGroup(), kNyName, outputDimSizes.ny);

   outputFile.readScalarValue(outputFile.getRootGroup(), kNzName, outputDimSizes.nz);

  if (mParameters.getFullDimensionSizes() != outputDimSizes)
  {
     throw ios::failure(Logger::formatMessage(kErrFmtOutputDimensionsMismatch,
                                              outputDimSizes.nx,
                                              outputDimSizes.ny,
                                              outputDimSizes.nz,
                                              mParameters.getFullDimensionSizes().nx,
                                              mParameters.getFullDimensionSizes().ny,
                                              mParameters.getFullDimensionSizes().nz));
  }
 }// end of checkOutputFile
 //----------------------------------------------------------------------------------------------------------------------


 /**
  * Check the file type and the version of the checkpoint file.
  */
 void KSpaceFirstOrder3DSolver::checkCheckpointFile()
 {
   // read the header and check the file version
   Hdf5FileHeader fileHeader;
   Hdf5File&      checkpointFile = mParameters.getCheckpointFile();

   fileHeader.readHeaderFromCheckpointFile(checkpointFile);

   // test file type
   if (fileHeader.getFileType() != Hdf5FileHeader::FileType::kCheckpoint)
   {
     throw ios::failure(Logger::formatMessage(kErrFmtBadCheckpointFileFormat,
                                              mParameters.getCheckpointFileName().c_str()));
   }

   // test file major version
   if (!fileHeader.checkMajorFileVersion())
   {
     throw ios::failure(Logger::formatMessage(kErrFmtBadMajorFileVersion,
                                              mParameters.getCheckpointFileName().c_str(),
                                              fileHeader.getFileMajorVersion().c_str()));
   }

   // test file minor version
   if (!fileHeader.checkMinorFileVersion())
   {
     throw ios::failure(Logger::formatMessage(kErrFmtBadMinorFileVersion,
                                              mParameters.getCheckpointFileName().c_str(),
                                              fileHeader.getFileMinorVersion().c_str()));
   }


   // Check dimension sizes
   DimensionSizes checkpointDimSizes;
   checkpointFile.readScalarValue(checkpointFile.getRootGroup(), kNxName, checkpointDimSizes.nx);
   checkpointFile.readScalarValue(checkpointFile.getRootGroup(), kNyName, checkpointDimSizes.ny);
   checkpointFile.readScalarValue(checkpointFile.getRootGroup(), kNzName, checkpointDimSizes.nz);

  if (mParameters.getFullDimensionSizes() != checkpointDimSizes)
  {
     throw ios::failure(Logger::formatMessage(kErrFmtCheckpointDimensionsMismatch,
                                              checkpointDimSizes.nx,
                                              checkpointDimSizes.ny,
                                              checkpointDimSizes.nz,
                                              mParameters.getFullDimensionSizes().nx,
                                              mParameters.getFullDimensionSizes().ny,
                                              mParameters.getFullDimensionSizes().nz));
  }
 }// end of checkCheckpointFile
 //----------------------------------------------------------------------------------------------------------------------

 /**
  * Restore cumulated elapsed time from the output file.
  */
 void KSpaceFirstOrder3DSolver::loadElapsedTimeFromOutputFile()
 {
   double totalTime, dataLoadTime, preProcessingTime, simulationTime, postProcessingTime;

   // Get execution times stored in the output file header
   mParameters.getFileHeader().getExecutionTimes(totalTime,
                                                 dataLoadTime,
                                                 preProcessingTime,
                                                 simulationTime,
                                                 postProcessingTime);

   mTotalTime.SetElapsedTimeOverPreviousLegs(totalTime);
   mDataLoadTime.SetElapsedTimeOverPreviousLegs(dataLoadTime);
   mPreProcessingTime.SetElapsedTimeOverPreviousLegs(preProcessingTime);
   mSimulationTime.SetElapsedTimeOverPreviousLegs(simulationTime);
   mPostProcessingTime.SetElapsedTimeOverPreviousLegs(postProcessingTime);

 }// end of loadElapsedTimeFromOutputFile
 //----------------------------------------------------------------------------------------------------------------------

 inline size_t KSpaceFirstOrder3DSolver::get1DIndex(const size_t          z,
                                                    const size_t          y,
                                                    const size_t          x,
                                                    const DimensionSizes& dimensionSizes)
 {
   return (z * dimensionSizes.ny + y) * dimensionSizes.nx + x;
 }// end of get1DIndex
 //----------------------------------------------------------------------------------------------------------------------

 //--------------------------------------------------------------------------------------------------------------------//
 //------------------------------------------------- Private methods --------------------------------------------------//
 //--------------------------------------------------------------------------------------------------------------------//

KSpaceFirstOrder3DSolver::getDdyKShiftNeg
ComplexMatrix & getDdyKShiftNeg()
Get negative Fourier shift in y.
Definition: KSpaceFirstOrder3DSolver.h:638

KSpaceFirstOrder3DSolver::getDelayMask
IndexMatrix & getDelayMask()
Get delay mask for many types sources.
Definition: KSpaceFirstOrder3DSolver.h:857

Parameters::saveScalarsToOutputFile
void saveScalarsToOutputFile()
Save scalar values into the output HDF5 file.
Definition: Parameters.cpp:391

KSpaceFirstOrder3DSolver::getVelocityZSourceInput
RealMatrix & getVelocityZSourceInput()
Get Velocity source input data in z direction.
Definition: KSpaceFirstOrder3DSolver.h:908

Parameters::getStoreVelocityFinalAllFlag
bool getStoreVelocityFinalAllFlag() const
Is –u_final set?
Definition: Parameters.h:580

kErrFmtBadMajorFileVersion
ErrorMessage kErrFmtBadMajorFileVersion
Command line parameters error message.
Definition: ErrorMessages.h:197

kUyFinalName
MatrixName kUyFinalName
uy_final variable name
Definition: MatrixNames.h:318

KSpaceFirstOrder3DSolver::getDdyKShiftPos
ComplexMatrix & getDdyKShiftPos()
Get positive Fourier shift in y.
Definition: KSpaceFirstOrder3DSolver.h:614

RealMatrix
The class for real matrices.
Definition: RealMatrix.h:47

Parameters::getDt
float getDt() const
Get time step size.
Definition: Parameters.h:222

KSpaceFirstOrder3DSolver::generateKappa
void generateKappa()
Generate kappa matrix for lossless media.
Definition: KSpaceFirstOrder3DSolver.cpp:1540

Hdf5File::create
void create(const std::string &fileName, unsigned int flags=H5F_ACC_TRUNC)
Create the HDF5 file.
Definition: Hdf5File.cpp:93

Parameters::getRho0Scalar
float getRho0Scalar() const
Get value of homogeneous medium density.
Definition: Parameters.h:271

KSpaceFirstOrder3DSolver::isCheckpointInterruption
bool isCheckpointInterruption() const
Was the loop interrupted to checkpoint?
Definition: KSpaceFirstOrder3DSolver.cpp:2565

KSpaceFirstOrder3DSolver::getDuydy
RealMatrix & getDuydy()
Get velocity gradient on in y direction.
Definition: KSpaceFirstOrder3DSolver.h:529

KSpaceFirstOrder3DSolver::sumPressureTermsLinear
void sumPressureTermsLinear(const RealMatrix &absorbTauTerm, const RealMatrix &absorbEtaTerm, const RealMatrix &densitySum)
Sum sub-terms to calculate new pressure, after FFTs, linear case.
Definition: KSpaceFirstOrder3DSolver.cpp:2308

IndexMatrix::recomputeIndicesToMatlab
void recomputeIndicesToMatlab()
Recompute indices C++ -> MATLAB.
Definition: IndexMatrix.cpp:182

Hdf5FileHeader::setMemoryConsumption
void setMemoryConsumption(const size_t totalMemory)
Set memory consumption.
Definition: Hdf5FileHeader.cpp:375

Hdf5File::writeScalarValue
void writeScalarValue(const hid_t parentGroup, MatrixName &datasetName, const T value)
Write the scalar value under a specified group.
Definition: Hdf5File.cpp:559

Parameters::getCheckpointFile
Hdf5File & getCheckpointFile()
Get checkpoint file handle.
Definition: Parameters.h:163

KSpaceFirstOrder3DSolver::getRhoX
RealMatrix & getRhoX()
Get density matrix in x direction.
Definition: KSpaceFirstOrder3DSolver.h:572

OutputStreamContainer::postProcessStreams
void postProcessStreams()
Post-process all streams and flush them to the file.
Definition: OutputStreamContainer.cpp:276

KSpaceFirstOrder3DSolver::computePressureTermsLinear
void computePressureTermsLinear(RealMatrix &densitySum, RealMatrix &velocityGradientSum)
Calculate two temporary sums in the new pressure formula before taking the FFT, linear absorbing case...
Definition: KSpaceFirstOrder3DSolver.cpp:2198

Parameters::getDx
float getDx() const
Get spatial displacement in x.
Definition: Parameters.h:227

KSpaceFirstOrder3DSolver::getAbsorbNabla2
RealMatrix & getAbsorbNabla2()
Get absorbing coefficient Nabla2.
Definition: KSpaceFirstOrder3DSolver.h:815

KSpaceFirstOrder3DSolver::addTransducerSource
void addTransducerSource()
Add transducer data source to velocity x component.
Definition: KSpaceFirstOrder3DSolver.cpp:1518

FftwComplexMatrix::createC2RFftPlan1DY
void createC2RFftPlan1DY(RealMatrix &outMatrix)
Create FFTW plan for Complex-to-Real in the y dimension.
Definition: FftwComplexMatrix.cpp:391

KSpaceFirstOrder3DSolver::getCumulatedSimulationTime
double getCumulatedSimulationTime() const
Get simulation time (time loop) accumulated over all legs.
Definition: KSpaceFirstOrder3DSolver.h:155

KSpaceFirstOrder3DSolver::getPmlX
RealMatrix & getPmlX()
Get PML in x.
Definition: KSpaceFirstOrder3DSolver.h:706

KSpaceFirstOrder3DSolver::getUzSgz
RealMatrix & getUzSgz()
Get velocity matrix on staggered grid in z direction.
Definition: KSpaceFirstOrder3DSolver.h:486

FftwComplexMatrix::createC2RFftPlan3D
void createC2RFftPlan3D(RealMatrix &outMatrix)
Create FFTW plan for 3D Complex-to-Real.
Definition: FftwComplexMatrix.cpp:120

Parameters::getCompressionLevel
size_t getCompressionLevel() const
Get compression level.
Definition: Parameters.h:127

Parameters::getVelocitySourceMode
size_t getVelocitySourceMode() const
Get velocity source mode.
Definition: Parameters.h:472

kOutFmtSSE3
OutputMessage kOutFmtSSE3
Print version output message.
Definition: OutputMessagesLinux.h:302

KSpaceFirstOrder3DSolver::getDtRho0Sgz
RealMatrix & getDtRho0Sgz()
Get dt * rho0Sgz matrix (time step size * ambient velocity on staggered grid in z direction)...
Definition: KSpaceFirstOrder3DSolver.h:563

FftwComplexMatrix
Class implementing 3D and 1D Real-To-Complex and Complex-To-Real transforms using FFTW interface...
Definition: FftwComplexMatrix.h:46

KSpaceFirstOrder3DSolver::saveCheckpointData
void saveCheckpointData()
Save checkpoint data and flush aggregated outputs into the output file.
Definition: KSpaceFirstOrder3DSolver.cpp:773

RealMatrix::writeData
virtual void writeData(Hdf5File &file, MatrixName &matrixName, const size_t compressionLevel)
Write data into HDF5 file.
Definition: RealMatrix.cpp:94

kOutFmtLoadingFftwWisdom
OutputMessage kOutFmtLoadingFftwWisdom
Output message.
Definition: OutputMessagesLinux.h:203

kOutFmtCreatingCheckpoint
OutputMessage kOutFmtCreatingCheckpoint
Output message.
Definition: OutputMessagesLinux.h:191

Hdf5File::getRootGroup
hid_t getRootGroup() const
Get handle to the root group of the file.
Definition: Hdf5File.h:608

IndexMatrix::writeData
virtual void writeData(Hdf5File &file, MatrixName &matrixName, const size_t compressionLevel)
Write data into HDF5 file.
Definition: IndexMatrix.cpp:94

DimensionSizes::nz
size_t nz
Number of elements in the z direction.
Definition: DimensionSizes.h:159

FftwComplexMatrix::computeC2RFft1DX
void computeC2RFft1DX(RealMatrix &outMatrix)
Compute 1D out-of-place Complex-to-Real FFT in the x dimension.
Definition: FftwComplexMatrix.cpp:644

Parameters::getC0ScalarFlag
bool getC0ScalarFlag() const
Is sound speed in the medium homogeneous (scalar value)?
Definition: Parameters.h:249

Parameters::getAlphaPower
float getAlphaPower() const
Get alpha power value for the absorption law.
Definition: Parameters.h:335

KSpaceFirstOrder3DSolver::getRho0
RealMatrix & getRho0()
Get ambient density matrix.
Definition: KSpaceFirstOrder3DSolver.h:596

KSpaceFirstOrder3DSolver::getAbsorbEta
RealMatrix & getAbsorbEta()
Get absorbing coefficient Eta.
Definition: KSpaceFirstOrder3DSolver.h:798

Parameters::getNt
size_t getNt() const
Get total number of time steps.
Definition: Parameters.h:203

kOutFmtReadingOutputFile
OutputMessage kOutFmtReadingOutputFile
Output message.
Definition: OutputMessagesLinux.h:215

kTimeIndexName
MatrixName kTimeIndexName
t_index name
Definition: MatrixNames.h:49

kOutFmtCompResourcesHeader
OutputMessage kOutFmtCompResourcesHeader
Output message.
Definition: OutputMessagesLinux.h:88

kUxFinalName
MatrixName kUxFinalName
ux_final variable name
Definition: MatrixNames.h:316

kOutFmtSimulatoinFinalSeparator
OutputMessage kOutFmtSimulatoinFinalSeparator
Output message.
Definition: OutputMessagesLinux.h:184

kErrFmtPathDelimiters
ErrorMessage kErrFmtPathDelimiters
delimiters for linux paths
Definition: ErrorMessages.h:53

kOutFmtFailed
OutputMessage kOutFmtFailed
Output message - failed message.
Definition: OutputMessagesLinux.h:64

Parameters::getRho0ScalarFlag
bool getRho0ScalarFlag() const
Is density in the medium homogeneous (scalar value)?
Definition: Parameters.h:266

KSpaceFirstOrder3DSolver::getDdzKShiftPos
ComplexMatrix & getDdzKShiftPos()
Get positive Fourier shift in z.
Definition: KSpaceFirstOrder3DSolver.h:622

Parameters::getAbsorbEtaScalar
float getAbsorbEtaScalar() const
Get absorb eta coefficient for homogeneous medium (scalar value)?
Definition: Parameters.h:340

Hdf5File::open
void open(const std::string &fileName, unsigned int flags=H5F_ACC_RDONLY)
Open the HDF5 file.
Definition: Hdf5File.cpp:117

Parameters::getFileHeader
Hdf5FileHeader & getFileHeader()
Get file header handle.
Definition: Parameters.h:168

KSpaceFirstOrder3DSolver::mTotalTime
TimeMeasure mTotalTime
Total time of the simulation.
Definition: KSpaceFirstOrder3DSolver.h:986

KSpaceFirstOrder3DSolver::getRhoZ
RealMatrix & getRhoZ()
Get density matrix in z direction.
Definition: KSpaceFirstOrder3DSolver.h:588

Parameters::getTransducerSourceFlag
size_t getTransducerSourceFlag() const
Get transducer source flag.
Definition: Parameters.h:419

Parameters::getCheckpointFileName
std::string getCheckpointFileName() const
Get checkpoint file name.
Definition: Parameters.h:184

KSpaceFirstOrder3DSolver::computeVelocityHomogeneousUniform
void computeVelocityHomogeneousUniform()
Compute acoustic velocity for homogeneous medium and a uniform grid.
Definition: KSpaceFirstOrder3DSolver.cpp:1959

Logger::log
static void log(const LogLevel queryLevel, const std::string &format, Args ... args)
Log desired activity for a given log level, version with string format.
Definition: Logger.h:97

KSpaceFirstOrder3DSolver::getUyShifted
RealMatrix & getUyShifted()
Get velocity shifted on normal grid in y direction.
Definition: KSpaceFirstOrder3DSolver.h:503

KSpaceFirstOrder3DSolver::mMatrixContainer
MatrixContainer mMatrixContainer
Matrix container with all the matrix classes.
Definition: KSpaceFirstOrder3DSolver.h:971

KSpaceFirstOrder3DSolver::mPostProcessingTime
TimeMeasure mPostProcessingTime
Post-processing time of the simulation.
Definition: KSpaceFirstOrder3DSolver.h:994

KSpaceFirstOrder3DSolver::getTransducerSourceInput
RealMatrix & getTransducerSourceInput()
Get transducer source input data (signal).
Definition: KSpaceFirstOrder3DSolver.h:867

kOutFmtElapsedTime
OutputMessage kOutFmtElapsedTime
Output message.
Definition: OutputMessagesLinux.h:117

kOutFmtPreProcessing
OutputMessage kOutFmtPreProcessing
Output message.
Definition: OutputMessagesLinux.h:165

Hdf5FileHeader::FileType::kOutput
Output file.

KSpaceFirstOrder3DSolver::generateKappaAndNablas
void generateKappaAndNablas()
Generate kappa matrix, absorbNabla1, absorbNabla2 for absorbing medium.
Definition: KSpaceFirstOrder3DSolver.cpp:1591

Logger::wordWrapString
static std::string wordWrapString(const std::string &inputString, const std::string &delimiters, const int indentation=0, const int lineSize=65)
Definition: Logger.cpp:111

KSpaceFirstOrder3DSolver::getAbsorbNabla1
RealMatrix & getAbsorbNabla1()
Get absorbing coefficient Nabla1.
Definition: KSpaceFirstOrder3DSolver.h:807

Parameters::getNonLinearFlag
size_t getNonLinearFlag() const
Is the wave propagation nonlinear?
Definition: Parameters.h:319

Parameters::getDtRho0SgzScalar
float getDtRho0SgzScalar() const
Get value of dt / rho0Sgz.
Definition: Parameters.h:301

KSpaceFirstOrder3DSolver::getCumulatedPreProcessingTime
double getCumulatedPreProcessingTime() const
Get pre-processing time accumulated over all legs.
Definition: KSpaceFirstOrder3DSolver.h:145

KSpaceFirstOrder3DSolver::mPreProcessingTime
TimeMeasure mPreProcessingTime
Pre-processing time of the simulation.
Definition: KSpaceFirstOrder3DSolver.h:988

KSpaceFirstOrder3DSolver::computeAbsorbtionTerm
void computeAbsorbtionTerm(FftwComplexMatrix &fftPart1, FftwComplexMatrix &fftPart2)
Compute absorbing term with abosrbNabla1 and absorbNabla2.
Definition: KSpaceFirstOrder3DSolver.cpp:2245

KSpaceFirstOrder3DSolver::loadInputData
virtual void loadInputData()
Load simulation data.
Definition: KSpaceFirstOrder3DSolver.cpp:132

Hdf5FileHeader::setMinorFileVersion
void setMinorFileVersion()
Set minor file version.
Definition: Hdf5FileHeader.h:252

kOutFmtDataLoading
OutputMessage kOutFmtDataLoading
Output message.
Definition: OutputMessagesLinux.h:168

FftwComplexMatrix::createC2RFftPlan1DX
void createC2RFftPlan1DX(RealMatrix &outMatrix)
Create FFTW plan for Complex-to-Real in the x dimension.
Definition: FftwComplexMatrix.cpp:328

KSpaceFirstOrder3DSolver::mIterationTime
TimeMeasure mIterationTime
Iteration time of the simulation.
Definition: KSpaceFirstOrder3DSolver.h:996

KSpaceFirstOrder3DSolver::getTemp2Real3D
RealMatrix & getTemp2Real3D()
Get second real 3D temporary matrix.
Definition: KSpaceFirstOrder3DSolver.h:927

MatrixContainer::loadDataFromCheckpointFile
void loadDataFromCheckpointFile()
Load selected matrices from the checkpoint HDF5 file.
Definition: MatrixContainer.cpp:452

Parameters
Class storing all parameters of the simulation.
Definition: Parameters.h:50

KSpaceFirstOrder3DSolver::computeInitialVelocityHeterogeneous
void computeInitialVelocityHeterogeneous()
Compute velocity for the initial pressure problem, heterogeneous medium, uniform grid.
Definition: KSpaceFirstOrder3DSolver.cpp:1781

KSpaceFirstOrder3DSolver::postProcessing
void postProcessing()
Post processing, and closing the output streams.
Definition: KSpaceFirstOrder3DSolver.cpp:678

KSpaceFirstOrder3DSolver::addInitialPressureSource
void addInitialPressureSource()
Calculate initial pressure source.
Definition: KSpaceFirstOrder3DSolver.cpp:1465

KSpaceFirstOrder3DSolver::getAbsorbTau
RealMatrix & getAbsorbTau()
Get absorbing coefficient Tau.
Definition: KSpaceFirstOrder3DSolver.h:790

kNzName
MatrixName kNzName
Nz variable name.
Definition: MatrixNames.h:74

KSpaceFirstOrder3DSolver::computePressureNonlinear
void computePressureNonlinear()
Compute acoustic pressure for nonlinear case.
Definition: KSpaceFirstOrder3DSolver.cpp:1146

Hdf5FileHeader::setHostName
void setHostName()
Set host name.
Definition: Hdf5FileHeader.cpp:349

KSpaceFirstOrder3DSolver::compute
virtual void compute()
This method computes k-space First Order 3D simulation.
Definition: KSpaceFirstOrder3DSolver.cpp:226

Parameters::getOutputFile
Hdf5File & getOutputFile()
Get output file handle.
Definition: Parameters.h:158

TimeMeasure::getElapsedTime
double getElapsedTime() const
Get elapsed time.
Definition: TimeMeasure.h:119

KSpaceFirstOrder3DSolver::getTemp3Real3D
RealMatrix & getTemp3Real3D()
Get third real 3D temporary matrix.
Definition: KSpaceFirstOrder3DSolver.h:935

Parameters::getFullDimensionSizes
DimensionSizes getFullDimensionSizes() const
Get full dimension sizes of the simulation (real classes).
Definition: Parameters.h:191

FftwComplexMatrix::computeC2RFft1DZ
void computeC2RFft1DZ(RealMatrix &outMatrix)
Compute 1D out-of-place Complex-to-Real FFT in the z dimension.
Definition: FftwComplexMatrix.cpp:708

kOutFmtSimulationEndSeparator
OutputMessage kOutFmtSimulationEndSeparator
Output message.
Definition: OutputMessagesLinux.h:181

KSpaceFirstOrder3DSolver::getSensorMaskIndex
IndexMatrix & getSensorMaskIndex()
Get linear sensor mask (spatial geometry of the sensor).
Definition: KSpaceFirstOrder3DSolver.h:825

KSpaceFirstOrder3DSolver::storeSensorData
void storeSensorData()
Store sensor data.
Definition: KSpaceFirstOrder3DSolver.cpp:719

FftwComplexMatrix::createR2CFftPlan1DY
void createR2CFftPlan1DY(RealMatrix &inMatrix)
Create an FFTW plan for 1D Real-to-Complex in the y dimension.
Definition: FftwComplexMatrix.cpp:203

KSpaceFirstOrder3DSolver::getCumulatedDataLoadTime
double getCumulatedDataLoadTime() const
Get simulation time (time loop) accumulated over all legs.
Definition: KSpaceFirstOrder3DSolver.h:150

KSpaceFirstOrder3DSolver::getCodeName
std::string getCodeName() const
Get code name - release code version.
Definition: KSpaceFirstOrder3DSolver.cpp:370

Hdf5FileHeader::writeHeaderToOutputFile
void writeHeaderToOutputFile(Hdf5File &outputFile)
Write header into the output file.
Definition: Hdf5FileHeader.cpp:225

KSpaceFirstOrder3DSolver::mActPercent
size_t mActPercent
Percentage of the simulation done.
Definition: KSpaceFirstOrder3DSolver.h:983

BaseIndexMatrix::getData
virtual size_t * getData()
Get raw data out of the class (for direct kernel access).
Definition: BaseIndexMatrix.h:86

FftwComplexMatrix::exportWisdom
static void exportWisdom()
Export wisdom to the file.
Definition: FftwComplexMatrix.cpp:740

KSpaceFirstOrder3DSolver::getBOnA
RealMatrix & getBOnA()
Get B on A (nonlinear coefficient).
Definition: KSpaceFirstOrder3DSolver.h:782

kOutFmtStoringFftwWisdom
OutputMessage kOutFmtStoringFftwWisdom
Output message.
Definition: OutputMessagesLinux.h:200

Hdf5File::canAccess
static bool canAccess(const std::string &fileName)
Can I access the file.
Definition: Hdf5File.cpp:146

Parameters::setAbsorbTauScalar
void setAbsorbTauScalar(const float absorbTau)
Set absorb tau coefficient for homogeneous medium (scalar value).
Definition: Parameters.h:355

Hdf5FileHeader::setMajorFileVersion
void setMajorFileVersion()
Set major file version.
Definition: Hdf5FileHeader.h:247

KSpaceFirstOrder3DSolver::getUzShifted
RealMatrix & getUzShifted()
Get velocity shifted on normal grid in z direction.
Definition: KSpaceFirstOrder3DSolver.h:511

Hdf5FileHeader::getFileMajorVersion
static std::string getFileMajorVersion()
Get string representing of current Major version of the file.
Definition: Hdf5FileHeader.h:233

Parameters::getCheckpointInterval
size_t getCheckpointInterval() const
Get checkpoint interval.
Definition: Parameters.h:145

TimeMeasure::SetElapsedTimeOverPreviousLegs
void SetElapsedTimeOverPreviousLegs(const double elapsedTime)
Set elapsed time in previous legs of the simulation.
Definition: TimeMeasure.h:149

Parameters::getDtRho0SgyScalar
float getDtRho0SgyScalar() const
Get value of dt / rho0Sgy.
Definition: Parameters.h:291

BaseFloatMatrix::size
virtual size_t size() const
Size of the matrix.
Definition: BaseFloatMatrix.h:70

Hdf5FileHeader::getFileMinorVersion
static std::string getFileMinorVersion()
Get string representing of current Minor version of the file.
Definition: Hdf5FileHeader.h:241

Parameters::getNumberOfThreads
size_t getNumberOfThreads() const
Get number of CPU threads to use.
Definition: Parameters.h:121

KSpaceFirstOrder3DSolver::getTempFftwZ
FftwComplexMatrix & getTempFftwZ()
Get temporary matrix for 1D fft in z.
Definition: KSpaceFirstOrder3DSolver.h:960

Hdf5FileHeader::setCodeName
void setCodeName(const std::string &codeName)
Set code name.
Definition: Hdf5FileHeader.h:221

TimeMeasure::getElapsedTimeOverPreviousLegs
double getElapsedTimeOverPreviousLegs() const
Get time spent in previous legs.
Definition: TimeMeasure.h:139

KSpaceFirstOrder3DSolver::computeVelocityHomogeneousNonuniform
void computeVelocityHomogeneousNonuniform()
Compute acoustic velocity for homogenous medium and nonuniform grid.
Definition: KSpaceFirstOrder3DSolver.cpp:2031

BaseIndexMatrix::size
virtual size_t size() const
Size of the matrix.
Definition: BaseIndexMatrix.h:72

KSpaceFirstOrder3DSolver::getDtRho0Sgx
RealMatrix & getDtRho0Sgx()
Get dt * rho0Sgx matrix (time step size * ambient velocity on staggered grid in x direction)...
Definition: KSpaceFirstOrder3DSolver.h:547

FftwComplexMatrix::computeC2RFft3D
void computeC2RFft3D(RealMatrix &outMatrix)
Compute forward out-of-place 3D Complex-to-Real FFT.
Definition: FftwComplexMatrix.cpp:532

Parameters::getPressureSourceFlag
size_t getPressureSourceFlag() const
Get pressure source flag.
Definition: Parameters.h:408

Parameters::getC2Scalar
float getC2Scalar() const
Get scalar value of sound speed squared.
Definition: Parameters.h:259

KSpaceFirstOrder3DSolver.h
The header file containing the main class of the project responsible for the entire simulation...

Hdf5FileHeader::getExecutionTimes
void getExecutionTimes(double &totalTime, double &loadTime, double &preProcessingTime, double &simulationTime, double &postprocessingTime)
Get execution times stored in the output file header.
Definition: Hdf5FileHeader.cpp:406

FloatComplex
std::complex< float > FloatComplex
Datatype for complex single precision numbers.
Definition: ComplexMatrix.h:43

Hdf5File::readScalarValue
void readScalarValue(const hid_t parentGroup, MatrixName &datasetName, T &value)
Read the scalar value under a specified group.
Definition: Hdf5File.cpp:646

OutputStreamContainer::reopenStreams
void reopenStreams()
Reopen streams after checkpoint file (datasets).
Definition: OutputStreamContainer.cpp:231

Logger::flush
static void flush(const LogLevel queryLevel)
Flush output messages.
Definition: Logger.cpp:97

KSpaceFirstOrder3DSolver::getC2
RealMatrix & getC2()
Get the c^2 matrix from the container.
Definition: KSpaceFirstOrder3DSolver.h:451

Hdf5FileHeader::readHeaderFromCheckpointFile
void readHeaderFromCheckpointFile(Hdf5File &checkpointFile)
Read the file header form the checkpoint file.
Definition: Hdf5FileHeader.cpp:192

OutputStreamContainer::addStreams
void addStreams(MatrixContainer &matrixContainer)
Add all streams in simulation in the container, set all streams records here!
Definition: OutputStreamContainer.cpp:73

Hdf5FileHeader::checkMinorFileVersion
bool checkMinorFileVersion()
Check minor file version.
Definition: Hdf5FileHeader.h:275

KSpaceFirstOrder3DSolver::freeMemory
virtual void freeMemory()
Memory deallocation.
Definition: KSpaceFirstOrder3DSolver.cpp:122

Hdf5FileHeader::FileType::kCheckpoint
Checkpoint file.

kOutFmtSSE2
OutputMessage kOutFmtSSE2
Print version output message.
Definition: OutputMessagesLinux.h:305

KSpaceFirstOrder3DSolver::computeDensityLinear
void computeDensityLinear()
Compute new values of acoustic density for linear case.
Definition: KSpaceFirstOrder3DSolver.cpp:1060

Parameters::getNonUniformGridFlag
size_t getNonUniformGridFlag() const
Enable non uniform grid? - not implemented yet.
Definition: Parameters.h:309

KSpaceFirstOrder3DSolver::getCumulatedTotalTime
double getCumulatedTotalTime() const
Get total simulation time accumulated over all legs.
Definition: KSpaceFirstOrder3DSolver.h:140

Logger::errorAndTerminate
static void errorAndTerminate(const std::string &errorMessage)
Log an error and terminate the execution.
Definition: Logger.cpp:84

MatrixContainer::freeMatrices
void freeMatrices()
Destroy and free all matrices.
Definition: MatrixContainer.cpp:419

kOutFmtIntelCompiler
OutputMessage kOutFmtIntelCompiler
Print version output message.
Definition: OutputMessagesLinux.h:283

kOutFmtBuildNoDataTime
OutputMessage kOutFmtBuildNoDataTime
Print version output message.
Definition: OutputMessagesLinux.h:258

Parameters::getStoreVelocityNonStaggeredRawFlag
bool getStoreVelocityNonStaggeredRawFlag() const
Is –u_non_staggered_raw set?
Definition: Parameters.h:547

OutputStreamContainer::freeStreams
void freeStreams()
Free all streams - destroy them.
Definition: OutputStreamContainer.cpp:306

KSpaceFirstOrder3DSolver::get1DIndex
size_t get1DIndex(const size_t z, const size_t y, const size_t x, const DimensionSizes &dimensionSizes)
Compute 1D index using 3 spatial coordinates and the size of the matrix.
Definition: KSpaceFirstOrder3DSolver.cpp:2704

KSpaceFirstOrder3DSolver::getUxSgx
RealMatrix & getUxSgx()
Get velocity matrix on staggered grid in x direction.
Definition: KSpaceFirstOrder3DSolver.h:470

KSpaceFirstOrder3DSolver::checkCheckpointFile
void checkCheckpointFile()
Check the file type and the version of the checkpoint file.
Definition: KSpaceFirstOrder3DSolver.cpp:2630

KSpaceFirstOrder3DSolver::getPmlYSgy
RealMatrix & getPmlYSgy()
Get PML on staggered grid y.
Definition: KSpaceFirstOrder3DSolver.h:689

kOutFmtStoringCheckpointData
OutputMessage kOutFmtStoringCheckpointData
Output message.
Definition: OutputMessagesLinux.h:197

KSpaceFirstOrder3DSolver::computeVelocitySourceTerm
void computeVelocitySourceTerm(RealMatrix &velocityMatrix, const RealMatrix &velocitySourceInput, const IndexMatrix &velocitySourceIndex)
Add in velocity source terms.
Definition: KSpaceFirstOrder3DSolver.cpp:1362

kErrFmtBadMinorFileVersion
ErrorMessage kErrFmtBadMinorFileVersion
Command line parameters error message.
Definition: ErrorMessages.h:200

KSpaceFirstOrder3DSolver::getPmlZSgz
RealMatrix & getPmlZSgz()
Get PML on staggered grid z.
Definition: KSpaceFirstOrder3DSolver.h:697

KSpaceFirstOrder3DSolver::getTempFftwX
FftwComplexMatrix & getTempFftwX()
Get temporary matrix for 1D fft in x.
Definition: KSpaceFirstOrder3DSolver.h:944

KSpaceFirstOrder3DSolver::computeVelocityGradient
void computeVelocityGradient()
Compute new values of acoustic velocity gradients.
Definition: KSpaceFirstOrder3DSolver.cpp:895

kOutFmtCheckpointHeader
OutputMessage kOutFmtCheckpointHeader
Output message.
Definition: OutputMessagesLinux.h:100

KSpaceFirstOrder3DSolver::getP
RealMatrix & getP()
Get pressure matrix.
Definition: KSpaceFirstOrder3DSolver.h:460

kUzFinalName
MatrixName kUzFinalName
uz_final variable name
Definition: MatrixNames.h:320

KSpaceFirstOrder3DSolver::getTempFftwY
FftwComplexMatrix & getTempFftwY()
Get temporary matrix for 1D fft in y.
Definition: KSpaceFirstOrder3DSolver.h:952

Parameters::getSamplingStartTimeIndex
size_t getSamplingStartTimeIndex() const
Get start time index when sensor data collection begins.
Definition: Parameters.h:499

FftwComplexMatrix::computeR2CFft3D
void computeR2CFft3D(RealMatrix &inMatrix)
Compute forward out-of-place 3D Real-to-Complex FFT.
Definition: FftwComplexMatrix.cpp:516

MatrixContainer::createMatrices
void createMatrices()
Create all matrix objects in the container.
Definition: MatrixContainer.cpp:76

Parameters::incrementTimeIndex
void incrementTimeIndex()
Increment simulation time step.
Definition: Parameters.h:215

Logger.h
The header file containing a class responsible for printing out info and error messages (stdout...

TimeMeasure::start
void start()
Take start timestamp.
Definition: TimeMeasure.h:91

Parameters::getVelocityXSourceFlag
size_t getVelocityXSourceFlag() const
Get velocity in x source flag.
Definition: Parameters.h:425

Hdf5File
Class wrapping the HDF5 routines.
Definition: Hdf5File.h:490

OutputStreamContainer::sampleStreams
void sampleStreams()
Sample all streams.
Definition: OutputStreamContainer.cpp:246

Parameters::getDz
float getDz() const
Get spatial displacement in z.
Definition: Parameters.h:237

KSpaceFirstOrder3DSolver::addVelocitySource
void addVelocitySource()
Add in all velocity sources.
Definition: KSpaceFirstOrder3DSolver.cpp:1338

KSpaceFirstOrder3DSolver::computeC2
void computeC2()
Calculate square of velocity.
Definition: KSpaceFirstOrder3DSolver.cpp:1763

KSpaceFirstOrder3DSolver::getDuxdx
RealMatrix & getDuxdx()
Get velocity gradient on in x direction.
Definition: KSpaceFirstOrder3DSolver.h:521

kOutFmtVersionGitHash
OutputMessage kOutFmtVersionGitHash
Print version output message.
Definition: OutputMessagesLinux.h:266

KSpaceFirstOrder3DSolver::getYShiftNegR
ComplexMatrix & getYShiftNegR()
Get negative shift for non-staggered velocity in y.
Definition: KSpaceFirstOrder3DSolver.h:663

Hdf5FileHeader::setActualCreationTime
void setActualCreationTime()
Set creation time.
Definition: Hdf5FileHeader.cpp:284

Logger::formatMessage
static std::string formatMessage(const std::string &format, Args ... args)
C++-11 replacement for sprintf that works with std::string instead of char*.
Definition: Logger.h:157

KSpaceFirstOrder3DSolver::mSimulationTime
TimeMeasure mSimulationTime
Simulation time of the simulation.
Definition: KSpaceFirstOrder3DSolver.h:992

OutputStreamContainer::createStreams
void createStreams()
Create all streams - opens the datasets.
Definition: OutputStreamContainer.cpp:216

Hdf5FileHeader
Class for HDF5 file header.
Definition: Hdf5FileHeader.h:89

Parameters::setTimeIndex
void setTimeIndex(const size_t timeIndex)
Set simulation time step - should be used only when recovering from checkpoint.
Definition: Parameters.h:213

Parameters::getDtRho0SgxScalar
float getDtRho0SgxScalar() const
Get value of dt / rho0Sgx.
Definition: Parameters.h:281

TimeMeasure::stop
void stop()
Take stop timestamp.
Definition: TimeMeasure.h:103

Parameters::getBOnAScalarFlag
bool getBOnAScalarFlag() const
Is nonlinear coefficient homogeneous in the medium (scalar value)?
Definition: Parameters.h:361

KSpaceFirstOrder3DSolver::computePressureLinear
void computePressureLinear()
Compute acoustic pressure for linear case.
Definition: KSpaceFirstOrder3DSolver.cpp:1287

KSpaceFirstOrder3DSolver::mOutputStreamContainer
OutputStreamContainer mOutputStreamContainer
Output stream container.
Definition: KSpaceFirstOrder3DSolver.h:978

BaseFloatMatrix::copyData
virtual void copyData(const BaseFloatMatrix &src)
Copy data from other matrix with the same size.
Definition: BaseFloatMatrix.cpp:70

Parameters::getBOnAScalar
float getBOnAScalar() const
Get nonlinear coefficient for homogenous medium.
Definition: Parameters.h:366

KSpaceFirstOrder3DSolver::getDdxKShiftNeg
ComplexMatrix & getDdxKShiftNeg()
Get negative Fourier shift in x.
Definition: KSpaceFirstOrder3DSolver.h:630

KSpaceFirstOrder3DSolver::getPmlZ
RealMatrix & getPmlZ()
Get PML in z.
Definition: KSpaceFirstOrder3DSolver.h:722

DimensionSizes
Structure with 4D dimension sizes (3 in space and 1 in time).
Definition: DimensionSizes.h:66

Parameters::getCRef
float getCRef() const
Get reference sound speed.
Definition: Parameters.h:244

Parameters::getDy
float getDy() const
Get spatial displacement in y.
Definition: Parameters.h:232

ComplexMatrix::getComplexData
virtual FloatComplex * getComplexData()
Get raw complex data out of the class (for direct kernel access).
Definition: ComplexMatrix.h:96

Parameters::getInitialPressureSourceFlag
size_t getInitialPressureSourceFlag() const
Get initial pressure source flag (p0).
Definition: Parameters.h:413

KSpaceFirstOrder3DSolver::~KSpaceFirstOrder3DSolver
virtual ~KSpaceFirstOrder3DSolver()
Destructor.
Definition: KSpaceFirstOrder3DSolver.cpp:92

Hdf5FileHeader::setExecutionTimes
void setExecutionTimes(const double totalTime, const double loadTime, const double preProcessingTime, const double simulationTime, const double postprocessingTime)
Set execution times in file header.
Definition: Hdf5FileHeader.cpp:389

KSpaceFirstOrder3DSolver::getDxudxn
RealMatrix & getDxudxn()
Non uniform grid acoustic velocity in x.
Definition: KSpaceFirstOrder3DSolver.h:732

kOutFmtKWaveVersion
OutputMessage kOutFmtKWaveVersion
Output message.
Definition: OutputMessagesLinux.h:158

Parameters::SensorMaskType::kCorners
Cuboid corners sensor mask.

Parameters::SensorMaskType::kIndex
Linear sensor mask.

FftwComplexMatrix::createC2RFftPlan1DZ
void createC2RFftPlan1DZ(RealMatrix &outMatrix)
Create FFTW plan for Complex-to-Real in the z dimension.
Definition: FftwComplexMatrix.cpp:454

Logger::LogLevel::kFull
Full level of verbosity.

Hdf5FileHeader::readHeaderFromOutputFile
void readHeaderFromOutputFile(Hdf5File &outputFile)
Read header from output file (necessary for checkpoint-restart).
Definition: Hdf5FileHeader.cpp:160

kOutFmtPostProcessing
OutputMessage kOutFmtPostProcessing
Output message.
Definition: OutputMessagesLinux.h:194

Parameters::getCopySensorMaskFlag
bool getCopySensorMaskFlag() const
Is –copy_mask set set?
Definition: Parameters.h:586

kOutFmtCheckpointTimeSteps
OutputMessage kOutFmtCheckpointTimeSteps
Output message.
Definition: OutputMessagesLinux.h:188

Hdf5FileHeader::writeHeaderToCheckpointFile
void writeHeaderToCheckpointFile(Hdf5File &checkpointFile)
Write header to the output file (only a subset of all possible fields are written).
Definition: Hdf5FileHeader.cpp:241

Parameters::getSensorMaskType
SensorMaskType getSensorMaskType() const
Get sensor mask type (linear or corners).
Definition: Parameters.h:484

KSpaceFirstOrder3DSolver::getSensorMaskCorners
IndexMatrix & getSensorMaskCorners()
Get cuboid corners sensor mask. (Spatial geometry of multiple sensors).
Definition: KSpaceFirstOrder3DSolver.h:833

Parameters::setAbsorbEtaScalar
void setAbsorbEtaScalar(const float absrobEta)
Set absorb eta coefficient for homogeneous medium (scalar value).
Definition: Parameters.h:345

Logger::getLevel
static LogLevel getLevel()
Definition: Logger.h:87

kOutFmtMacOsBuild
OutputMessage kOutFmtMacOsBuild
Print version output message.
Definition: OutputMessagesLinux.h:276

KSpaceFirstOrder3DSolver::mDataLoadTime
TimeMeasure mDataLoadTime
Data load time of the simulation.
Definition: KSpaceFirstOrder3DSolver.h:990

Hdf5FileHeader::getFileType
Hdf5FileHeader::FileType getFileType()
Get File type.
Definition: Hdf5FileHeader.cpp:322

KSpaceFirstOrder3DSolver::getKappa
RealMatrix & getKappa()
Get the kappa matrix from the container.
Definition: KSpaceFirstOrder3DSolver.h:442

kOutFmtFftPlans
OutputMessage kOutFmtFftPlans
Output message.
Definition: OutputMessagesLinux.h:162

DimensionSizes::ny
size_t ny
Number of elements in the y direction.
Definition: DimensionSizes.h:157

KSpaceFirstOrder3DSolver::checkOutputFile
void checkOutputFile()
Check the output file has the correct format and version.
Definition: KSpaceFirstOrder3DSolver.cpp:2574

kOutFmtSimulationProgress
OutputMessage kOutFmtSimulationProgress
Output message.
Definition: OutputMessagesLinux.h:178

KSpaceFirstOrder3DSolver::computeDensityNonliner
void computeDensityNonliner()
Compute new values of acoustic density for nonlinear case.
Definition: KSpaceFirstOrder3DSolver.cpp:981

KSpaceFirstOrder3DSolver::getDyudyn
RealMatrix & getDyudyn()
Non uniform grid acoustic velocity in y.
Definition: KSpaceFirstOrder3DSolver.h:740

Parameters::getC0Scalar
float getC0Scalar() const
Get scalar value of sound speed.
Definition: Parameters.h:254

KSpaceFirstOrder3DSolver::getDzudzn
RealMatrix & getDzudzn()
Non uniform grid acoustic velocity in z.
Definition: KSpaceFirstOrder3DSolver.h:748

Parameters::getTimeIndex
size_t getTimeIndex() const
Get actual simulation time step.
Definition: Parameters.h:208

KSpaceFirstOrder3DSolver::getVelocitySourceIndex
IndexMatrix & getVelocitySourceIndex()
Get velocity source geometry data.
Definition: KSpaceFirstOrder3DSolver.h:841

KSpaceFirstOrder3DSolver::computeInitialVelocityHomogeneousUniform
void computeInitialVelocityHomogeneousUniform()
Compute velocity for the initial pressure problem, homogeneous medium, uniform grid.
Definition: KSpaceFirstOrder3DSolver.cpp:1813

kOutFmtCurrentMemory
OutputMessage kOutFmtCurrentMemory
Output message.
Definition: OutputMessagesLinux.h:174

KSpaceFirstOrder3DSolver::getMemoryUsage
virtual size_t getMemoryUsage() const
Get memory usage in MB on the host side.
Definition: KSpaceFirstOrder3DSolver.cpp:340

kSensorMaskIndexName
MatrixName kSensorMaskIndexName
sensor_mask_index variable name
Definition: MatrixNames.h:165

Parameters::getStorePressureFinalAllFlag
bool getStorePressureFinalAllFlag() const
Is –p_final set?
Definition: Parameters.h:535

kOutFmtSimulationHeader
OutputMessage kOutFmtSimulationHeader
Output message.
Definition: OutputMessagesLinux.h:93

KSpaceFirstOrder3DSolver::getPressureSourceIndex
IndexMatrix & getPressureSourceIndex()
Get pressure source geometry data.
Definition: KSpaceFirstOrder3DSolver.h:849

Parameters::getProgressPrintInterval
size_t getProgressPrintInterval() const
Get progress print interval.
Definition: Parameters.h:133

Parameters::getInputFile
Hdf5File & getInputFile()
Get input file handle.
Definition: Parameters.h:153

kErrFmtBadCheckpointFileFormat
ErrorMessage kErrFmtBadCheckpointFileFormat
KSpaceFirstOrder3DSolver error message.
Definition: ErrorMessages.h:212

kOutFmtWindowsBuild
OutputMessage kOutFmtWindowsBuild
Print version output message.
Definition: OutputMessagesLinux.h:273

KSpaceFirstOrder3DSolver::getCumulatedPostProcessingTime
double getCumulatedPostProcessingTime() const
Get post-processing time accumulated over all legs.
Definition: KSpaceFirstOrder3DSolver.h:160

FftwComplexMatrix::computeR2CFft1DX
void computeR2CFft1DX(RealMatrix &inMatrix)
Compute 1D out-of-place Real-to-Complex FFT in the x dimension.
Definition: FftwComplexMatrix.cpp:548

kNxName
MatrixName kNxName
Nx variable name.
Definition: MatrixNames.h:70

DimensionSizes::nElements
size_t nElements() const
Get the number of elements, in 3D only spatial domain, in 4D with time.
Definition: DimensionSizes.h:86

KSpaceFirstOrder3DSolver::generateTauAndEta
void generateTauAndEta()
Generate absorbTau, absorbEta for heterogenous medium.
Definition: KSpaceFirstOrder3DSolver.cpp:1658

Hdf5File::close
void close()
Close the HDF5 file.
Definition: Hdf5File.cpp:161

kOutFmtVisualStudioCompiler
OutputMessage kOutFmtVisualStudioCompiler
Print version output message.
Definition: OutputMessagesLinux.h:286

Parameters::getAlphaCoeffScalarFlag
bool getAlphaCoeffScalarFlag() const
Is alpha absorption coefficient homogeneous (scalar value)?
Definition: Parameters.h:325

KSpaceFirstOrder3DSolver::allocateMemory
virtual void allocateMemory()
Memory allocation.
Definition: KSpaceFirstOrder3DSolver.cpp:102

Logger::LogLevel::kBasic
Basic (default) level of verbosity.

IndexMatrix::recomputeIndicesToCPP
void recomputeIndicesToCPP()
Recompute indices MATALAB->C++.
Definition: IndexMatrix.cpp:169

MatrixContainer::storeDataIntoCheckpointFile
void storeDataIntoCheckpointFile()
Store selected matrices into the checkpoint file.
Definition: MatrixContainer.cpp:469

KSpaceFirstOrder3DSolver::getInitialPressureSourceInput
RealMatrix & getInitialPressureSourceInput()
Get initial pressure source input data (whole matrix).
Definition: KSpaceFirstOrder3DSolver.h:883

KSpaceFirstOrder3DSolver::printFullCodeNameAndLicense
void printFullCodeNameAndLicense() const
Print the code name and license.
Definition: KSpaceFirstOrder3DSolver.cpp:380

KSpaceFirstOrder3DSolver::mParameters
Parameters & mParameters
Global parameters of the simulation.
Definition: KSpaceFirstOrder3DSolver.h:980

BaseFloatMatrix::getData
virtual float * getData()
Get raw data out of the class (for direct kernel access).
Definition: BaseFloatMatrix.h:96

kOutFmtAVX2
OutputMessage kOutFmtAVX2
Print version output message.
Definition: OutputMessagesLinux.h:290

KSpaceFirstOrder3DSolver::computePressureGradient
void computePressureGradient()
Compute part of the new velocity term - gradient of pressure.
Definition: KSpaceFirstOrder3DSolver.cpp:2112

kOutFmtCreatingOutputFile
OutputMessage kOutFmtCreatingOutputFile
Output message.
Definition: OutputMessagesLinux.h:218

kOutFmtLastSeparator
OutputMessage kOutFmtLastSeparator
Output message -last separator.
Definition: OutputMessagesLinux.h:51

KSpaceFirstOrder3DSolver::getPmlY
RealMatrix & getPmlY()
Get PML in y.
Definition: KSpaceFirstOrder3DSolver.h:714

FftwComplexMatrix::computeR2CFft1DZ
void computeR2CFft1DZ(RealMatrix &inMatrix)
Compute 1D out-of-place Real-to-Complex FFT in the z dimension.
Definition: FftwComplexMatrix.cpp:612

KSpaceFirstOrder3DSolver::computeVelocityHeterogeneous
void computeVelocityHeterogeneous()
Compute acoustic velocity for heterogeneous medium and a uniform grid.
Definition: KSpaceFirstOrder3DSolver.cpp:1884

FftwComplexMatrix::createR2CFftPlan1DX
void createR2CFftPlan1DX(RealMatrix &inMatrix)
Create an FFTW plan for 1D Real-to-Complex in the x dimension.
Definition: FftwComplexMatrix.cpp:139

kNyName
MatrixName kNyName
Ny variable name.
Definition: MatrixNames.h:72

KSpaceFirstOrder3DSolver::getDtRho0Sgy
RealMatrix & getDtRho0Sgy()
Get dt * rho0Sgy matrix (time step size * ambient velocity on staggered grid in y direction)...
Definition: KSpaceFirstOrder3DSolver.h:555

KSpaceFirstOrder3DSolver::GetVelocityYSourceInput
RealMatrix & GetVelocityYSourceInput()
Get Velocity source input data in y direction.
Definition: KSpaceFirstOrder3DSolver.h:900

KSpaceFirstOrder3DSolver::getDyudynSgy
RealMatrix & getDyudynSgy()
Non uniform grid acoustic velocity on staggered grid x.
Definition: KSpaceFirstOrder3DSolver.h:764

Parameters::getOutputFileName
std::string getOutputFileName() const
Get output file name.
Definition: Parameters.h:179

MatrixContainer.h
The header file containing the matrix container.

Parameters::getVelocityYSourceFlag
size_t getVelocityYSourceFlag() const
Get velocity in y source flag.
Definition: Parameters.h:431

kOutFmtSSE42
OutputMessage kOutFmtSSE42
Print version output message.
Definition: OutputMessagesLinux.h:296

kOutFmtReadingInputFile
OutputMessage kOutFmtReadingInputFile
Output message.
Definition: OutputMessagesLinux.h:209

kSensorMaskCornersName
MatrixName kSensorMaskCornersName
sensor_mask_corners variable name
Definition: MatrixNames.h:169

kOutFmtLinuxBuild
OutputMessage kOutFmtLinuxBuild
Print version output message.
Definition: OutputMessagesLinux.h:270

DimensionSizes::nx
size_t nx
Number of elements in the x direction.
Definition: DimensionSizes.h:151

Parameters::getAlphaCoeffScalar
float getAlphaCoeffScalar() const
Get value of alpha absorption coefficient.
Definition: Parameters.h:330

MatrixContainer::loadDataFromInputFile
void loadDataFromInputFile()
Load all marked matrices from the input HDF5 file.
Definition: MatrixContainer.cpp:435

Parameters::getPressureSourceMany
size_t getPressureSourceMany() const
Get number of time series in the pressure source.
Definition: Parameters.h:466

BaseFloatMatrix::scalarDividedBy
virtual void scalarDividedBy(const float scalar)
Calculate matrix = scalar / matrix.
Definition: BaseFloatMatrix.cpp:96

Parameters::getPressureSourceMode
size_t getPressureSourceMode() const
Get pressure source mode.
Definition: Parameters.h:461

kOutFmtReadingCheckpointFile
OutputMessage kOutFmtReadingCheckpointFile
Output message.
Definition: OutputMessagesLinux.h:212

KSpaceFirstOrder3DSolver::getDzudznSgz
RealMatrix & getDzudznSgz()
Non uniform grid acoustic velocity on staggered grid x.
Definition: KSpaceFirstOrder3DSolver.h:772

KSpaceFirstOrder3DSolver::sumPressureTermsLinearLossless
void sumPressureTermsLinearLossless()
Sum sub-terms for new pressure, linear lossless case.
Definition: KSpaceFirstOrder3DSolver.cpp:2383

Parameters::getVelocityZSourceFlag
size_t getVelocityZSourceFlag() const
Get velocity in z source flag.
Definition: Parameters.h:437

FftwComplexMatrix.h
The header file containing the class that implements 3D FFT using the FFTW interface.

KSpaceFirstOrder3DSolver::getPressureSourceInput
RealMatrix & getPressureSourceInput()
Get pressure source input data (signal).
Definition: KSpaceFirstOrder3DSolver.h:875

kOutFmtSeparator
OutputMessage kOutFmtSeparator
Output message - separator.
Definition: OutputMessagesLinux.h:48

Hdf5FileHeader::checkMajorFileVersion
bool checkMajorFileVersion()
Check major file version.
Definition: Hdf5FileHeader.h:267

KSpaceFirstOrder3DSolver::computeMainLoop
void computeMainLoop()
Compute the main time loop of the kspaceFirstOrder3D.
Definition: KSpaceFirstOrder3DSolver.cpp:610

OutputStreamContainer.h
The header file defining the output stream container.

KSpaceFirstOrder3DSolver::setProcessorAffinity
void setProcessorAffinity()
Set processor affinity.
Definition: KSpaceFirstOrder3DSolver.cpp:434

KSpaceFirstOrder3DSolver::getRhoY
RealMatrix & getRhoY()
Get density matrix in y direction.
Definition: KSpaceFirstOrder3DSolver.h:580

KSpaceFirstOrder3DSolver::computeVelocity
void computeVelocity()
Compute new values of acoustic velocity.
Definition: KSpaceFirstOrder3DSolver.cpp:864

Parameters::getVelocitySourceMany
size_t getVelocitySourceMany() const
Get number of time series in the velocity sources.
Definition: Parameters.h:477

Parameters::getInstance
static Parameters & getInstance()
Get instance of the singleton class.
Definition: Parameters.cpp:84

Parameters::getAbsorbingFlag
size_t getAbsorbingFlag() const
Is the simulation absrobing or lossless?
Definition: Parameters.h:314

KSpaceFirstOrder3DSolver::getUySgy
RealMatrix & getUySgy()
Get velocity matrix on staggered grid in y direction.
Definition: KSpaceFirstOrder3DSolver.h:478

FftwComplexMatrix::computeC2RFft1DY
void computeC2RFft1DY(RealMatrix &outMatrix)
Compute 1D out-of-place Complex-to-Real FFT in the y dimension.
Definition: FftwComplexMatrix.cpp:676

FftwComplexMatrix::importWisdom
static void importWisdom()
Import wisdom from the file.
Definition: FftwComplexMatrix.cpp:755

Parameters::getAbsorbTauScalar
float getAbsorbTauScalar() const
Get absorb tau coefficient for homogeneous medium.
Definition: Parameters.h:350

kOutFmtStoringSensorData
OutputMessage kOutFmtStoringSensorData
Output message.
Definition: OutputMessagesLinux.h:206

KSpaceFirstOrder3DSolver::loadElapsedTimeFromOutputFile
void loadElapsedTimeFromOutputFile()
Reads the header of the output file and sets the cumulative elapsed time from the first log...
Definition: KSpaceFirstOrder3DSolver.cpp:2684

KSpaceFirstOrder3DSolver::GetVelocityXSourceInput
RealMatrix & GetVelocityXSourceInput()
Get Velocity source input data in x direction.
Definition: KSpaceFirstOrder3DSolver.h:892

KSpaceFirstOrder3DSolver::getUxShifted
RealMatrix & getUxShifted()
Get velocity shifted on normal grid in x direction.
Definition: KSpaceFirstOrder3DSolver.h:495

FftwComplexMatrix::createR2CFftPlan3D
void createR2CFftPlan3D(RealMatrix &inMatrix)
Create FFTW plan for 3D Real-to-Complex.
Definition: FftwComplexMatrix.cpp:101

KSpaceFirstOrder3DSolver::getDdxKShiftPos
ComplexMatrix & getDdxKShiftPos()
Get positive Fourier shift in x.
Definition: KSpaceFirstOrder3DSolver.h:606

KSpaceFirstOrder3DSolver::getXShiftNegR
ComplexMatrix & getXShiftNegR()
Get negative shift for non-staggered velocity in x.
Definition: KSpaceFirstOrder3DSolver.h:655

kErrFmtOutputDimensionsMismatch
ErrorMessage kErrFmtOutputDimensionsMismatch
KSpaceFirstOrder3DSolver error message.
Definition: ErrorMessages.h:225

KSpaceFirstOrder3DSolver::addPressureSource
void addPressureSource()
Add in pressure source.
Definition: KSpaceFirstOrder3DSolver.cpp:1399

Hdf5FileHeader::setFileType
void setFileType(const Hdf5FileHeader::FileType fileType)
Set File type.
Definition: Hdf5FileHeader.cpp:340

KSpaceFirstOrder3DSolver::getPmlXSgx
RealMatrix & getPmlXSgx()
Get PML on staggered grid x.
Definition: KSpaceFirstOrder3DSolver.h:681

KSpaceFirstOrder3DSolver::printStatistics
void printStatistics()
Print progress statistics.
Definition: KSpaceFirstOrder3DSolver.cpp:2515

KSpaceFirstOrder3DSolver::getTemp1Real3D
RealMatrix & getTemp1Real3D()
Get first real 3D temporary matrix.
Definition: KSpaceFirstOrder3DSolver.h:919

kOutFmtMemoryAllocation
OutputMessage kOutFmtMemoryAllocation
Output message.
Definition: OutputMessagesLinux.h:171

OutputStreamContainer::closeStreams
void closeStreams()
Close all streams.
Definition: OutputStreamContainer.cpp:291

kErrFmtCheckpointDimensionsMismatch
ErrorMessage kErrFmtCheckpointDimensionsMismatch
KSpaceFirstOrder3DSolver error message.
Definition: ErrorMessages.h:220

OutputStreamContainer::checkpointStreams
void checkpointStreams()
Checkpoint streams.
Definition: OutputStreamContainer.cpp:261

IndexMatrix
The class for 64b unsigned integers (indices). It is used for linear and cuboid corners masks to get ...
Definition: IndexMatrix.h:47

KSpaceFirstOrder3DSolver::computePressureTermsNonlinear
void computePressureTermsNonlinear(RealMatrix &densitySum, RealMatrix &nonlinearTerm, RealMatrix &velocityGradientSum)
Calculate three temporary sums in the new pressure formula before taking the FFT, nonlinear absorbing...
Definition: KSpaceFirstOrder3DSolver.cpp:2154

kErrFmtBadOutputFileFormat
ErrorMessage kErrFmtBadOutputFileFormat
KSpaceFirstOrder3DSolver error message.
Definition: ErrorMessages.h:216

KSpaceFirstOrder3DSolver::computeInitialVelocityHomogeneousNonuniform
void computeInitialVelocityHomogeneousNonuniform()
Compute acoustic velocity for initial pressure problem, homogenous medium, nonuniform grid...
Definition: KSpaceFirstOrder3DSolver.cpp:1841

KSpaceFirstOrder3DSolver::sumPressureTermsNonlinear
void sumPressureTermsNonlinear(const RealMatrix &absorbTauTerm, const RealMatrix &absorbEtaTerm, const RealMatrix &nonlinearTerm)
Sum sub-terms to calculate new pressure, after FFTs, nonlinear case.
Definition: KSpaceFirstOrder3DSolver.cpp:2269

Parameters::getGitHash
std::string getGitHash() const
Get git hash of the code.
Definition: Parameters.cpp:471

KSpaceFirstOrder3DSolver::getDxudxnSgx
RealMatrix & getDxudxnSgx()
Non uniform grid acoustic velocity on staggered grid x.
Definition: KSpaceFirstOrder3DSolver.h:756

kOutFmtSSE41
OutputMessage kOutFmtSSE41
Print version output message.
Definition: OutputMessagesLinux.h:299

FftwComplexMatrix::createR2CFftPlan1DZ
void createR2CFftPlan1DZ(RealMatrix &inMatrix)
Create an FFTW plan for 1D Real-to-Complex in the z dimension.
Definition: FftwComplexMatrix.cpp:266

KSpaceFirstOrder3DSolver::sumPressureTermsNonlinearLossless
void sumPressureTermsNonlinearLossless()
Sum sub-terms for new pressure, linear lossless case.
Definition: KSpaceFirstOrder3DSolver.cpp:2347

KSpaceFirstOrder3DSolver::getTempFftwShift
FftwComplexMatrix & getTempFftwShift()
Get temporary matrix for fft shift.
Definition: KSpaceFirstOrder3DSolver.h:968

KSpaceFirstOrder3DSolver::writeOutputDataInfo
void writeOutputDataInfo()
Write statistics and header into the output file.
Definition: KSpaceFirstOrder3DSolver.cpp:736

Parameters::isCheckpointEnabled
bool isCheckpointEnabled() const
Is checkpoint enabled?
Definition: Parameters.h:140

KSpaceFirstOrder3DSolver::KSpaceFirstOrder3DSolver
KSpaceFirstOrder3DSolver()
Constructor.
Definition: KSpaceFirstOrder3DSolver.cpp:74

kOutFmtGnuCompiler
OutputMessage kOutFmtGnuCompiler
Print version output message.
Definition: OutputMessagesLinux.h:280

KSpaceFirstOrder3DSolver::getDuzdz
RealMatrix & getDuzdz()
Get velocity gradient on in z direction.
Definition: KSpaceFirstOrder3DSolver.h:537

KSpaceFirstOrder3DSolver::InitializeFftwPlans
void InitializeFftwPlans()
Initialize FFTW plans.
Definition: KSpaceFirstOrder3DSolver.cpp:463

Hdf5File::isOpen
bool isOpen() const
Is the file opened?
Definition: Hdf5File.h:560

KSpaceFirstOrder3DSolver::preProcessing
void preProcessing()
Compute pre-processing phase.
Definition: KSpaceFirstOrder3DSolver.cpp:537

kOutFmtLicense
OutputMessage kOutFmtLicense
Print version output message.
Definition: OutputMessagesLinux.h:309

kOutFmtNoDone
OutputMessage kOutFmtNoDone
Output message - finish line without done.
Definition: OutputMessagesLinux.h:61

MatrixContainer::addMatrices
void addMatrices()
Populate the container based on the simulation type.
Definition: MatrixContainer.cpp:128

kOutFmtDone
OutputMessage kOutFmtDone
Output message - Done with two spaces.
Definition: OutputMessagesLinux.h:58

KSpaceFirstOrder3DSolver::getZShiftNegR
ComplexMatrix & getZShiftNegR()
Get negative shift for non-staggered velocity in z.
Definition: KSpaceFirstOrder3DSolver.h:671

kPressureFinalName
MatrixName kPressureFinalName
p_final variable name
Definition: MatrixNames.h:280

FftwComplexMatrix::computeR2CFft1DY
void computeR2CFft1DY(RealMatrix &inMatrix)
Compute 1D out-of-place Real-to-Complex FFT in the y dimension.
Definition: FftwComplexMatrix.cpp:580

Hdf5FileHeader::setNumberOfCores
void setNumberOfCores()
Set number of cores.
Definition: Hdf5FileHeader.cpp:424

kOutFmtAVX
OutputMessage kOutFmtAVX
Print version output message.
Definition: OutputMessagesLinux.h:293

KSpaceFirstOrder3DSolver::generateInitialDenisty
void generateInitialDenisty()
Calculate dt ./ rho0 for nonuniform grids.
Definition: KSpaceFirstOrder3DSolver.cpp:1726

KSpaceFirstOrder3DSolver::getDdzKShiftNeg
ComplexMatrix & getDdzKShiftNeg()
Get negative Fourier shift in z.
Definition: KSpaceFirstOrder3DSolver.h:646

Parameters::getReducedDimensionSizes
DimensionSizes getReducedDimensionSizes() const
Get reduced dimension sizes of the simulation (complex classes).
Definition: Parameters.h:197

KSpaceFirstOrder3DSolver::computeShiftedVelocity
void computeShiftedVelocity()
compute shifted velocity for –u_non_staggered flag.
Definition: KSpaceFirstOrder3DSolver.cpp:2428

KSpaceFirstOrder3DSolver::isTimeToCheckpoint
bool isTimeToCheckpoint()
Is time to checkpoint (save actual state on disk).
Definition: KSpaceFirstOrder3DSolver.cpp:2551