Added CUDA device syncs to force proper timing
This commit is contained in:
parent
894829cb05
commit
0f0454ec29
@ -74,6 +74,7 @@ void KOKKOSStream<T>::copy()
|
|||||||
{
|
{
|
||||||
c[index] = a[index];
|
c[index] = a[index];
|
||||||
});
|
});
|
||||||
|
cudaDeviceSynchronize();
|
||||||
}
|
}
|
||||||
|
|
||||||
template <class T>
|
template <class T>
|
||||||
@ -88,6 +89,7 @@ void KOKKOSStream<T>::mul()
|
|||||||
{
|
{
|
||||||
b[index] = scalar*c[index];
|
b[index] = scalar*c[index];
|
||||||
});
|
});
|
||||||
|
cudaDeviceSynchronize();
|
||||||
}
|
}
|
||||||
|
|
||||||
template <class T>
|
template <class T>
|
||||||
@ -101,6 +103,8 @@ void KOKKOSStream<T>::add()
|
|||||||
{
|
{
|
||||||
c[index] = a[index] + b[index];
|
c[index] = a[index] + b[index];
|
||||||
});
|
});
|
||||||
|
|
||||||
|
cudaDeviceSynchronize();
|
||||||
}
|
}
|
||||||
|
|
||||||
template <class T>
|
template <class T>
|
||||||
@ -115,6 +119,8 @@ void KOKKOSStream<T>::triad()
|
|||||||
{
|
{
|
||||||
a[index] = b[index] + scalar*c[index];
|
a[index] = b[index] + scalar*c[index];
|
||||||
});
|
});
|
||||||
|
|
||||||
|
cudaDeviceSynchronize();
|
||||||
}
|
}
|
||||||
|
|
||||||
void listDevices(void)
|
void listDevices(void)
|
||||||
|
|||||||
Loading…
Reference in New Issue
Block a user