Cuda Default Stream Per Thread