Adaptations to core changes

d30c27b1 · Olivier BICHLER · 594e9898 · d30c27b1 · d30c27b1 · d30c27b1
Commit d30c27b1 authored 1 year ago by Olivier BICHLER
--- a/include/aidge/backend/cuda/data/TensorImpl.hpp
+++ b/include/aidge/backend/cuda/data/TensorImpl.hpp
@@ -76,14 +76,16 @@ public:
    // native interface
    const future_std::span<T>& data() const { return mData; }
+    std::size_t size() const override { return mData.size(); }
    std::size_t scalarSize() const override { return sizeof(T); }
    void setDevice(int device) override {
        mDevice = device;
    }
-    void copy(const void *src, NbElts_t length) override {
+    void copy(const void *src, NbElts_t length, NbElts_t offset = 0) override {
-        CHECK_CUDA_STATUS(cudaMemcpy(rawPtr(), src, length * sizeof(T), cudaMemcpyDeviceToDevice));
+        void* dst = static_cast<void*>(static_cast<T*>(rawPtr()) + offset);
+        CHECK_CUDA_STATUS(cudaMemcpy(dst, src, length * sizeof(T), cudaMemcpyDeviceToDevice));
    }
    void copyCast(const void *src, NbElts_t length, const DataType srcDt) override {
@@ -177,10 +179,6 @@ public:
        return mData.data();
    };
-    void* getRaw(std::size_t idx) {
-        return static_cast<void*>(static_cast<T*>(rawPtr()) + idx);
-    }
    const cudnnTensorDescriptor_t& getCudnnTensorDesc() const override {
        if (mCudnnTensor == nullptr) {
            CHECK_CUDNN_STATUS(cudnnCreateTensorDescriptor(&mCudnnTensor));
@@ -214,10 +212,10 @@ public:
        return mCudnnTensor;
    }
-    virtual ~TensorImpl_cuda() {
+    void* getRawPtr(NbElts_t idx) override final {
-        if (mCudnnTensor != nullptr)
+        AIDGE_ASSERT(idx < mData.size(), "idx out of range");
-            cudnnDestroyTensorDescriptor(mCudnnTensor);
+        return static_cast<void*>(static_cast<T*>(rawPtr()) + idx);
-    }
+    };
    void setRawPtr(void *ptr, NbElts_t length) override final {
        AIDGE_ASSERT(length >= mTensor.size(), "trying to set raw pointer of insufficient capacity");
@@ -225,6 +223,11 @@ public:
        mDataOwner.reset();
    };
+    virtual ~TensorImpl_cuda() {
+        if (mCudnnTensor != nullptr)
+            cudnnDestroyTensorDescriptor(mCudnnTensor);
+    }
 private:
    void lazyInit() {
        if (mData.size() < mTensor.size()) {

--- a/include/aidge/backend/cuda/utils/CudaUtils.hpp
+++ b/include/aidge/backend/cuda/utils/CudaUtils.hpp
@@ -67,24 +67,6 @@ namespace Cuda {
    // Enable Peer-to-Peer communications between devices
    // when it is possible
    void setMultiDevicePeerAccess(unsigned int size, unsigned int* devices);
-    // CuDNN scaling parameters are typically "alpha" and "beta".
-    // Their type must be "float" for HALF and FLOAT (default template)
-    // and "double" for DOUBLE (specialized template)
-    template <class T>
-    struct cudnn_scaling_type {
-        typedef float type;
-    };
-    template <>
-    struct cudnn_scaling_type<double> {
-        typedef double type;
-    };
-    template <class T>
-    struct cuda_type {
-        typedef T type;
-    };
 }
 }

--- a/src/operator/ConvImpl.cpp
+++ b/src/operator/ConvImpl.cpp
@@ -120,8 +120,8 @@ void Aidge::ConvImpl_cuda<DIM>::forward() {
 template <Aidge::DimIdx_t DIM>
 template <class T>
 void Aidge::ConvImpl_cuda<DIM>::forward_(const Tensor& input0, const Tensor& input1, const Tensor& input2) {
-    const typename Cuda::cudnn_scaling_type<T>::type alpha = 1.0f;
+    const T alpha = 1.0f;
-    typename Cuda::cudnn_scaling_type<T>::type beta = 0.0f;
+    const T beta = 0.0f;
    CHECK_CUDNN_STATUS(
        cudnnConvolutionForward(CudaContext::cudnnHandle(),