當(dāng)前位置：首頁 > 人文社科 > 生活经验 >内容正文

生活经验

DLPack构建跨框架的深度学习编译器

發(fā)布時(shí)間：2023/11/28 生活经验 28 豆豆

生活随笔收集整理的這篇文章主要介紹了 DLPack构建跨框架的深度学习编译器小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

DLPack構(gòu)建跨框架的深度學(xué)習(xí)編譯器
Tensorflow，PyTorch和ApacheMxNet等深度學(xué)習(xí)框架提供了一個(gè)功能強(qiáng)大的工具包，可用于快速進(jìn)行原型設(shè)計(jì)和部署深度學(xué)習(xí)模型。易用性通常是以碎片為代價(jià)的：孤立地使用每個(gè)框架是很容易的。垂直集成已使常見用例的開發(fā)流程簡化了，但是冒險(xiǎn)走過的路可能很棘手。
一個(gè)支持不佳的方案是將張量直接從一個(gè)框架傳遞到內(nèi)存中的另一個(gè)框架，而沒有任何數(shù)據(jù)重復(fù)或復(fù)制。支持這種用例使用戶能夠?qū)⒐艿来?lián)在一起，其中某些算子在一個(gè)框架中得到比在另一個(gè)框架中得到更好的支持（或更快速）。框架之間共享的數(shù)據(jù)表示形式也將彌合這一差距，并在為算子生成代碼時(shí)，允許編譯器堆棧以單一格式為目標(biāo)。
DLPack是用于張量數(shù)據(jù)結(jié)構(gòu)的中間內(nèi)存表示標(biāo)準(zhǔn)。使用DLPack作為通用表示，傳統(tǒng)上只能依賴供應(yīng)商提供的庫的框架編寫的腳本中利用TVM。TVM打包函數(shù)可以在DLPack張量上運(yùn)行，提供包裝程序以橋接帶有零數(shù)據(jù)副本的框架（例如PyTorch和MxNet）中的張量數(shù)據(jù)結(jié)構(gòu)。
DLPack提供了一種簡單的可移植內(nèi)存數(shù)據(jù)結(jié)構(gòu)：
/*!

\brief Plain C Tensor object, does not manage memory.
/
typedef struct {
/!
- \brief The opaque data pointer points to the allocated data.
- This will be CUDA device pointer or cl_mem handle in OpenCL.
- This pointer is always aligns to 256 bytes as in CUDA.
  /
  void data;
  /! \brief The device context of the tensor /
  DLContext ctx;
  /! \brief Number of dimensions /
  int ndim;
  /! \brief The data type of the pointer/
  DLDataType dtype;
  /! \brief The shape of the tensor /
  int64_t shape;
  /!
- \brief strides of the tensor,
- can be NULL, indicating tensor is compact.
  /
  int64_t strides;
  /*! \brief The offset in bytes to the beginning pointer to data */
  uint64_t byte_offset;
  } DLTensor;
  例如，在TVM中聲明并編譯一個(gè)矩陣乘法算子，并構(gòu)建一個(gè)使用DLPack表示形式的包裝器wrapper，允許該算子支持PyTorch張量。還使用MxNet重復(fù)此演示。此擴(kuò)展使機(jī)器學(xué)習(xí)開發(fā)人員可以在不犧牲性能的情況下，將代碼快速移植到相對不受支持的硬件平臺(tái)上。
  DLPack如何提供框架和TVM之間共享的中間包wrapper的說明：

圖1
首先，在PyTorch中計(jì)算參考輸出：
import torch
x = torch.rand(56,56)
y = torch.rand(56,56)
z = x.mm(y)
然后，使用默認(rèn)調(diào)度定義并構(gòu)建TVM矩陣乘法算子：
n = tvm.convert(56)
X = tvm.placeholder((n,n), name=‘X’)
Y = tvm.placeholder((n,n), name=‘Y’)

k = tvm.reduce_axis((0, n), name='k')
Z = tvm.compute((n,n), lambda i,j : tvm.sum(X[i,k]*Y[k,j], axis=k))
s = tvm.create_schedule(Z.op)
fmm = tvm.build(s, [X, Y, Z], target_host='llvm', name='fmm')

為簡便起見，沒有涵蓋可用于優(yōu)化矩陣乘法的TVM大量的調(diào)度原語集合。如果希望使自定義GEMM算子在的硬件設(shè)備上快速運(yùn)行，請參考詳細(xì)的教程。
然后，將TVM函數(shù)轉(zhuǎn)換為支持PyTorch張量的函數(shù)：
from tvm.contrib.dlpack import to_pytorch_func
# fmm is the previously built TVM function (Python function)
# fmm is the wrapped TVM function (Python function)
fmm_pytorch = to_pytorch_func(fmm)
z2 = torch.empty(56,56)
fmm_pytorch(x, y, z2)
np.testing.assert_allclose(z.numpy(), z2.numpy())
并驗(yàn)證結(jié)果是否匹配。
可以重復(fù)相同的示例，但是使用MxNet代替：
import mxnet
from tvm.contrib.mxnet import to_mxnet_func
ctx = mxnet.cpu(0)
x = mxnet.nd.uniform(shape=(56,56), ctx=ctx)
y = mxnet.nd.uniform(shape=(56,56), ctx=ctx)
z = mxnet.nd.empty(shape=(56,56), ctx=ctx)
f = tvm.build(s, [X, Y, Z], target_host=‘llvm’, name=‘f’)
f_mxnet = to_mxnet_func(f)
f_mxnet(x, y, z)
np.testing.assert_allclose(z.asnumpy(), x.asnumpy().dot(y.asnumpy()))
在PyTorch示例的幕后
由于TVM提供了將dlpack張量轉(zhuǎn)換為tvm的功能，NDArray反之亦然，因此，通過wrapper功能，所需的只是一些語法 syntactic sugar 。 convert_func是用于使用具有dlpack支持的張量的框架的通用轉(zhuǎn)換器，可以用于實(shí)現(xiàn)方便的轉(zhuǎn)換器，例如 to_pytorch_func。
def convert_func(tvm_func, tensor_type, to_dlpack_func):
assert callable(tvm_func)

def _wrapper(*args):args = tuple(ndarray.from_dlpack(to_dlpack_func(arg))\if isinstance(arg, tensor_type) else arg for arg in args)return tvm_func(*args)return _wrapper

def to_pytorch_func(tvm_func):
import torch
import torch.utils.dlpack
return convert_func(tvm_func, torch.Tensor, torch.utils.dlpack.to_dlpack)

總結(jié)

以上是生活随笔為你收集整理的DLPack构建跨框架的深度学习编译器的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： TensorFlow+TVM优化NMT神
下一篇：硬件平台上深度学习自动内核优化

3atv精品不卡视频,97人人超碰国产精品最新,中文字幕av一区二区三区人妻少妇,久久久精品波多野结衣,日韩一区二区三区精品

生活经验

DLPack构建跨框架的深度学习编译器

總結(jié)