CpuDevice: IDevice トレイトの CPU 実装
既存の ffi::tl_cpu_tensor_* 関数に委譲する。 全メソッドは void* と CpuTensor のキャストで橋渡しする。
ffi::tl_cpu_tensor_*