#include #include #include void read_shm(const torch::Tensor &shm, std::vector dst) { py::gil_scoped_release release; char *src_ptr = static_cast(shm.data_ptr()); size_t current = 0; for (size_t i = 0; i < dst.size(); ++i) { auto &t = dst[i]; size_t t_bytes = t.numel() * t.element_size(); char *dst_ptr = static_cast(t.data_ptr()); std::memcpy(dst_ptr, src_ptr + current, t_bytes); current += t_bytes; } } void write_shm(const std::vector src, torch::Tensor &shm) { py::gil_scoped_release release; char *dst_ptr = static_cast(shm.data_ptr()); size_t current = 0; for (size_t i = 0; i < src.size(); ++i) { auto &t = src[i]; size_t t_bytes = t.numel() * t.element_size(); char *src_ptr = static_cast(t.data_ptr()); std::memcpy(dst_ptr + current, src_ptr, t_bytes); current += t_bytes; } } PYBIND11_MODULE(TORCH_EXTENSION_NAME, m) { m.def("read_shm", &read_shm, "Read tensors from shared memory"); m.def("write_shm", &write_shm, "Write tensors to shared memory"); }