Transformers 3D Model

G3D-ViT: 3D GradCAM for Vision Transformers

G3D-ViT is a 3D GradCAM implementation for Vision Transformers (ViTs), designed to visualize important regions in 3D data by leveraging gradient-based activation maps. This method is particularly ...

GitHub

3D Parallel Distributed Training with HuggingFace Transformers

Train large language models across multiple GPUs using Tensor Parallelism, Data Parallelism (FSDP), and Context Parallelism — all with native PyTorch and HuggingFace Transformers. This workflow trains ...

IEEE

MSIA-SDiT3D: 3D Multi-Scale Interpolation Attention in Lightweight Diffusion Transformers for 3D Point Cloud Generation

Abstract: Recently, diffusion Transformers have demonstrated strong potential in generative tasks, especially in 2D image generation, where DiT models have shown excellent generative results. The ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

G3D-ViT: 3D GradCAM for Vision Transformers

3D Parallel Distributed Training with HuggingFace Transformers

MSIA-SDiT3D: 3D Multi-Scale Interpolation Attention in Lightweight Diffusion Transformers for 3D Point Cloud Generation

Trending now