#

quantization-aware-training

Here are 60 public repositories matching this topic...

intel / neural-compressor

SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime

sparsity pruning quantization knowledge-distillation auto-tuning int8 low-precision quantization-aware-training post-training-quantization awq int4 large-language-models gptq smoothquant sparsegpt fp4 mxformat

Updated Sep 20, 2024
Python

openvinotoolkit / nncf

Neural Network Compression Framework for enhanced OpenVINO™ inference

nlp sparsity compression deep-learning tensorflow transformers pytorch classification pruning object-detection quantization semantic-segmentation bert hawq onnx openvino mmdetection mixed-precision-training quantization-aware-training

Updated Sep 19, 2024
Python

alibaba / TinyNeuralNetwork

TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.

deep-neural-networks deep-learning pytorch pruning model-compression model-converter quantization-aware-training post-training-quantization

Updated Sep 18, 2024
Python

hls4ml-tutorial

fastmachinelearning / hls4ml-tutorial

Tutorial notebooks for hls4ml

machine-learning tutorial fpga pruning quantization-aware-training hls4ml

Updated Sep 5, 2024
Jupyter Notebook

amajji / LLM-Quantization-Techniques-Absmax-Zeropoint-GPTQ-GGUF

LLM quantization techniques: absmax, zero-point, GPTQ and GGUF

quantization absolute zeropoint quantization-aware-training ptq llm llamacpp ggml gptq gguf absmax

Updated Aug 2, 2024
Jupyter Notebook

ambideXtrous9 / Quantization-of-Models-PTQ-and-QAT

Quantization of Models : Post-Training Quantization(PTQ) and Quantize Aware Training(QAT)

keras pytorch quantization qat tflite pytorch-implementation tflite-models quantization-aware-training ptq

Updated Jul 16, 2024
Jupyter Notebook

nagababumo / -on-device-AI

cpu gpu image-segmentation quantization qualcomm on-device npu on-device-ai quantization-aware-training image-semantics image-semantic-segmentation

Updated Jun 27, 2024
Jupyter Notebook

lix19937 / pytorch-quantization

QAT tensorrt量化

quantization-aware-training

Updated Jun 17, 2024
Python

d-becking / ECQx

ECQx: Explainability-Driven Quantization for Low-Bit and Sparse DNNs

neural-network compression-algorithm xai lrp entropy-regularizer quantization-aware-training zennit nncodec ecqx

Updated Jun 6, 2024
Python

maryamsoftdev / Quantization-in-Machine-Learning

A Tutorial Notebook to Quantization in Machine Learning

quantization quantization-aware-training quantization-efficient-network

Updated May 19, 2024
Jupyter Notebook

alexeybelkov / MedQ

Implementation of MedQ: Lossless ultra-low-bit neural network quantization for medical image segmentation

computer-vision medical-imaging quantization medical-image-segmentation efficient-neural-networks quantization-aware-training

Updated May 17, 2024

DaraVaram / Quant

Quantization notebooks (adapted from and for Mobile Apps w/ Machine Learning, By Dara Varam and Lujain Khalil)

transfer-learning quantization-aware-training

Updated May 9, 2024
Jupyter Notebook

OmidGhadami95 / EfficientNetV2_Quantization_CK

EfficientNetV2 (Efficientnetv2-b2) and quantization int8 and fp32 (QAT and PTQ) on CK+ dataset . fine-tuning, augmentation, solving imbalanced dataset, etc.

python tensorflow keras quantization emotion-recognition qat ckplus facial-emotion-recognition scale-down googlecolab efficientnet imbalanced-dataset quantization-aware-training post-training-quantization efficientnetv2 ptq real-time-emotion-classification real-time-emotion-detection efficientnetv2-b2

Updated May 4, 2024
Jupyter Notebook

moshiurtonmoy / A-Lightweight-Visual-Font-Style-Recognition-with-Quantized-Convolutional-Autoencoder

A lightweight Convolutional Autoencoder for recognizing Bangla font styles along with quantization for deploying resource-constrained IoT devices.

computer-vision convolutional-autoencoder font-style-recognition tensorflow-lite quantization-aware-training visual-font-recognition

Updated Apr 30, 2024
Jupyter Notebook

qnn

stracini-git / qnn

Training neural nets with quantized weights on arbitrarily specified bit-depth

mnist lenet quantization cifar10 binary-neural-networks quantized-neural-networks resnet18 quantization-algorithms quantization-aware-training

Updated Mar 29, 2024
Python

Beomi / BitNet-Transformers

0️⃣1️⃣🤗 BitNet-Transformers: Huggingface Transformers Implementation of "BitNet: Scaling 1-bit Transformers for Large Language Models" in pytorch with Llama(2) Architecture

transformers quantization quantization-aware-training llm

Updated Mar 17, 2024
Python

insuofficial / pytorch-quantization

Quantization simulation of neural networks with PyTorch

python machine-learning deep-learning neural-network gpu quantization quantization-aware-training

Updated Feb 8, 2024
Python

jahongir7174 / YOLOv8-qat

Quantization Aware Training

python pytorch object-detection int8-inference quantization-aware-training int8-quantization yolov8

Updated Jan 13, 2024
Python

yihong1120 / YOLOv8-qat

Quantization Aware Training

Updated Jan 13, 2024
Python

megvii-research / Sparsebit

A model compression and acceleration toolbox based on pytorch.

deep-learning sparse pruning quantization tensorrt quantization-aware-training post-training-quantization

Updated Jan 12, 2024
Python

Improve this page

Add a description, image, and links to the quantization-aware-training topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the quantization-aware-training topic, visit your repo's landing page and select "manage topics."