qualcomm
/

Whisper-Tiny-En

Automatic Speech Recognition

PyTorch

TF Lite

foundation

android

Model card Files Files and versions Community

qaihm-bot commited on 26 days ago

Commit

988851d

•

1 Parent(s): ed26dd1

Upload README.md with huggingface_hub

Browse files

Files changed (1) hide show

README.md +78 -78

README.md CHANGED Viewed

@@ -38,48 +38,48 @@ More details on model performance across various devices, can be found
 | Model | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 |---|---|---|---|---|---|---|---|---|
-| WhisperEncoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 102.517 ms | 15 - 102 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 140.918 ms | 0 - 52 MB | FP16 | NPU | [Whisper-Tiny-En.so](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.so) |
-| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 79.931 ms | 20 - 49 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 110.457 ms | 0 - 190 MB | FP16 | NPU | [Whisper-Tiny-En.so](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.so) |
-| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 65.236 ms | 20 - 39 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 89.706 ms | 0 - 194 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 100.71 ms | 20 - 109 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 104.587 ms | 1 - 2 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA7255P ADP | SA7255P | TFLITE | 532.945 ms | 20 - 44 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA7255P ADP | SA7255P | QNN | 466.605 ms | 2 - 7 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 102.188 ms | 20 - 117 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA8255 (Proxy) | SA8255P Proxy | QNN | 108.187 ms | 1 - 2 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA8295P ADP | SA8295P | TFLITE | 107.711 ms | 20 - 41 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA8295P ADP | SA8295P | QNN | 128.097 ms | 1 - 6 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 99.594 ms | 20 - 58 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA8650 (Proxy) | SA8650P Proxy | QNN | 107.074 ms | 1 - 2 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA8775P ADP | SA8775P | TFLITE | 178.344 ms | 20 - 43 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA8775P ADP | SA8775P | QNN | 119.681 ms | 0 - 6 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 156.253 ms | 20 - 55 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | QCS8450 (Proxy) | QCS8450 Proxy | QNN | 158.505 ms | 0 - 194 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 97.524 ms | 0 - 0 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 3.993 ms | 3 - 50 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 2.409 ms | 0 - 80 MB | FP16 | NPU | [Whisper-Tiny-En.so](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.so) |
-| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 3.077 ms | 0 - 58 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 1.726 ms | 0 - 42 MB | FP16 | NPU | [Whisper-Tiny-En.so](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.so) |
-| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 2.624 ms | 2 - 57 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 1.421 ms | 10 - 50 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 4.056 ms | 3 - 41 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 2.377 ms | 5 - 7 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA7255P ADP | SA7255P | TFLITE | 18.142 ms | 3 - 56 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA7255P ADP | SA7255P | QNN | 15.519 ms | 9 - 15 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 3.952 ms | 2 - 41 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA8255 (Proxy) | SA8255P Proxy | QNN | 2.333 ms | 2 - 4 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA8295P ADP | SA8295P | TFLITE | 4.786 ms | 3 - 29 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA8295P ADP | SA8295P | QNN | 3.598 ms | 1 - 7 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 3.997 ms | 3 - 50 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA8650 (Proxy) | SA8650P Proxy | QNN | 2.44 ms | 8 - 10 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA8775P ADP | SA8775P | TFLITE | 5.308 ms | 3 - 57 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA8775P ADP | SA8775P | QNN | 3.448 ms | 9 - 14 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 4.622 ms | 3 - 59 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | QCS8450 (Proxy) | QCS8450 Proxy | QNN | 2.923 ms | 9 - 51 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 2.29 ms | 10 - 10 MB | FP16 | NPU | Use Export Script |
@@ -140,23 +140,23 @@ python -m qai_hub_models.models.whisper_tiny_en.export
 ```
 ```
 Profiling Results
-------------------------------------------------------------
-WhisperEncoder
-Device                          : Samsung Galaxy S23 (13)
-Runtime                         : TFLITE
-Estimated inference time (ms)   : 102.5
-Estimated peak memory usage (MB): [15, 102]
-Total # Ops                     : 271
-Compute Unit(s)                 : GPU (260 ops) CPU (11 ops)
 ------------------------------------------------------------
 WhisperDecoder
 Device                          : Samsung Galaxy S23 (13)
 Runtime                         : TFLITE
 Estimated inference time (ms)   : 4.0
-Estimated peak memory usage (MB): [3, 50]
 Total # Ops                     : 557
 Compute Unit(s)                 : NPU (557 ops)
 ```
@@ -179,42 +179,42 @@ from qai_hub_models.models.whisper_tiny_en import Model
 # Load the model
 model = Model.from_pretrained()
-encoder_model = model.encoder
 decoder_model = model.decoder
 # Device
 device = hub.Device("Samsung Galaxy S23")
 # Trace model
-encoder_input_shape = encoder_model.get_input_spec()
-encoder_sample_inputs = encoder_model.sample_inputs()
-traced_encoder_model = torch.jit.trace(encoder_model, [torch.tensor(data[0]) for _, data in encoder_sample_inputs.items()])
 # Compile model on a specific device
-encoder_compile_job = hub.submit_compile_job(
-    model=traced_encoder_model ,
     device=device,
-    input_specs=encoder_model.get_input_spec(),
 )
 # Get target model to run on-device
-encoder_target_model = encoder_compile_job.get_target_model()
 # Trace model
-decoder_input_shape = decoder_model.get_input_spec()
-decoder_sample_inputs = decoder_model.sample_inputs()
-traced_decoder_model = torch.jit.trace(decoder_model, [torch.tensor(data[0]) for _, data in decoder_sample_inputs.items()])
 # Compile model on a specific device
-decoder_compile_job = hub.submit_compile_job(
-    model=traced_decoder_model ,
     device=device,
-    input_specs=decoder_model.get_input_spec(),
 )
 # Get target model to run on-device
-decoder_target_model = decoder_compile_job.get_target_model()
 ```
@@ -226,14 +226,14 @@ After compiling models from step 1. Models can be profiled model on-device using
 provisioned in the cloud.  Once the job is submitted, you can navigate to a
 provided job URL to view a variety of on-device performance metrics.
 ```python
-encoder_profile_job = hub.submit_profile_job(
-    model=encoder_target_model,
-    device=device,
-)
 decoder_profile_job = hub.submit_profile_job(
     model=decoder_target_model,
     device=device,
 )
 ```
@@ -242,13 +242,6 @@ Step 3: **Verify on-device accuracy**
 To verify the accuracy of the model on-device, you can run on-device inference
 on sample input data on the same cloud hosted device.
 ```python
-encoder_input_data = encoder_model.sample_inputs()
-encoder_inference_job = hub.submit_inference_job(
-    model=encoder_target_model,
-    device=device,
-    inputs=encoder_input_data,
-)
-encoder_inference_job.download_output_data()
 decoder_input_data = decoder_model.sample_inputs()
 decoder_inference_job = hub.submit_inference_job(
     model=decoder_target_model,
@@ -256,6 +249,13 @@ decoder_inference_job = hub.submit_inference_job(
     inputs=decoder_input_data,
 )
 decoder_inference_job.download_output_data()
 ```
 With the output of the model, you can compute like PSNR, relative errors or

 | Model | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 |---|---|---|---|---|---|---|---|---|
+| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 4.05 ms | 3 - 40 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 2.401 ms | 0 - 121 MB | FP16 | NPU | [Whisper-Tiny-En.so](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.so) |
+| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 3.05 ms | 0 - 62 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 1.71 ms | 4 - 49 MB | FP16 | NPU | [Whisper-Tiny-En.so](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.so) |
+| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 2.62 ms | 0 - 56 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 1.546 ms | 0 - 42 MB | FP16 | NPU | Use Export Script |
+| WhisperDecoder | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 4.107 ms | 3 - 41 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 2.368 ms | 10 - 12 MB | FP16 | NPU | Use Export Script |
+| WhisperDecoder | SA7255P ADP | SA7255P | TFLITE | 18.307 ms | 2 - 57 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA7255P ADP | SA7255P | QNN | 15.533 ms | 9 - 19 MB | FP16 | NPU | Use Export Script |
+| WhisperDecoder | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 4.007 ms | 3 - 40 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA8255 (Proxy) | SA8255P Proxy | QNN | 2.339 ms | 3 - 4 MB | FP16 | NPU | Use Export Script |
+| WhisperDecoder | SA8295P ADP | SA8295P | TFLITE | 5.188 ms | 3 - 55 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA8295P ADP | SA8295P | QNN | 3.586 ms | 1 - 7 MB | FP16 | NPU | Use Export Script |
+| WhisperDecoder | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 4.064 ms | 3 - 41 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA8650 (Proxy) | SA8650P Proxy | QNN | 2.422 ms | 10 - 11 MB | FP16 | NPU | Use Export Script |
+| WhisperDecoder | SA8775P ADP | SA8775P | TFLITE | 5.443 ms | 0 - 55 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA8775P ADP | SA8775P | QNN | 3.465 ms | 9 - 15 MB | FP16 | NPU | Use Export Script |
+| WhisperDecoder | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 4.664 ms | 3 - 62 MB | FP16 | NPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | QCS8450 (Proxy) | QCS8450 Proxy | QNN | 2.892 ms | 4 - 50 MB | FP16 | NPU | Use Export Script |
+| WhisperDecoder | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 2.285 ms | 10 - 10 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 99.892 ms | 20 - 51 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 139.106 ms | 0 - 55 MB | FP16 | NPU | [Whisper-Tiny-En.so](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.so) |
+| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 81.683 ms | 17 - 47 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 109.268 ms | 0 - 191 MB | FP16 | NPU | [Whisper-Tiny-En.so](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.so) |
+| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 74.784 ms | 25 - 44 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 98.55 ms | 0 - 195 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 96.819 ms | 13 - 55 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 104.143 ms | 0 - 5 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | SA7255P ADP | SA7255P | TFLITE | 507.645 ms | 20 - 45 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA7255P ADP | SA7255P | QNN | 464.481 ms | 1 - 10 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 100.562 ms | 18 - 147 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA8255 (Proxy) | SA8255P Proxy | QNN | 106.657 ms | 0 - 5 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | SA8295P ADP | SA8295P | TFLITE | 103.764 ms | 21 - 42 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA8295P ADP | SA8295P | QNN | 127.685 ms | 4 - 10 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 109.307 ms | 20 - 60 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA8650 (Proxy) | SA8650P Proxy | QNN | 107.644 ms | 0 - 5 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | SA8775P ADP | SA8775P | TFLITE | 177.953 ms | 20 - 47 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA8775P ADP | SA8775P | QNN | 119.437 ms | 0 - 6 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 185.481 ms | 11 - 48 MB | FP16 | GPU | [Whisper-Tiny-En.tflite](https://huggingface.co/qualcomm/Whisper-Tiny-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | QCS8450 (Proxy) | QCS8450 Proxy | QNN | 165.323 ms | 0 - 196 MB | FP16 | NPU | Use Export Script |
+| WhisperEncoder | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 97.277 ms | 0 - 0 MB | FP16 | NPU | Use Export Script |
 ```
 ```
 Profiling Results
 ------------------------------------------------------------
 WhisperDecoder
 Device                          : Samsung Galaxy S23 (13)
 Runtime                         : TFLITE
 Estimated inference time (ms)   : 4.0
+Estimated peak memory usage (MB): [3, 40]
 Total # Ops                     : 557
 Compute Unit(s)                 : NPU (557 ops)
+------------------------------------------------------------
+WhisperEncoder
+Device                          : Samsung Galaxy S23 (13)
+Runtime                         : TFLITE
+Estimated inference time (ms)   : 99.9
+Estimated peak memory usage (MB): [20, 51]
+Total # Ops                     : 271
+Compute Unit(s)                 : GPU (260 ops) CPU (11 ops)
 ```
 # Load the model
 model = Model.from_pretrained()
 decoder_model = model.decoder
+encoder_model = model.encoder
 # Device
 device = hub.Device("Samsung Galaxy S23")
 # Trace model
+decoder_input_shape = decoder_model.get_input_spec()
+decoder_sample_inputs = decoder_model.sample_inputs()
+traced_decoder_model = torch.jit.trace(decoder_model, [torch.tensor(data[0]) for _, data in decoder_sample_inputs.items()])
 # Compile model on a specific device
+decoder_compile_job = hub.submit_compile_job(
+    model=traced_decoder_model ,
     device=device,
+    input_specs=decoder_model.get_input_spec(),
 )
 # Get target model to run on-device
+decoder_target_model = decoder_compile_job.get_target_model()
 # Trace model
+encoder_input_shape = encoder_model.get_input_spec()
+encoder_sample_inputs = encoder_model.sample_inputs()
+traced_encoder_model = torch.jit.trace(encoder_model, [torch.tensor(data[0]) for _, data in encoder_sample_inputs.items()])
 # Compile model on a specific device
+encoder_compile_job = hub.submit_compile_job(
+    model=traced_encoder_model ,
     device=device,
+    input_specs=encoder_model.get_input_spec(),
 )
 # Get target model to run on-device
+encoder_target_model = encoder_compile_job.get_target_model()
 ```
 provisioned in the cloud.  Once the job is submitted, you can navigate to a
 provided job URL to view a variety of on-device performance metrics.
 ```python
 decoder_profile_job = hub.submit_profile_job(
     model=decoder_target_model,
     device=device,
 )
+encoder_profile_job = hub.submit_profile_job(
+    model=encoder_target_model,
+    device=device,
+)
 ```
 To verify the accuracy of the model on-device, you can run on-device inference
 on sample input data on the same cloud hosted device.
 ```python
 decoder_input_data = decoder_model.sample_inputs()
 decoder_inference_job = hub.submit_inference_job(
     model=decoder_target_model,
     inputs=decoder_input_data,
 )
 decoder_inference_job.download_output_data()
+encoder_input_data = encoder_model.sample_inputs()
+encoder_inference_job = hub.submit_inference_job(
+    model=encoder_target_model,
+    device=device,
+    inputs=encoder_input_data,
+)
+encoder_inference_job.download_output_data()
 ```
 With the output of the model, you can compute like PSNR, relative errors or