deepseek-ai
/

DeepSeek-Coder-V2-Lite-Instruct

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Update modeling_deepseek.py

#10

by mukulp - opened Sep 18, 2024

base: refs/heads/main

←

from: refs/pr/10

Discussion Files changed

Files changed (1) hide show

modeling_deepseek.py +3 -1

modeling_deepseek.py CHANGED Viewed

@@ -58,9 +58,11 @@ from .configuration_deepseek import DeepseekV2Config
 import torch.distributed as dist
 import numpy as np
-if is_flash_attn_2_available():
     from flash_attn import flash_attn_func, flash_attn_varlen_func
     from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa
 # This makes `_prepare_4d_causal_attention_mask` a leaf function in the FX graph.

 import torch.distributed as dist
 import numpy as np
+try:
     from flash_attn import flash_attn_func, flash_attn_varlen_func
     from flash_attn.bert_padding import index_first_axis, pad_input, unpad_input  # noqa
+except:
+    pass
 # This makes `_prepare_4d_causal_attention_mask` a leaf function in the FX graph.