[cli] support firered model (#2772)

robin1001 · web-flow · commit c9d573bb5b92 · 2025-09-05T17:14:51.000+08:00
diff --git a/wenet/cli/hub.py b/wenet/cli/hub.py
@@ -86,6 +86,7 @@ class Hub(object):
     assets = {
         "wenetspeech": "wenetspeech_u2pp_conformer_exp.tar.gz",
         "paraformer": "paraformer.tar.gz",
+        "firered": "firered.tar.gz",
         "punc": "punc.tar.gz"
     }
 
diff --git a/wenet/firered/model.py b/wenet/firered/model.py
@@ -24,6 +24,9 @@
 
 class FireRedModel(ASRModel):
 
+    # FireRedModel only support autogressive decoding
+    default_decode_method = "attention"
+
     def __init__(
         self,
         vocab_size: int,
diff --git a/wenet/transformer/asr_model.py b/wenet/transformer/asr_model.py
@@ -35,6 +35,9 @@
 class ASRModel(torch.nn.Module):
     """CTC-attention hybrid Encoder-Decoder model"""
 
+    # default decoding method for cli
+    default_decode_method = "attention_rescoring"
+
     def __init__(
         self,
         vocab_size: int,
@@ -338,14 +341,15 @@ def decode(
         return results
 
     def transcribe(self, wav: str):
-        """ We use attention_rescoring for transcribe"""
+        """Transcribe for cli"""
         assert hasattr(self, 'compute_feature')  # Dynamic inject in cli
         assert hasattr(self, 'tokenizer')  # Dynamic inject in cli
+        self.eval()
         speech = self.compute_feature(wav)
         speech_lengths = torch.tensor([speech.size(0)], device=speech.device)
         speech = speech.unsqueeze(0)
-        results = self.decode(['attention_rescoring'], speech, speech_lengths)
-        result = results['attention_rescoring'][0]
+        results = self.decode([self.default_decode_method], speech, speech_lengths)
+        result = results[self.default_decode_method][0]
         result.text = self.tokenizer.detokenize(result.tokens)[0]
         return result
 

Original file line number	Diff line number	Diff line change
`@@ -86,6 +86,7 @@ class Hub(object):`
`86`	`86`	`assets = {`
`87`	`87`	`"wenetspeech": "wenetspeech_u2pp_conformer_exp.tar.gz",`
`88`	`88`	`"paraformer": "paraformer.tar.gz",`
	`89`	`+ "firered": "firered.tar.gz",`
`89`	`90`	`"punc": "punc.tar.gz"`
`90`	`91`	`}`
`91`	`92`