diff --git a/whisperlivekit/simul_whisper/simul_whisper.py b/whisperlivekit/simul_whisper/simul_whisper.py
index af2c768..f59c800 100644
--- a/whisperlivekit/simul_whisper/simul_whisper.py
+++ b/whisperlivekit/simul_whisper/simul_whisper.py
@@ -280,13 +280,13 @@ class AlignAtt(AlignAttBase):
             if self.device == 'cpu':
                 encoder_feature_ctranslate = np.array(encoder_feature_ctranslate)
             try:
-                encoder_feature = torch.as_tensor(
-                    encoder_feature_ctranslate, device=self.device,
-                )
+                encoder_feature = torch.as_tensor(encoder_feature_ctranslate, device=self.device)
             except TypeError:
-                encoder_feature = torch.as_tensor(
-                    np.array(encoder_feature_ctranslate), device=self.device,
-                )
+                # Some numpy/ctranslate2 versions produce object_ dtype arrays; force float32
+                arr = np.array(encoder_feature_ctranslate)
+                if arr.dtype == np.object_:
+                    arr = np.array(arr.tolist(), dtype=np.float32)
+                encoder_feature = torch.as_tensor(arr, device=self.device)
         else:
             mel_padded = log_mel_spectrogram(
                 input_segments, n_mels=self.model.dims.n_mels,