fix #84

2026-03-07 22:33:36 +00:00 · 2025-03-13 15:03:16 +01:00
parent 3024a9bdb2
commit cb5cf39336
2 changed files with 30 additions and 6 deletions
--- a/whisper_fastapi_online_server.py
+++ b/whisper_fastapi_online_server.py
@@ -10,7 +10,7 @@ from fastapi import FastAPI, WebSocket, WebSocketDisconnect
 from fastapi.responses import HTMLResponse
 from fastapi.middleware.cors import CORSMiddleware

-from whisper_streaming_custom.whisper_online import backend_factory, online_factory, add_shared_args
+from whisper_streaming_custom.whisper_online import backend_factory, online_factory, add_shared_args,warmup_asr
 from timed_objects import ASRToken

 import math
@@ -160,6 +160,7 @@ async def lifespan(app: FastAPI):
    global asr, tokenizer, diarization
    if args.transcription:
        asr, tokenizer = backend_factory(args)
+        warmup_asr(asr, args.warmup_file)
    else:
        asr, tokenizer = None, None

--- a/whisper_streaming_custom/whisper_online.py
+++ b/whisper_streaming_custom/whisper_online.py
@@ -227,11 +227,34 @@ def asr_factory(args, logfile=sys.stderr):
    online = online_factory(args, asr, tokenizer, logfile=logfile)
    return asr, online

-def set_logging(args, logger, others=[]):
-    logging.basicConfig(format="%(levelname)s\t%(message)s")  # format='%(name)s
-    logger.setLevel(args.log_level)
+def warmup_asr(asr, warmup_file=None):
+    """
+    Warmup the ASR model by transcribing a short audio file.
+    """
+    if warmup_file:
+        warmup_file = warmup_file
+    else:
+        # Download JFK sample if not already present
+        import tempfile
+        import os

-    for other in others:
-        logging.getLogger(other).setLevel(args.log_level)
+        
+        jfk_url = "https://github.com/ggerganov/whisper.cpp/raw/master/samples/jfk.wav"
+        temp_dir = tempfile.gettempdir()
+        warmup_file = os.path.join(temp_dir, "whisper_warmup_jfk.wav")
+        
+        if not os.path.exists(warmup_file):
+            logger.debug(f"Downloading warmup file from {jfk_url}")
+            import urllib.request
+            urllib.request.urlretrieve(jfk_url, warmup_file)


+    # Load the warmup file
+    audio, sr = librosa.load(warmup_file, sr=16000)
+
+    # Process the audio
+    asr.transcribe(audio)
+    
+
+    logger.info("Whisper is warmed up")
+