From dfab9d3df0a457ba261864b2f753bf8fe5f0aa7a Mon Sep 17 00:00:00 2001
From: KKlochko <kklochko@protonmail.com>
Date: Sun, 16 Nov 2025 15:40:29 +0200
Subject: [PATCH] Update the lifecycle to load the model only from local files.

---
 gliner_inference_server/main.py | 5 ++++-
 1 file changed, 4 insertions(+), 1 deletion(-)

diff --git a/gliner_inference_server/main.py b/gliner_inference_server/main.py
index 8c31301..fcac631 100644
--- a/gliner_inference_server/main.py
+++ b/gliner_inference_server/main.py
@@ -24,7 +24,10 @@ async def lifespan(app: FastAPI):
     print("Loading GLiNER model...")
     model_name = os.getenv("MODEL_NAME", "knowledgator/gliner-multitask-large-v0.5")
     device = "cuda" if torch.cuda.is_available() else "cpu"
-    model = GLiNER.from_pretrained(model_name).to(device)
+    model = GLiNER.from_pretrained(
+        model_name,
+        local_files_only = True
+    ).to(device)
     print(f"Model loaded on {device}")
     yield
     print("Shutting down...")