Spaces:

thankrandomness
/

mimic-iii-retrieval-matryoshka

Runtime error

thankrandomness commited on Oct 31, 2024

Commit

ef72046

1 Parent(s): f8a90e7

lower the similarity threshold

Files changed (1) hide show

app.py CHANGED Viewed

@@ -78,7 +78,7 @@ def upsert_data(dataset_split):
 upsert_data(dataset['train'])
 # Define retrieval function with similarity threshold
-def retrieve_relevant_text(input_text, similarity_threshold=0.1):  # Lower threshold to capture more results
     input_embedding = embed_text([input_text])[0]
     results = collection.query(
         query_embeddings=[input_embedding],
@@ -103,7 +103,7 @@ def retrieve_relevant_text(input_text, similarity_threshold=0.1):  # Lower thres
     return output
 # Evaluate retrieval efficiency on the validation/test set
-def evaluate_efficiency(dataset_split, similarity_threshold=0.1):
     y_true = []
     y_pred = []
     total_similarity = 0

 upsert_data(dataset['train'])
 # Define retrieval function with similarity threshold
+def retrieve_relevant_text(input_text, similarity_threshold=1.0):  # Lower threshold to capture more results
     input_embedding = embed_text([input_text])[0]
     results = collection.query(
         query_embeddings=[input_embedding],
     return output
 # Evaluate retrieval efficiency on the validation/test set
+def evaluate_efficiency(dataset_split, similarity_threshold=1.0):
     y_true = []
     y_pred = []
     total_similarity = 0