Spaces:

jonathanjordan21
/

helpfulness-ranker

Running

App Files Files Community

jonathanjordan21 commited on Nov 5, 2024

Commit

b1a4b26

verified ·

1 Parent(s): 197e027

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -16

app.py CHANGED Viewed

@@ -1,6 +1,8 @@
 from fastapi import FastAPI
 import numpy as np
-from sentence_transformers import CrossEncoder
 from typing import List
 from pydantic import BaseModel
@@ -15,30 +17,56 @@ class InputModel(BaseModel):
     content: str
-model = CrossEncoder(
-    # "jinaai/jina-reranker-v2-base-multilingual",
-    "Alibaba-NLP/gte-multilingual-reranker-base",
-    trust_remote_code=True,
 )
 @app.get("/")
 def greet_json():
     return {"Hello": "World!"}
 @app.post("/predict_list")
-async def predict_list(inp : InputListModel):
-    sentence_pairs = [[query, doc] for query,doc in zip(inp.keywords, inp.contents)]
-    scores = model.predict(sentence_pairs, convert_to_tensor=False)#.tolist()
-    # (-scores).argsort().tolist()
-    return {"results":scores.tolist()}
-@app.post("/predict")
-async def predict(inp : InputModel):
-    sentence_pairs = [[inp.keyword, inp.content]]
-    scores = model.predict(sentence_pairs, convert_to_tensor=False)#.tolist()
-    # (-scores).argsort().tolist()
-    return {"results":scores.tolist()[0]}
     # keywords = model.encode(inp.keywords)
     # contents = model.encode(inp.contents)

 from fastapi import FastAPI
 import numpy as np
+from sentence_transformers import CrossEncoder, SentenceTransformer
+from sentence_transformers.util import cos_sim
 from typing import List
 from pydantic import BaseModel
     content: str
+# model = CrossEncoder(
+#     # "jinaai/jina-reranker-v2-base-multilingual",
+#     "Alibaba-NLP/gte-multilingual-reranker-base",
+#     trust_remote_code=True,
+# )
+model = SentenceTransformer(
+    "sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2",
+    trust_remote_code=True
 )
 @app.get("/")
 def greet_json():
     return {"Hello": "World!"}
+@app.post("/predict")
+async def predict(inp: InputModel):
+    text_emb = model.encode(inp.contents, convert_to_tensor=True)
+    summarize = model.encode(inp.keywords, convert_to_tensor=True)
+    out = (torch.nn.functional.cosine_similarity(text_emb, summarize, dim=-1) + 1)/2
+    # out = (cos_sim(text_emb, summarize) + 1)/2
+    return {"results":out.tolist()}
 @app.post("/predict_list")
+async def predict(inp: InputListModel):
+    text_emb = model.encode(inp.contents, convert_to_tensor=True)
+    summarize = model.encode(inp.keywords, convert_to_tensor=True)
+    out = (torch.nn.functional.cosine_similarity(text_emb, summarize, dim=-1) + 1)/2
+    # out = (cos_sim(text_emb, summarize) + 1)/2
+    return {"results":out.tolist()}
+# @app.post("/predict_list")
+# async def predict_list(inp : InputListModel):
+#     sentence_pairs = [[query, doc] for query,doc in zip(inp.keywords, inp.contents)]
+#     scores = model.predict(sentence_pairs, convert_to_tensor=False)#.tolist()
+#     # (-scores).argsort().tolist()
+#     return {"results":scores.tolist()}
+# @app.post("/predict")
+# async def predict(inp : InputModel):
+#     sentence_pairs = [[inp.keyword, inp.content]]
+#     scores = model.predict(sentence_pairs, convert_to_tensor=False)#.tolist()
+#     # (-scores).argsort().tolist()
+#     return {"results":scores.tolist()[0]}
     # keywords = model.encode(inp.keywords)
     # contents = model.encode(inp.contents)