Spaces:

dammy
/

chatPDF

Runtime error

dammy commited on Nov 16, 2023

Commit

03e01d3

1 Parent(s): fad633c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -37,8 +37,13 @@ def local_query(query, context):
     Context: {}
     Question: {}
     """.format(context, query)
     inputs = tokenizer(t5query, return_tensors="pt")
     outputs = model.generate(**inputs, max_new_tokens=20)
     return tokenizer.batch_decode(outputs, skip_special_tokens=True)
@@ -85,34 +90,6 @@ def run_query(file, history, query):
     return history, result
-# def load_document(pdf_filename):
-#     loader = PDFMinerLoader(pdf_filename)
-#     doc = loader.load()
-#     text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
-#     texts = text_splitter.split_documents(doc)
-#     texts = [i.page_content for i in texts]
-#     doc_emb = st_model.encode(texts)
-#     doc_emb = doc_emb.tolist()
-#     ids = [str(uuid.uuid1()) for _ in doc_emb]
-#     client = chromadb.Client()
-#     collection = client.create_collection("test_db")
-#     collection.add(
-#         embeddings=doc_emb,
-#         documents=texts,
-#         ids=ids
-#     )
-#     return 'Success'
 def upload_pdf(file):

     Context: {}
     Question: {}
     """.format(context, query)
+    print('t5 query is')
+    primt(t5query)
     inputs = tokenizer(t5query, return_tensors="pt")
+    print('done with tokenizer')
     outputs = model.generate(**inputs, max_new_tokens=20)
     return tokenizer.batch_decode(outputs, skip_special_tokens=True)
     return history, result
 def upload_pdf(file):