llama3.2_RAG_PDF_Chatbot

Paused

m96tkmok commited on Nov 12, 2024

Commit

25481ca

verified ·

1 Parent(s): b6a5096

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -70,7 +70,20 @@ def generate_response(rag_chain, input_text):
     return response
 def main() -> None:
@@ -86,13 +99,9 @@ def main() -> None:
     text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
-    ### Ken 12/11/2024 START
-    loader = PyPDFLoader(docs)
-    ldocs = loader.load()
-    raw_text = get_pdf(ldocs)
-    ### Ken 12/11/2024 END
     #chunks = text_splitter.split_documents(docs)
     chunks = text_splitter.split_documents(raw_text)

     return response
+### Ken 12/11/2024 ADD START
+def get_pdf(uploaded_file):
+    if uploaded_file :
+        temp_file = "./temp.pdf"
+        # Delete the existing temp.pdf file if it exists
+        if os.path.exists(temp_file):
+            os.remove(temp_file)
+        with open(temp_file, "wb") as file:
+            file.write(uploaded_file.getvalue())
+            file_name = uploaded_file.name
+    loader = PyPDFLoader(temp_file)
+    docs = loader.load()
+    return docs
+### Ken 12/11/2024 ADD END
 def main() -> None:
     text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
+    ### Ken 12/11/2024 ADD START
+    raw_text = get_pdf(docs)
+    ### Ken 12/11/2024 ADD END
     #chunks = text_splitter.split_documents(docs)
     chunks = text_splitter.split_documents(raw_text)