Spaces:

joshuasundance
/

langchain-streamlit-demo

Sleeping

App Files Files Community

Joshua Sundance Bailey commited on Oct 6, 2023

Commit

0ce4fb3

1 Parent(s): 21eccfc

cleanup & options

Browse files

Files changed (4) hide show

kubernetes/resources.yaml +4 -0
langchain-streamlit-demo/app.py +95 -96
langchain-streamlit-demo/defaults.py +66 -0
langchain-streamlit-demo/llm_resources.py +6 -4

kubernetes/resources.yaml CHANGED Viewed

@@ -71,6 +71,10 @@ spec:
                 key: LANGCHAIN_API_KEY
           - name: LANGCHAIN_PROJECT
             value: "langchain-streamlit-demo"
         securityContext:
           runAsNonRoot: true
 ---

                 key: LANGCHAIN_API_KEY
           - name: LANGCHAIN_PROJECT
             value: "langchain-streamlit-demo"
+          - name: SHOW_LANGCHAIN_OPTIONS
+            value: "False"
+          - name: SHOW_AZURE_OPTIONS
+            value: "False"
         securityContext:
           runAsNonRoot: true
 ---

langchain-streamlit-demo/app.py CHANGED Viewed

@@ -14,29 +14,8 @@ from langchain.schema.retriever import BaseRetriever
 from langsmith.client import Client
 from streamlit_feedback import streamlit_feedback
-from defaults import (
-    MODEL_DICT,
-    SUPPORTED_MODELS,
-    DEFAULT_MODEL,
-    DEFAULT_SYSTEM_PROMPT,
-    MIN_TEMP,
-    MAX_TEMP,
-    DEFAULT_TEMP,
-    MIN_MAX_TOKENS,
-    MAX_MAX_TOKENS,
-    DEFAULT_MAX_TOKENS,
-    DEFAULT_LANGSMITH_PROJECT,
-    AZURE_DICT,
-    PROVIDER_KEY_DICT,
-    OPENAI_API_KEY,
-    MIN_CHUNK_SIZE,
-    MAX_CHUNK_SIZE,
-    DEFAULT_CHUNK_SIZE,
-    MIN_CHUNK_OVERLAP,
-    MAX_CHUNK_OVERLAP,
-    DEFAULT_CHUNK_OVERLAP,
-    DEFAULT_RETRIEVER_K,
-)
 from llm_resources import get_runnable, get_llm, get_texts_and_retriever, StreamHandler
 __version__ = "0.0.13"
@@ -81,12 +60,14 @@ RUN_COLLECTOR = RunCollectorCallbackHandler()
 @st.cache_data
 def get_texts_and_retriever_cacheable_wrapper(
     uploaded_file_bytes: bytes,
-    chunk_size: int = DEFAULT_CHUNK_SIZE,
-    chunk_overlap: int = DEFAULT_CHUNK_OVERLAP,
-    k: int = DEFAULT_RETRIEVER_K,
 ) -> Tuple[List[Document], BaseRetriever]:
     return get_texts_and_retriever(
         uploaded_file_bytes=uploaded_file_bytes,
         chunk_size=chunk_size,
         chunk_overlap=chunk_overlap,
         k=k,
@@ -100,14 +81,14 @@ with sidebar:
     model = st.selectbox(
         label="Chat Model",
-        options=SUPPORTED_MODELS,
-        index=SUPPORTED_MODELS.index(DEFAULT_MODEL),
     )
-    st.session_state.provider = MODEL_DICT[model]
     provider_api_key = (
-        PROVIDER_KEY_DICT.get(
             st.session_state.provider,
         )
         or st.text_input(
@@ -130,7 +111,7 @@ with sidebar:
         openai_api_key = (
             provider_api_key
             if st.session_state.provider == "OpenAI"
-            else OPENAI_API_KEY
             or st.sidebar.text_input("OpenAI API Key: ", type="password")
         )
@@ -143,7 +124,7 @@ with sidebar:
         k = st.slider(
             label="Number of Chunks",
             help="How many document chunks will be used for context?",
-            value=DEFAULT_RETRIEVER_K,
             min_value=1,
             max_value=10,
         )
@@ -151,17 +132,17 @@ with sidebar:
         chunk_size = st.slider(
             label="Number of Tokens per Chunk",
             help="Size of each chunk of text",
-            min_value=MIN_CHUNK_SIZE,
-            max_value=MAX_CHUNK_SIZE,
-            value=DEFAULT_CHUNK_SIZE,
         )
         chunk_overlap = st.slider(
             label="Chunk Overlap",
             help="Number of characters to overlap between chunks",
-            min_value=MIN_CHUNK_OVERLAP,
-            max_value=MAX_CHUNK_OVERLAP,
-            value=DEFAULT_CHUNK_OVERLAP,
         )
         chain_type_help_root = (
@@ -198,8 +179,9 @@ with sidebar:
                 (
                     st.session_state.texts,
                     st.session_state.retriever,
-                ) = get_texts_and_retriever(
                     uploaded_file_bytes=uploaded_file.getvalue(),
                     chunk_size=chunk_size,
                     chunk_overlap=chunk_overlap,
                     k=k,
@@ -216,7 +198,7 @@ with sidebar:
         system_prompt = (
             st.text_area(
                 "Custom Instructions",
-                DEFAULT_SYSTEM_PROMPT,
                 help="Custom instructions to provide the language model to determine style, personality, etc.",
             )
             .strip()
@@ -226,84 +208,99 @@ with sidebar:
         temperature = st.slider(
             "Temperature",
-            min_value=MIN_TEMP,
-            max_value=MAX_TEMP,
-            value=DEFAULT_TEMP,
             help="Higher values give more random results.",
         )
         max_tokens = st.slider(
             "Max Tokens",
-            min_value=MIN_MAX_TOKENS,
-            max_value=MAX_MAX_TOKENS,
-            value=DEFAULT_MAX_TOKENS,
             help="Higher values give longer results.",
         )
     # --- LangSmith Options ---
-    with st.expander("LangSmith Options", expanded=False):
-        LANGSMITH_API_KEY = st.text_input(
-            "LangSmith API Key (optional)",
-            type="password",
-            value=PROVIDER_KEY_DICT.get("LANGSMITH"),
-        )
-        LANGSMITH_PROJECT = st.text_input(
-            "LangSmith Project Name",
-            value=DEFAULT_LANGSMITH_PROJECT or "langchain-streamlit-demo",
-        )
-        if st.session_state.client is None and LANGSMITH_API_KEY:
-            st.session_state.client = Client(
-                api_url="https://api.smith.langchain.com",
-                api_key=LANGSMITH_API_KEY,
             )
-            st.session_state.ls_tracer = LangChainTracer(
-                project_name=LANGSMITH_PROJECT,
-                client=st.session_state.client,
             )
-    # --- Azure Options ---
-    with st.expander("Azure Options", expanded=False):
-        AZURE_OPENAI_BASE_URL = st.text_input(
-            "AZURE_OPENAI_BASE_URL",
-            value=AZURE_DICT["AZURE_OPENAI_BASE_URL"],
         )
-        AZURE_OPENAI_API_VERSION = st.text_input(
-            "AZURE_OPENAI_API_VERSION",
-            value=AZURE_DICT["AZURE_OPENAI_API_VERSION"],
         )
-        AZURE_OPENAI_DEPLOYMENT_NAME = st.text_input(
-            "AZURE_OPENAI_DEPLOYMENT_NAME",
-            value=AZURE_DICT["AZURE_OPENAI_DEPLOYMENT_NAME"],
-        )
-        AZURE_OPENAI_API_KEY = st.text_input(
-            "AZURE_OPENAI_API_KEY",
-            value=AZURE_DICT["AZURE_OPENAI_API_KEY"],
-            type="password",
-        )
-        AZURE_OPENAI_MODEL_VERSION = st.text_input(
-            "AZURE_OPENAI_MODEL_VERSION",
-            value=AZURE_DICT["AZURE_OPENAI_MODEL_VERSION"],
-        )
-        AZURE_AVAILABLE = all(
-            [
-                AZURE_OPENAI_BASE_URL,
-                AZURE_OPENAI_API_VERSION,
-                AZURE_OPENAI_DEPLOYMENT_NAME,
-                AZURE_OPENAI_API_KEY,
-                AZURE_OPENAI_MODEL_VERSION,
-            ],
-        )
 # --- LLM Instantiation ---
-llm = get_llm(
     provider=st.session_state.provider,
     model=model,
     provider_api_key=provider_api_key,
@@ -384,6 +381,8 @@ if st.session_state.llm:
                 st.session_state.llm,
                 st.session_state.retriever,
                 MEMORY,
             )
             # --- LLM call ---

 from langsmith.client import Client
 from streamlit_feedback import streamlit_feedback
+from defaults import default_values
 from llm_resources import get_runnable, get_llm, get_texts_and_retriever, StreamHandler
 __version__ = "0.0.13"
 @st.cache_data
 def get_texts_and_retriever_cacheable_wrapper(
     uploaded_file_bytes: bytes,
+    openai_api_key: str,
+    chunk_size: int = default_values.DEFAULT_CHUNK_SIZE,
+    chunk_overlap: int = default_values.DEFAULT_CHUNK_OVERLAP,
+    k: int = default_values.DEFAULT_RETRIEVER_K,
 ) -> Tuple[List[Document], BaseRetriever]:
     return get_texts_and_retriever(
         uploaded_file_bytes=uploaded_file_bytes,
+        openai_api_key=openai_api_key,
         chunk_size=chunk_size,
         chunk_overlap=chunk_overlap,
         k=k,
     model = st.selectbox(
         label="Chat Model",
+        options=default_values.SUPPORTED_MODELS,
+        index=default_values.SUPPORTED_MODELS.index(default_values.DEFAULT_MODEL),
     )
+    st.session_state.provider = default_values.MODEL_DICT[model]
     provider_api_key = (
+        default_values.PROVIDER_KEY_DICT.get(
             st.session_state.provider,
         )
         or st.text_input(
         openai_api_key = (
             provider_api_key
             if st.session_state.provider == "OpenAI"
+            else default_values.OPENAI_API_KEY
             or st.sidebar.text_input("OpenAI API Key: ", type="password")
         )
         k = st.slider(
             label="Number of Chunks",
             help="How many document chunks will be used for context?",
+            value=default_values.DEFAULT_RETRIEVER_K,
             min_value=1,
             max_value=10,
         )
         chunk_size = st.slider(
             label="Number of Tokens per Chunk",
             help="Size of each chunk of text",
+            min_value=default_values.MIN_CHUNK_SIZE,
+            max_value=default_values.MAX_CHUNK_SIZE,
+            value=default_values.DEFAULT_CHUNK_SIZE,
         )
         chunk_overlap = st.slider(
             label="Chunk Overlap",
             help="Number of characters to overlap between chunks",
+            min_value=default_values.MIN_CHUNK_OVERLAP,
+            max_value=default_values.MAX_CHUNK_OVERLAP,
+            value=default_values.DEFAULT_CHUNK_OVERLAP,
         )
         chain_type_help_root = (
                 (
                     st.session_state.texts,
                     st.session_state.retriever,
+                ) = get_texts_and_retriever_cacheable_wrapper(
                     uploaded_file_bytes=uploaded_file.getvalue(),
+                    openai_api_key=openai_api_key,
                     chunk_size=chunk_size,
                     chunk_overlap=chunk_overlap,
                     k=k,
         system_prompt = (
             st.text_area(
                 "Custom Instructions",
+                default_values.DEFAULT_SYSTEM_PROMPT,
                 help="Custom instructions to provide the language model to determine style, personality, etc.",
             )
             .strip()
         temperature = st.slider(
             "Temperature",
+            min_value=default_values.MIN_TEMP,
+            max_value=default_values.MAX_TEMP,
+            value=default_values.DEFAULT_TEMP,
             help="Higher values give more random results.",
         )
         max_tokens = st.slider(
             "Max Tokens",
+            min_value=default_values.MIN_MAX_TOKENS,
+            max_value=default_values.MAX_MAX_TOKENS,
+            value=default_values.DEFAULT_MAX_TOKENS,
             help="Higher values give longer results.",
         )
     # --- LangSmith Options ---
+    LANGSMITH_API_KEY = default_values.PROVIDER_KEY_DICT.get("LANGSMITH")
+    LANGSMITH_PROJECT = (
+        default_values.DEFAULT_LANGSMITH_PROJECT or "langchain-streamlit-demo"
+    )
+    if default_values.SHOW_LANGSMITH_OPTIONS:
+        with st.expander("LangSmith Options", expanded=False):
+            LANGSMITH_API_KEY = st.text_input(
+                "LangSmith API Key (optional)",
+                value=LANGSMITH_API_KEY,
+                type="password",
             )
+            LANGSMITH_PROJECT = st.text_input(
+                "LangSmith Project Name",
+                value=LANGSMITH_PROJECT,
             )
+    if st.session_state.client is None and LANGSMITH_API_KEY:
+        st.session_state.client = Client(
+            api_url="https://api.smith.langchain.com",
+            api_key=LANGSMITH_API_KEY,
         )
+        st.session_state.ls_tracer = LangChainTracer(
+            project_name=LANGSMITH_PROJECT,
+            client=st.session_state.client,
         )
+    # --- Azure Options ---
+    AZURE_OPENAI_BASE_URL = default_values.AZURE_DICT["AZURE_OPENAI_BASE_URL"]
+    AZURE_OPENAI_API_VERSION = default_values.AZURE_DICT["AZURE_OPENAI_API_VERSION"]
+    AZURE_OPENAI_DEPLOYMENT_NAME = default_values.AZURE_DICT[
+        "AZURE_OPENAI_DEPLOYMENT_NAME"
+    ]
+    AZURE_OPENAI_API_KEY = default_values.AZURE_DICT["AZURE_OPENAI_API_KEY"]
+    AZURE_OPENAI_MODEL_VERSION = default_values.AZURE_DICT["AZURE_OPENAI_MODEL_VERSION"]
+    if default_values.SHOW_AZURE_OPTIONS:
+        with st.expander("Azure Options", expanded=False):
+            AZURE_OPENAI_BASE_URL = st.text_input(
+                "AZURE_OPENAI_BASE_URL",
+                value=AZURE_OPENAI_BASE_URL,
+            )
+            AZURE_OPENAI_API_VERSION = st.text_input(
+                "AZURE_OPENAI_API_VERSION",
+                value=AZURE_OPENAI_API_VERSION,
+            )
+            AZURE_OPENAI_DEPLOYMENT_NAME = st.text_input(
+                "AZURE_OPENAI_DEPLOYMENT_NAME",
+                value=AZURE_OPENAI_DEPLOYMENT_NAME,
+            )
+            AZURE_OPENAI_API_KEY = st.text_input(
+                "AZURE_OPENAI_API_KEY",
+                value=AZURE_OPENAI_API_KEY,
+                type="password",
+            )
+            AZURE_OPENAI_MODEL_VERSION = st.text_input(
+                "AZURE_OPENAI_MODEL_VERSION",
+                value=AZURE_OPENAI_MODEL_VERSION,
+            )
+    AZURE_AVAILABLE = all(
+        [
+            AZURE_OPENAI_BASE_URL,
+            AZURE_OPENAI_API_VERSION,
+            AZURE_OPENAI_DEPLOYMENT_NAME,
+            AZURE_OPENAI_API_KEY,
+            AZURE_OPENAI_MODEL_VERSION,
+        ],
+    )
 # --- LLM Instantiation ---
+st.session_state.llm = get_llm(
     provider=st.session_state.provider,
     model=model,
     provider_api_key=provider_api_key,
                 st.session_state.llm,
                 st.session_state.retriever,
                 MEMORY,
+                chat_prompt,
+                prompt,
             )
             # --- LLM call ---

langchain-streamlit-demo/defaults.py CHANGED Viewed

@@ -1,4 +1,6 @@
 import os
 MODEL_DICT = {
     "gpt-3.5-turbo": "OpenAI",
@@ -41,6 +43,12 @@ AZURE_VARS = [
 AZURE_DICT = {v: os.environ.get(v, "") for v in AZURE_VARS}
 PROVIDER_KEY_DICT = {
     "OpenAI": os.environ.get("OPENAI_API_KEY", ""),
     "Anthropic": os.environ.get("ANTHROPIC_API_KEY", ""),
@@ -60,3 +68,61 @@ MAX_CHUNK_OVERLAP = 10000
 DEFAULT_CHUNK_OVERLAP = 0
 DEFAULT_RETRIEVER_K = 4

 import os
+from collections import namedtuple
 MODEL_DICT = {
     "gpt-3.5-turbo": "OpenAI",
 AZURE_DICT = {v: os.environ.get(v, "") for v in AZURE_VARS}
+SHOW_LANGSMITH_OPTIONS = (
+    os.environ.get("SHOW_LANGSMITH_OPTIONS", "true").lower() == "true"
+)
+SHOW_AZURE_OPTIONS = os.environ.get("SHOW_AZURE_OPTIONS", "true").lower() == "true"
 PROVIDER_KEY_DICT = {
     "OpenAI": os.environ.get("OPENAI_API_KEY", ""),
     "Anthropic": os.environ.get("ANTHROPIC_API_KEY", ""),
 DEFAULT_CHUNK_OVERLAP = 0
 DEFAULT_RETRIEVER_K = 4
+DEFAULT_VALUES = namedtuple(
+    "DEFAULT_VALUES",
+    [
+        "MODEL_DICT",
+        "SUPPORTED_MODELS",
+        "DEFAULT_MODEL",
+        "DEFAULT_SYSTEM_PROMPT",
+        "MIN_TEMP",
+        "MAX_TEMP",
+        "DEFAULT_TEMP",
+        "MIN_MAX_TOKENS",
+        "MAX_MAX_TOKENS",
+        "DEFAULT_MAX_TOKENS",
+        "DEFAULT_LANGSMITH_PROJECT",
+        "AZURE_VARS",
+        "AZURE_DICT",
+        "PROVIDER_KEY_DICT",
+        "OPENAI_API_KEY",
+        "MIN_CHUNK_SIZE",
+        "MAX_CHUNK_SIZE",
+        "DEFAULT_CHUNK_SIZE",
+        "MIN_CHUNK_OVERLAP",
+        "MAX_CHUNK_OVERLAP",
+        "DEFAULT_CHUNK_OVERLAP",
+        "DEFAULT_RETRIEVER_K",
+        "SHOW_LANGSMITH_OPTIONS",
+        "SHOW_AZURE_OPTIONS",
+    ],
+)
+default_values = DEFAULT_VALUES(
+    MODEL_DICT,
+    SUPPORTED_MODELS,
+    DEFAULT_MODEL,
+    DEFAULT_SYSTEM_PROMPT,
+    MIN_TEMP,
+    MAX_TEMP,
+    DEFAULT_TEMP,
+    MIN_MAX_TOKENS,
+    MAX_MAX_TOKENS,
+    DEFAULT_MAX_TOKENS,
+    DEFAULT_LANGSMITH_PROJECT,
+    AZURE_VARS,
+    AZURE_DICT,
+    PROVIDER_KEY_DICT,
+    OPENAI_API_KEY,
+    MIN_CHUNK_SIZE,
+    MAX_CHUNK_SIZE,
+    DEFAULT_CHUNK_SIZE,
+    MIN_CHUNK_OVERLAP,
+    MAX_CHUNK_OVERLAP,
+    DEFAULT_CHUNK_OVERLAP,
+    DEFAULT_RETRIEVER_K,
+    SHOW_LANGSMITH_OPTIONS,
+    SHOW_AZURE_OPTIONS,
+)

langchain-streamlit-demo/llm_resources.py CHANGED Viewed

@@ -1,9 +1,8 @@
 from tempfile import NamedTemporaryFile
 from typing import Tuple, List
-from langchain import LLMChain, FAISS
 from langchain.callbacks.base import BaseCallbackHandler
-from langchain.chains import RetrievalQA
 from langchain.chat_models import (
     AzureChatOpenAI,
     ChatOpenAI,
@@ -15,8 +14,8 @@ from langchain.embeddings import OpenAIEmbeddings
 from langchain.retrievers import BM25Retriever, EnsembleRetriever
 from langchain.schema import Document, BaseRetriever
 from langchain.text_splitter import RecursiveCharacterTextSplitter
-from app import chat_prompt, prompt, openai_api_key
 from defaults import DEFAULT_CHUNK_SIZE, DEFAULT_CHUNK_OVERLAP, DEFAULT_RETRIEVER_K
 from qagen import get_rag_qa_gen_chain
 from summarize import get_rag_summarization_chain
@@ -28,6 +27,8 @@ def get_runnable(
     llm,
     retriever,
     memory,
 ):
     if not use_document_chat:
         return LLMChain(
@@ -43,7 +44,7 @@ def get_runnable(
         )
     elif document_chat_chain_type == "Summarization":
         return get_rag_summarization_chain(
-            prompt,
             retriever,
             llm,
         )
@@ -112,6 +113,7 @@ def get_llm(
 def get_texts_and_retriever(
     uploaded_file_bytes: bytes,
     chunk_size: int = DEFAULT_CHUNK_SIZE,
     chunk_overlap: int = DEFAULT_CHUNK_OVERLAP,
     k: int = DEFAULT_RETRIEVER_K,

 from tempfile import NamedTemporaryFile
 from typing import Tuple, List
 from langchain.callbacks.base import BaseCallbackHandler
+from langchain.chains import RetrievalQA, LLMChain
 from langchain.chat_models import (
     AzureChatOpenAI,
     ChatOpenAI,
 from langchain.retrievers import BM25Retriever, EnsembleRetriever
 from langchain.schema import Document, BaseRetriever
 from langchain.text_splitter import RecursiveCharacterTextSplitter
+from langchain.vectorstores import FAISS
 from defaults import DEFAULT_CHUNK_SIZE, DEFAULT_CHUNK_OVERLAP, DEFAULT_RETRIEVER_K
 from qagen import get_rag_qa_gen_chain
 from summarize import get_rag_summarization_chain
     llm,
     retriever,
     memory,
+    chat_prompt,
+    summarization_prompt,
 ):
     if not use_document_chat:
         return LLMChain(
         )
     elif document_chat_chain_type == "Summarization":
         return get_rag_summarization_chain(
+            summarization_prompt,
             retriever,
             llm,
         )
 def get_texts_and_retriever(
     uploaded_file_bytes: bytes,
+    openai_api_key: str,
     chunk_size: int = DEFAULT_CHUNK_SIZE,
     chunk_overlap: int = DEFAULT_CHUNK_OVERLAP,
     k: int = DEFAULT_RETRIEVER_K,