Spaces:

Codequestt
/

Royal_Document_Assistant

Sleeping

App Files Files Community

Codequestt commited on Feb 10

Commit

979bf04

verified ·

1 Parent(s): f4b4b2a

Upload 2 files

Browse files

Files changed (2) hide show

app.py +176 -0
requirements.txt +9 -0

app.py ADDED Viewed

	@@ -0,0 +1,176 @@

+import os
+import tempfile
+import uuid
+import zipfile
+import io
+from gtts import gTTS
+from langchain_community.llms import OpenAI
+from langchain_community.embeddings import HuggingFaceEmbeddings
+from langchain_community.vectorstores import FAISS
+from langchain.chains import RetrievalQA
+from langchain_community.document_loaders import PyPDFLoader, DirectoryLoader
+from langchain.text_splitter import CharacterTextSplitter
+from langchain.memory import ConversationBufferMemory
+from langchain.llms.base import LLM
+from typing import Any, List, Mapping, Optional
+from openai import OpenAI as OpenAIClient
+import gradio as gr
+API_KEY = os.getenv("NVIDIA_API_KEY")  # Replace the hardcoded key
+class LlamaLLM(LLM):
+    client: Any = None
+    def __init__(self):
+        super().__init__()
+        self.client = OpenAIClient(
+            base_url="https://integrate.api.nvidia.com/v1",
+            api_key=API_KEY
+        )
+    def _call(self, prompt: str, stop: Optional[List[str]] = None) -> str:
+        completion = self.client.chat.completions.create(
+            model="meta/llama-3.3-70b-instruct",
+            messages=[{"role": "user", "content": prompt}],
+            temperature=0.2,
+            top_p=0.7,
+            max_tokens=1024,
+        )
+        return completion.choices[0].message.content
+    @property
+    def _llm_type(self) -> str:
+        return "Llama 3.3"
+# Initialize components
+llm = LlamaLLM()
+def process_pdfs(zip_file):
+    """Process uploaded ZIP file containing PDFs"""
+    print("Processing ZIP file...")
+    with tempfile.TemporaryDirectory() as temp_dir:
+        print(f"Extracting ZIP to temporary directory: {temp_dir}")
+        with zipfile.ZipFile(zip_file.name, 'r') as zip_ref:
+            zip_ref.extractall(temp_dir)
+        print("Loading PDFs...")
+        loader = DirectoryLoader(temp_dir, glob="**/*.pdf", loader_cls=PyPDFLoader)
+        documents = loader.load()
+        if not documents:
+            raise ValueError("No PDF files found in the uploaded ZIP")
+        print(f"Loaded {len(documents)} documents.")
+        text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
+        texts = text_splitter.split_documents(documents)
+        print("Creating embeddings...")
+        embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
+        vectorstore = FAISS.from_documents(texts, embeddings)
+        memory = ConversationBufferMemory()
+        qa_chain = RetrievalQA.from_chain_type(
+            llm=llm,
+            chain_type="stuff",
+            retriever=vectorstore.as_retriever(),
+            memory=memory,
+        )
+        print("PDF processing complete.")
+        return qa_chain, memory
+def generate_audio(text: str) -> str:
+    """Generate audio from text using gTTS"""
+    try:
+        tts = gTTS(text=text, lang='en')
+        temp_file = tempfile.NamedTemporaryFile(delete=False, suffix=".mp3")
+        tts.save(temp_file.name)
+        return temp_file.name
+    except Exception as e:
+        print(f"Audio generation error: {e}")
+        return None
+def chat_response(query, qa_chain, memory):
+    print(f"Generating response for query: {query}")
+    try:
+        raw_response = qa_chain.invoke(query)
+        print(f"Raw response: {raw_response}")
+        royal_prompt = f"""
+        Respond as a historical royal figure mentioned in the query.
+        Use first-person perspective and be gender-specific.
+        Respond in the query's language. Be authoritative but polite.
+        Use only context information. If unsure, respond as a monarch would.
+        Context: {raw_response}
+        Previous conversation: {memory.buffer}
+        Query: {query}
+        Royal Response:"""
+        final_response = llm._call(royal_prompt)
+        print(f"Final response: {final_response}")
+        memory.save_context({'input': query}, {'output': final_response})
+        return final_response, generate_audio(final_response)
+    except Exception as e:
+        print(f"Error in chat_response: {e}")
+        raise gr.Error(f"Error generating response: {e}")
+with gr.Blocks() as demo:
+    gr.Markdown("# 👑 Royal Document Assistant")
+    qa_chain = gr.State()
+    memory = gr.State()
+    with gr.Row():
+        with gr.Column():
+            zip_upload = gr.File(label="Upload ZIP of PDFs", type="filepath")
+            load_btn = gr.Button("Process Documents")
+            load_status = gr.Markdown()
+    with gr.Row(visible=False) as chat_row:
+        with gr.Column():
+            chat_input = gr.Textbox(label="Ask the Royal Assistant")
+            chat_output = gr.Textbox(label="Response", interactive=False)
+            audio_output = gr.Audio(label="Spoken Response", type="filepath")
+            submit_btn = gr.Button("Ask")
+    def load_docs(zip_file):
+        try:
+            chain, mem = process_pdfs(zip_file)
+            return (
+                gr.update(visible=True),
+                chain,
+                mem,
+                "✅ Documents processed! You may now ask questions"
+            )
+        except Exception as e:
+            return (
+                gr.update(visible=False),
+                None,
+                None,
+                f"❌ Error processing documents: {str(e)}"
+            )
+    def ask_question(query, qa_chain, memory):
+        if not qa_chain or not memory:
+            raise gr.Error("Please process documents first!")
+        try:
+            response, audio = chat_response(query, qa_chain, memory)
+            return response, audio
+        except Exception as e:
+            print(f"Error in ask_question: {e}")
+            return f"Error: {str(e)}", None
+    load_btn.click(
+        load_docs,
+        inputs=zip_upload,
+        outputs=[chat_row, qa_chain, memory, load_status]
+    )
+    submit_btn.click(
+        ask_question,
+        inputs=[chat_input, qa_chain, memory],
+        outputs=[chat_output, audio_output]
+    )
+if __name__ == "__main__":
+    demo.launch(share=True)

requirements.txt ADDED Viewed

	@@ -0,0 +1,9 @@

+gradio
+langchain
+langchain_community
+openai
+gTTS
+python-dotenv
+faiss-cpu
+sentence-transformers
+pypdf