Spaces:

ayushtues
/

personal-assistant

Sleeping

App Files Files Community

Ayush Mangal commited on Aug 20, 2023

Commit

7610853

•

1 Parent(s): fe10a2c

Remove adding rep key

Browse files

Files changed (1) hide show

app.py +33 -5

app.py CHANGED Viewed

@@ -11,10 +11,15 @@ from langchain.embeddings import HuggingFaceEmbeddings
 from langchain.chains import RetrievalQA
 from langchain.vectorstores.base import VectorStoreRetriever
 from langchain.prompts import PromptTemplate
-st.set_page_config(page_title="🦜🔗 YT Summarizer")
-st.title('🦜🔗 YT Summarizer')
-jina_api_key = st.sidebar.text_input('Replicate API Key', type='password')
 @st.cache_resource
 def get_query_chain():
@@ -47,6 +52,23 @@ def get_query_chain():
       print("got loader")
       data = loader.load()
       video_data.extend(data)
   text_splitter = RecursiveCharacterTextSplitter(chunk_size = 100, chunk_overlap = 0)
   all_splits = text_splitter.split_documents(video_data)
   vectorstore = FAISS.from_documents(documents=all_splits, embedding=hf)
@@ -81,6 +103,12 @@ with st.form('myform'):
   topic_text = st.text_input('Enter keyword:', '')
   submitted = st.form_submit_button('Submit')
   if submitted :
-    os.environ["REPLICATE_API_TOKEN"] = jina_api_key
     query_chain = get_query_chain()
-    generate_response(topic_text, query_chain)

 from langchain.chains import RetrievalQA
 from langchain.vectorstores.base import VectorStoreRetriever
 from langchain.prompts import PromptTemplate
+from lxml import etree
+from langchain.document_loaders import WebBaseLoader
+from bs4 import BeautifulSoup
+st.set_page_config(page_title="🦜🔗 Ask an LLM to know more about me")
+st.title('🦜🔗 Ask an LLM to know more about me')
+def has_numbers(inputString):
+    return any(char.isdigit() for char in inputString)
 @st.cache_resource
 def get_query_chain():
       print("got loader")
       data = loader.load()
       video_data.extend(data)
+  profile_url = "https://ayushtues.medium.com"
+  response = requests.get(profile_url)
+  soup = BeautifulSoup(response.content, 'html.parser')
+  links = []
+  for link in soup.findAll('a'):
+      x = link.get('href')
+      if x.startswith('/')  and has_numbers(x) :
+          links.append(link.get('href'))
+  links = list(set(links))
+  links = [profile_url+ x.split('?source')[0] for x in links]
+  # print(links)
+  loader = WebBaseLoader(links)
+  data = loader.load()
+  video_data.extend(data)
+  # print(data)
   text_splitter = RecursiveCharacterTextSplitter(chunk_size = 100, chunk_overlap = 0)
   all_splits = text_splitter.split_documents(video_data)
   vectorstore = FAISS.from_documents(documents=all_splits, embedding=hf)
   topic_text = st.text_input('Enter keyword:', '')
   submitted = st.form_submit_button('Submit')
   if submitted :
+    os.environ["REPLICATE_API_TOKEN"] = st.secrets["REPLICATE_API_TOKEN"]
     query_chain = get_query_chain()
+    generate_response(topic_text, query_chain)