latest_news_backend_with_cat_pred_similar_news

Running

lalithadevi commited on Feb 12

Commit

68c6e68

•

1 Parent(s): ca6c453

Update news_extractor/news_extractor.py

Files changed (1) hide show

news_extractor/news_extractor.py CHANGED Viewed

@@ -82,7 +82,9 @@ def news_agg(rss):
         b = BeautifulSoup(resp.content, "xml")
         items = b.find_all("item")
         for i in items:
-            rss_df = rss_df.append(rss_parser(i)).copy()
         rss_df["description"] = rss_df["description"].replace([" NULL", ''], np.nan)
         rss_df.dropna(inplace=True)
         rss_df["src"] = src_parse(rss)
@@ -114,7 +116,9 @@ rss = ['https://www.economictimes.indiatimes.com/rssfeedstopstories.cms',
 def get_news():
     final_df = pd.DataFrame()
     for i in rss:
-        final_df = final_df.append(news_agg(i))
     final_df.sort_values(by="elapsed_time", inplace=True)
     # final_df['src_time'] = final_df['src'] + ("&nbsp;" * 5) + final_df["elapsed_time_str"]

         b = BeautifulSoup(resp.content, "xml")
         items = b.find_all("item")
         for i in items:
+            # rss_df = rss_df.append(rss_parser(i)).copy()
+            rss_df = pd.concat([rss_df, rss_parser(i)], axis=0)
+        rss_df.reset_index(drop=True, inplace=True)
         rss_df["description"] = rss_df["description"].replace([" NULL", ''], np.nan)
         rss_df.dropna(inplace=True)
         rss_df["src"] = src_parse(rss)
 def get_news():
     final_df = pd.DataFrame()
     for i in rss:
+        # final_df = final_df.append(news_agg(i))
+        final_df = pd.concat([final_df, news_agg(i)], axis=0)
+    final_df.reset_index(drop=True, inplace=True)
     final_df.sort_values(by="elapsed_time", inplace=True)
     # final_df['src_time'] = final_df['src'] + ("&nbsp;" * 5) + final_df["elapsed_time_str"]