latest_news_backend_with_cat_pred_similar_news

Running

lalithadevi commited on Mar 11

Commit

4db51e3

•

1 Parent(s): 03d3a0e

Update news_extractor/news_extractor.py

Files changed (1) hide show

news_extractor/news_extractor.py CHANGED Viewed

@@ -12,16 +12,6 @@ from logger import get_logger
 logger = get_logger()
-def date_time_parser(dt):
-    """
-    Computes the minutes elapsed since published time.
-    :param dt: date
-    :return: int, minutes elapsed.
-    """
-    try:
-        return int(np.round((dt.now(dt.tz) - dt).total_seconds() / 60, 0))
-    except:
-        return 100000
 def text_clean(desc):
     """
@@ -117,7 +107,6 @@ def news_agg(rss):
         rss_df["description"] = rss_df["description"].replace([" NULL", ''], np.nan)
         rss_df["src"] = src_parse(rss)
-        rss_df["elapsed_time"] = rss_df["parsed_date"].apply(date_time_parser)
         rss_df["parsed_date"] = rss_df["parsed_date"].astype("str")
         if len(rss_df) == 0:
@@ -141,8 +130,7 @@ def get_news_rss(url):
         if final_df is not None:
             final_df.reset_index(drop=True, inplace=True)
-            final_df.sort_values(by="elapsed_time", inplace=True)
-            final_df.drop(columns=['elapsed_time'], inplace=True)
             final_df.drop_duplicates(subset='url', inplace=True)

 logger = get_logger()
 def text_clean(desc):
     """
         rss_df["description"] = rss_df["description"].replace([" NULL", ''], np.nan)
         rss_df["src"] = src_parse(rss)
         rss_df["parsed_date"] = rss_df["parsed_date"].astype("str")
         if len(rss_df) == 0:
         if final_df is not None:
             final_df.reset_index(drop=True, inplace=True)
             final_df.drop_duplicates(subset='url', inplace=True)