Spaces:

Jofthomas
/

linkedin_mcp

Sleeping

App Files Files Community

Jofthomas commited on Sep 12

Commit

6504d4f

1 Parent(s): 5bb7b59

change

Browse files

Files changed (1) hide show

app.py +27 -9

app.py CHANGED Viewed

@@ -59,6 +59,14 @@ def _default_headers(cookie: Optional[str]) -> dict:
         "Pragma": "no-cache",
         "Connection": "keep-alive",
         "Referer": "https://www.linkedin.com/jobs/",
     }
     if cookie:
         headers["Cookie"] = cookie
@@ -280,8 +288,12 @@ def _build_search_params(
         params["geoId"] = str(geo_id)
     # Sort: relevance (R) or date (DD)
-    if sort_by and sort_by.lower() in {"relevance", "date"}:
-        params["sortBy"] = "R" if sort_by.lower() == "relevance" else "DD"
     # Time posted
     if date_posted:
@@ -318,18 +330,24 @@ def _search_page(
     base_url = "https://www.linkedin.com/jobs/search/?" + urlencode(params)
     logger.debug("GET main page: %s", base_url)
     resp = client.get(base_url, follow_redirects=True, timeout=20.0)
-    resp.raise_for_status()
     logger.debug(
         "Main page status=%d bytes=%d content-type=%s",
         resp.status_code,
         len(resp.content),
         resp.headers.get("content-type"),
     )
-    block_hint = _detect_block_or_wall(resp.text)
-    if block_hint:
-        logger.warning("Main page may be blocked/walled (hint=%r)", block_hint)
-    jobs = _parse_jobs_from_html(resp.text)
-    logger.debug("Parsed %d jobs from main page", len(jobs))
     # If nothing parsed, try the fragment endpoint as a fallback regardless of page
     if len(jobs) == 0:
@@ -356,7 +374,7 @@ def _search_page(
         if len(jobs) == 0:
             logger.info(
                 "Zero jobs after main+fragment. Body sample: %s",
-                _summarize_body(resp.text or frag_resp.text or ""),
             )
     return jobs

         "Pragma": "no-cache",
         "Connection": "keep-alive",
         "Referer": "https://www.linkedin.com/jobs/",
+        "Accept-Encoding": "gzip, deflate, br, zstd",
+        "Upgrade-Insecure-Requests": "1",
+        "sec-ch-ua": '"Chromium";v="125", "Not.A/Brand";v="24", "Google Chrome";v="125"',
+        "sec-ch-ua-mobile": "?0",
+        "sec-ch-ua-platform": '"macOS"',
+        "Sec-Fetch-Site": "same-origin",
+        "Sec-Fetch-Mode": "navigate",
+        "Sec-Fetch-Dest": "document",
     }
     if cookie:
         headers["Cookie"] = cookie
         params["geoId"] = str(geo_id)
     # Sort: relevance (R) or date (DD)
+    if sort_by:
+        sb = sort_by.lower()
+        if sb in {"relevance", "r"}:
+            params["sortBy"] = "R"
+        elif sb in {"date", "recent", "dd"}:
+            params["sortBy"] = "DD"
     # Time posted
     if date_posted:
     base_url = "https://www.linkedin.com/jobs/search/?" + urlencode(params)
     logger.debug("GET main page: %s", base_url)
     resp = client.get(base_url, follow_redirects=True, timeout=20.0)
     logger.debug(
         "Main page status=%d bytes=%d content-type=%s",
         resp.status_code,
         len(resp.content),
         resp.headers.get("content-type"),
     )
+    jobs: list[JobPosting] = []
+    if resp.status_code == 200:
+        block_hint = _detect_block_or_wall(resp.text)
+        if block_hint:
+            logger.warning("Main page may be blocked/walled (hint=%r)", block_hint)
+        jobs = _parse_jobs_from_html(resp.text)
+        logger.debug("Parsed %d jobs from main page", len(jobs))
+    elif resp.status_code in (999, 401, 403, 429):
+        logger.warning("Main page blocked with status=%d; will try fragment", resp.status_code)
+    else:
+        # For other errors, raise to caller
+        resp.raise_for_status()
     # If nothing parsed, try the fragment endpoint as a fallback regardless of page
     if len(jobs) == 0:
         if len(jobs) == 0:
             logger.info(
                 "Zero jobs after main+fragment. Body sample: %s",
+                _summarize_body(resp.text if resp is not None and resp.text else (frag_resp.text if frag_resp is not None else "")),
             )
     return jobs