test

Paused

nsarrazin commited on Jul 11, 2023

Commit

10d1ab5

unverified ·

1 Parent(s): 3baa389

Add support for HF summarization endpoint in the websearch (#319)

* Add support for HF endpoint for summary

* add fail-safe for summarization

Files changed (1) hide show

src/lib/server/websearch/summarizeWeb.ts CHANGED Viewed

@@ -1,7 +1,28 @@
 import { generateFromDefaultEndpoint } from "../generateFromDefaultEndpoint";
 import type { BackendModel } from "../models";
 export async function summarizeWeb(content: string, query: string, model: BackendModel) {
 	const summaryPrompt =
 		model.userMessageToken +
 		content

+import { HF_ACCESS_TOKEN } from "$env/static/private";
+import { HfInference } from "@huggingface/inference";
 import { generateFromDefaultEndpoint } from "../generateFromDefaultEndpoint";
 import type { BackendModel } from "../models";
 export async function summarizeWeb(content: string, query: string, model: BackendModel) {
+	// if HF_ACCESS_TOKEN is set, we use a HF dedicated endpoint for summarization
+	try {
+		if (HF_ACCESS_TOKEN) {
+			const summary = (
+				await new HfInference(HF_ACCESS_TOKEN).summarization({
+					model: "facebook/bart-large-cnn",
+					inputs: content,
+					parameters: {
+						max_length: 512,
+					},
+				})
+			).summary_text;
+			return summary;
+		}
+	} catch (e) {
+		console.log(e);
+	}
+	// else we use the LLM to generate a summary
 	const summaryPrompt =
 		model.userMessageToken +
 		content