chat-ui

Runtime error

chat-ui / src /lib /server /websearch /summarizeWeb.ts

nsarrazin HF staff

Add support for HF summarization endpoint in the websearch (#319)

10d1ab5 unverified about 1 year ago

No virus

1.23 kB

	import { HF_ACCESS_TOKEN } from "$env/static/private";
	import { HfInference } from "@huggingface/inference";
	import { generateFromDefaultEndpoint } from "../generateFromDefaultEndpoint";
	import type { BackendModel } from "../models";

	export async function summarizeWeb(content: string, query: string, model: BackendModel) {
	// if HF_ACCESS_TOKEN is set, we use a HF dedicated endpoint for summarization
	try {
	if (HF_ACCESS_TOKEN) {
	const summary = (
	await new HfInference(HF_ACCESS_TOKEN).summarization({
	model: "facebook/bart-large-cnn",
	inputs: content,
	parameters: {
	max_length: 512,
	},
	})
	).summary_text;
	return summary;
	}
	} catch (e) {
	console.log(e);
	}

	// else we use the LLM to generate a summary
	const summaryPrompt =
	model.userMessageToken +
	content
	.split(" ")
	.slice(0, model.parameters?.truncate ?? 0)
	.join(" ") +
	model.messageEndToken +
	model.userMessageToken +
	`The text above should be summarized to best answer the query: ${query}.` +
	model.messageEndToken +
	model.assistantMessageToken +
	"Summary: ";

	const summary = await generateFromDefaultEndpoint(summaryPrompt).then((txt: string) =>
	txt.trim()
	);

	return summary;
	}