Spaces:

huggingchat
/

chat-ui

Paused

chat-ui / src /lib /server /generateFromDefaultEndpoint.ts

nsarrazin HF staff

Switch task model and add max tokens limits (#1036)

86bc2ea unverified 2 months ago

No virus

956 Bytes

	import { smallModel } from "$lib/server/models";
	import type { Conversation } from "$lib/types/Conversation";

	export async function generateFromDefaultEndpoint({
	messages,
	preprompt,
	generateSettings,
	}: {
	messages: Omit<Conversation["messages"][0], "id">[];
	preprompt?: string;
	generateSettings?: Record<string, unknown>;
	}): Promise<string> {
	const endpoint = await smallModel.getEndpoint();

	const tokenStream = await endpoint({ messages, preprompt, generateSettings });

	for await (const output of tokenStream) {
	// if not generated_text is here it means the generation is not done
	if (output.generated_text) {
	let generated_text = output.generated_text;
	for (const stop of [...(smallModel.parameters?.stop ?? []), "<\|endoftext\|>"]) {
	if (generated_text.endsWith(stop)) {
	generated_text = generated_text.slice(0, -stop.length).trimEnd();
	}
	}
	return generated_text;
	}
	}
	throw new Error("Generation failed");
	}