Spaces:

ml6team
/

keyphrase-extraction

Sleeping

keyphrase-extraction / pipelines /keyphrase_extraction_pipeline.py

DeDeckerThomas

Second version

e4f39c4 over 2 years ago

787 Bytes

	from transformers import (
	TokenClassificationPipeline,
	AutoModelForTokenClassification,
	AutoTokenizer,
	)
	from transformers.pipelines import AggregationStrategy
	import numpy as np


	class KeyphraseExtractionPipeline(TokenClassificationPipeline):
	def __init__(self, model, args, *kwargs):
	super().__init__(
	model=AutoModelForTokenClassification.from_pretrained(model),
	tokenizer=AutoTokenizer.from_pretrained(model),
	*args,
	**kwargs
	)

	def postprocess(self, model_outputs):
	results = super().postprocess(
	model_outputs=model_outputs,
	aggregation_strategy=AggregationStrategy.SIMPLE,
	)
	return np.unique([result.get("word").strip() for result in results])