Spaces:

shortform
/

chapter_summary_summvis

Runtime error

App Files Files Community

chapter_summary_summvis / utils.py

kmfoda's picture

Initial upload

0379fdb over 1 year ago

raw history blame contribute delete

No virus

297 Bytes

	import re


	def clean_text(text):
	split_punct = re.escape(r'()')
	return ' '.join(re.findall(rf"[^\s{split_punct}]+\|[{split_punct}]", text))
	# Ensure parentheses are probably separated by spaCy tokenizer for CNN/DailyMail dataset.
	return text.replace("(", "( ").replace(")", ") ")