--- language: da tags: - bert - punctuation restoration license: apache-2.0 datasets: - custom --- # Bert Punctuation Restoration Danish This model performs the punctuation restoration task in Danish. The method used is sequence classification similar to how NER models are trained. ## Model description TODO ### How to use The model requires some additional inference code, hence we created an awesome little pip package for inference. The inference code is based on the `TokenClassificationPipeline` pipeline from huggingface. First, install the little package by running ``` pip install punctfix ``` Then restoration is as simple as the following snippet: ```python >>> from punctfix import PunctFixer >>> fixer = PunctFixer(language="da") >>> example_text = "mit navn det er rasmus og jeg kommer fra firmaet alvenir det er mig som har trænet denne lækre model" >>> print(fixer.punctuate(example_text)) 'Mit navn det er Rasmus og jeg kommer fra firmaet Alvenir. Det er mig som har trænet denne lækre model.' >>> example_text = "en dag bliver vi sku glade for at vi nu kan sætte punktummer og kommaer i en sætning det fungerer da meget godt ikke" >>> print(fixer.punctuate(example_text)) 'En dag bliver vi sku glade for, at vi nu kan sætte punktummer og kommaer i en sætning. Det fungerer da meget godt, ikke?' ``` ## Training data To Do ## Training procedure To Do ### Preprocessing TODO ## Evaluation results TODO