deepset
/

gelectra-large

Inference Endpoints

Model card Files Files and versions Community

gelectra-large / README.md

julien-c's picture

julien-c HF staff

Migrate model card from transformers-repo

4b23a2d over 3 years ago

|

raw history blame

No virus

1.63 kB

	---
	language: de
	license: mit
	datasets:
	- wikipedia
	- OPUS
	- OpenLegalData
	- oscar
	---

	# German ELECTRA large

	Released, Oct 2020, this is a German ELECTRA language model trained collaboratively by the makers of the original German BERT (aka "bert-base-german-cased") and the dbmdz BERT (aka bert-base-german-dbmdz-cased). In our [paper](https://arxiv.org/pdf/2010.10906.pdf), we outline the steps taken to train our model and show that this is the state of the art German language model.

	## Overview
	Paper: [here](https://arxiv.org/pdf/2010.10906.pdf)
	Architecture: ELECTRA large (discriminator)
	Language: German

	## Performance
	```
	GermEval18 Coarse: 80.70
	GermEval18 Fine: 55.16
	GermEval14: 88.95
	```

	See also:
	deepset/gbert-base
	deepset/gbert-large
	deepset/gelectra-base
	deepset/gelectra-large
	deepset/gelectra-base-generator
	deepset/gelectra-large-generator

	## Authors
	Branden Chan: `branden.chan [at] deepset.ai`
	Stefan Schweter: `stefan [at] schweter.eu`
	Timo Möller: `timo.moeller [at] deepset.ai`

	## About us
	![deepset logo](https://raw.githubusercontent.com/deepset-ai/FARM/master/docs/img/deepset_logo.png)

	We bring NLP to the industry via open source!
	Our focus: Industry specific language models & large scale QA systems.

	Some of our work:
	- [German BERT (aka "bert-base-german-cased")](https://deepset.ai/german-bert)
	- [FARM](https://github.com/deepset-ai/FARM)
	- [Haystack](https://github.com/deepset-ai/haystack/)

	Get in touch:
	[Twitter](https://twitter.com/deepset_ai) \| [LinkedIn](https://www.linkedin.com/company/deepset-ai/) \| [Website](https://deepset.ai)