BramVanroy commited on
Commit
b734c5c
1 Parent(s): a487e39

update model

Browse files
Files changed (5) hide show
  1. README.md +83 -10
  2. all_results.json +24 -0
  3. config.json +1 -1
  4. generated_predictions.txt +128 -0
  5. pytorch_model.bin +1 -1
README.md CHANGED
@@ -1,13 +1,86 @@
1
  ---
2
- license: apache-2.0
 
 
 
 
 
 
 
3
  language:
4
- - nl
 
 
5
  metrics:
6
- - rouge
7
- pipeline_tag: text2text-generation
8
- tags:
9
- - simplification
10
- widget:
11
- - example_title: "Grandmother's cooking"
12
- - text: "Op bepaalde tijdstippen verlang ik naar de smaakvolle culinaire creaties welke door de ambachtelijke expertise van mijn grootmoeder zijn vervaardigd."
13
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
+ license: cc-by-nc-sa-4.0
3
+ tags:
4
+ - generated_from_trainer
5
+ - simplification
6
+ task_categories:
7
+ - text2text-generation
8
+ task_ids:
9
+ - text-simplification
10
  language:
11
+ - nl
12
+ datasets:
13
+ - BramVanroy/chatgpt-dutch-simplification
14
  metrics:
15
+ - rouge
16
+ - sari
17
+ ---
18
+
19
+
20
+ # ul2-small-dutch-simplification-mai-2023
21
+
22
+ This model is intended to simplify Dutch sentences.
23
+
24
+ This model is a fine-tuned version of [yhavinga/ul2-small-dutch](https://huggingface.co/yhavinga/ul2-small-dutch) on
25
+ the [BramVanroy/chatgpt-dutch-simplification](https://huggingface.co/datasets/BramVanroy/chatgpt-dutch-simplification)
26
+ dataset.
27
+
28
+ The model was created in light of the master thesis of Charlotte Van de Velde in the Master of Science in Artificial
29
+ Intelligence (MAI) at KU Leuven in 2023. Dataset creation by Charlotte, model training by Bram.
30
+
31
+
32
+ ## Model description
33
+
34
+ More information needed
35
+
36
+ ## Intended uses & limitations
37
+
38
+ More information needed
39
+
40
+ ## Training and evaluation data
41
+
42
+ More information needed
43
+
44
+ ## Training procedure
45
+
46
+ ### Training hyperparameters
47
+
48
+ The following hyperparameters were used during training:
49
+ - learning_rate: 0.0006370158604635734
50
+ - train_batch_size: 20
51
+ - optimizer: Adafactor
52
+ - lr_scheduler_type: linear
53
+ - num_epochs: 37
54
+
55
+
56
+ ### Training results
57
+
58
+ `eval` results are on the evaluation set, `predict` results are on the test set.
59
+
60
+ ```json
61
+ {
62
+ "eval_gen_len": 21.555555555555557,
63
+ "eval_loss": 3.2290523052215576,
64
+ "eval_rouge1": 40.9663,
65
+ "eval_rouge2": 18.499,
66
+ "eval_rougeL": 34.9342,
67
+ "eval_rougeLsum": 34.9752,
68
+ "eval_sari": 52.4509,
69
+
70
+ "predict_gen_len": 21.796875,
71
+ "predict_loss": 3.063812494277954,
72
+ "predict_rouge1": 39.6138,
73
+ "predict_rouge2": 17.1242,
74
+ "predict_rougeL": 35.4629,
75
+ "predict_rougeLsum": 35.3679,
76
+ "predict_sari": 51.7538
77
+ }
78
+ ```
79
+
80
+
81
+ ### Framework versions
82
+
83
+ - Transformers 4.29.2
84
+ - Pytorch 2.0.1+cu117
85
+ - Datasets 2.12.0
86
+ - Tokenizers 0.13.3
all_results.json ADDED
@@ -0,0 +1,24 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "eval_gen_len": 21.555555555555557,
3
+ "eval_loss": 3.2290523052215576,
4
+ "eval_rouge1": 40.9663,
5
+ "eval_rouge2": 18.499,
6
+ "eval_rougeL": 34.9342,
7
+ "eval_rougeLsum": 34.9752,
8
+ "eval_runtime": 12.2189,
9
+ "eval_samples": 126,
10
+ "eval_samples_per_second": 10.312,
11
+ "eval_sari": 52.4509,
12
+ "eval_steps_per_second": 1.309,
13
+ "predict_gen_len": 21.796875,
14
+ "predict_loss": 3.063812494277954,
15
+ "predict_rouge1": 39.6138,
16
+ "predict_rouge2": 17.1242,
17
+ "predict_rougeL": 35.4629,
18
+ "predict_rougeLsum": 35.3679,
19
+ "predict_runtime": 13.1133,
20
+ "predict_samples": 128,
21
+ "predict_samples_per_second": 9.761,
22
+ "predict_sari": 51.7538,
23
+ "predict_steps_per_second": 1.22
24
+ }
config.json CHANGED
@@ -1,5 +1,5 @@
1
  {
2
- "_name_or_path": ".",
3
  "architectures": [
4
  "T5ForConditionalGeneration"
5
  ],
1
  {
2
+ "_name_or_path": "yhavinga/ul2-small-dutch",
3
  "architectures": [
4
  "T5ForConditionalGeneration"
5
  ],
generated_predictions.txt ADDED
@@ -0,0 +1,128 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ Onze hersenen kunnen ingewikkelde dingen doen door middel van elektrische netwerken die informatie verwerken en doorsturen via zenuwcellen.
2
+ We hebben onderzocht hoe de pathologie werkt door middel van tests en tests.
3
+ Om deze opdracht goed te kunnen uitvoeren, moet je weten hoe de materie werkt en de wetgeving.
4
+ Het adagium zegt dat je niet moet nadenken over wat er kan gebeuren door onvoorziene omstandigheden.
5
+ Hij was zo slim dat hij het idee goed begreep, maar het was niet goed genoeg.
6
+ Bij het uitvoeren van de taak waren er veel problemen die ervoor zorgden dat er fouten werden gemaakt.
7
+ Mensen veroorzaken de klimaatverandering door het uitstoten van broeikasgassen.
8
+ Omdat deze materie ingewikkeld is, is het logisch dat we het idee moeten begrijpen omdat het ingewikkeld is.
9
+ Als twee deeltjes verstrengeld zijn, beïnvloedt de toestand van het ene deeltje invloed op de toestand van het andere deeltje, zelfs als ze ver uit elkaar zijn.
10
+ Het is belangrijk om af te spreken wat er kan gebeuren als je een keuze maakt.
11
+ Het constructivisme is dat kennis wordt opgebouwd door mensen die actief zijn en met elkaar omgaan.
12
+ Het is belangrijk om te bedenken welke maatregelen we moeten nemen om klimaatverandering tegen te gaan.
13
+ Hoewel haar test niet goed genoeg was, heeft ze niet genoeg gedaan om de test te halen.
14
+ Veel glycemie kan zorgen voor problemen met het geheugen, nefropathie, longziekte en longziekte.
15
+ Het is belangrijk om te kijken naar hoe we energie opslaan en minder belastend zijn voor het milieu.
16
+ Mensen die veel weten over hun cultuur en geschiedenis, moeten elkaar respecteren en respecteren.
17
+ Dit probleem is ingewikkeld en vereist veel verschillende experts om het probleem op te lossen.
18
+ Mensen veroorzaken de klimaatverandering door het uitstoten van broeikasgassen.
19
+ Mensen gebruiken een vaginale ring die bekend is van gezondheidswerkers, maar sommige mensen vinden het niet goed genoeg.
20
+ Deze auto zorgt ervoor dat het voertuig goed kan rijden en dat het snel en goed kan rijden.
21
+ Mensen vinden het belangrijk om samen te leven en samen te werken als ze uit elkaar gaan.
22
+ Kwantummechanica gaat over hele kleine deeltjes die met elkaar verbonden zijn en hun toestanden beschrijven met behulp van een golffunctie.
23
+ In de filosofie denken mensen dat het universum het centrum van het universum is.
24
+ Als de data niet goed is, kan dat ervoor zorgen dat de resultaten niet kloppen.
25
+ Elektromagnetische straling hangt af van verschillende frequenties en energieën.
26
+ Het menselijk brein heeft veel verschillende onderdelen, zoals geheugen, praten en aandacht.
27
+ Hoewel het niet goed ging met het eten en drinken, was er geen verbetering in de gezondheid van de deelnemers.
28
+ In het retorisch discours wordt er vaak gebruik gemaakt van hyperbolen en metaforen om het verhaal beter te begrijpen en aandacht te trekken.
29
+ Ik denk dat het gebruik van deze nieuwe software geen problemen zal veroorzaken.
30
+ Als we verder denken op basis van deze gegevens, kunnen we verkeerde conclusies trekken.
31
+ Kwantummechanica is gebaseerd op moeilijke wiskunde en vereist veel kennis van wiskunde.
32
+ Om te begrijpen of een idee klopt, moet je begrijpen dat het waarschijnlijk is om het te laten zien door middel van proeven.
33
+ Het verschijnsel is soms moeilijk te begrijpen omdat het niet altijd goed genoeg is.
34
+ De behandeling kan afhankelijk zijn van verschillende dingen, zoals wat de patiënt al eerder heeft meegemaakt en wat medicijnen zijn.
35
+ Het is moeilijk voor beleidsmakers om te begrijpen hoe verschillende systemen met elkaar omgaan, omdat het erg ingewikkeld is.
36
+ Het opslaan van de uitstoot van stikstof door de grond heeft invloed op hoe het ecosysteem zich gedraagt.
37
+ Het menselijk brein kan niet begrijpen wat er gebeurt door de manier waarop ons brein werkt.
38
+ Als je de informatie over de kwestie hebt bestudeerd, kun je een conclusie trekken die misschien juist is.
39
+ De manier waarop we bewustzijn ervaren, heeft veel invloed op hoe we dit fenomeen ervaren.
40
+ Als je het menselijk lichaam grondig bekijkt, kunnen we weten dat er verschillende structuren zijn die allemaal hun eigen taken en processen hebben.
41
+ Kwantumsuperpositie betekent dat een deeltje op verschillende plekken tegelijk kan zijn, totdat iemand het bekijkt of meet.
42
+ Hoe twee oppervlakken met elkaar verbonden zijn, hangt af van hoe warm ze zijn en hoe hard ze op elkaar drukken.
43
+ Om te begrijpen hoe hele kleine deeltjes zich gedragen, moet je begrijpen hoe ze zich gedragen.
44
+ Kwantumverstrengeling betekent dat als twee deeltjes ooit met elkaar in contact zijn gekomen, ze nog steeds met elkaar verbonden zijn, zelfs als ze ver uit elkaar zijn.
45
+ De gegevens laten zien dat het fenomeen steeds groter wordt en dat dit grote gevolgen kan hebben voor de economie.
46
+ Het is een moeilijke taak om deze ingewikkelde materie in begrijpelijke taal te vertalen.
47
+ Het kan zijn dat de manier waarop we dingen zien niet past bij wat we verwachten.
48
+ De coëfficiënt van de lineaire regressie tussen deze twee dingen is laag, waardoor het waarschijnlijk lijkt dat het verband niet-lineair is.
49
+ Het is belangrijk om goed na te denken over wat er gebeurt als je een plan schrijft.
50
+ Als de onderneming niet goed wordt uitgevoerd, is het belangrijk dat de afdelingen van de afdelingen samenwerken.
51
+ Omdat kapitaal niet altijd beschikbaar is, kan het niet goed genoeg worden gebruikt wat er in de toekomst kan gebeuren.
52
+ De ziekte is heel ingewikkeld en heeft veel oorzaken, dus het is moeilijk te voorspellen wat er gaat gebeuren.
53
+ Door de manier waarop oude spullen in de oude museumzaal werden tentoongesteld, zagen we dat de tentoonstelling erg interessant was.
54
+ Het is belangrijk om samen te werken tussen verschillende ideeën en verschillende ideeën.
55
+ Als je een keuze maakt die niet past bij wat iemand denkt, wordt het ongemakkelijk.
56
+ Deze discussie gaat over hoe we kennis en waarheid moeten onderzoeken.
57
+ De voorspellingen laten zien dat er binnenkort meer groei zal zijn in de toekomst.
58
+ De manier waarop een organisme werkt op een organisme bepaalt hoe het zich gedraagt.
59
+ Als je een virtuele realiteit bekijkt, krijg je een beeld dat de lezer zelf ziet.
60
+ Linguïstische relativiteit betekent dat de taal die we spreken invloed heeft op hoe we de wereld om ons heen zien.
61
+ Hoe iemand eruitziet hangt af van zijn genen en omgeving.
62
+ Een nepmedicijn werkt niet goed genoeg en kan klachten veroorzaken als je een nepmedicijn gebruikt.
63
+ De cognitieve dissonantietheorie zegt dat mensen zich beter voelen als ze iets doen wat niet past bij hun eigen ideeën en meningen.
64
+ De begrippen individualisme en collectivisme worden gebruikt om te beschrijven of culturen meer gericht zijn op het versterken van wie je bent en wie niet.
65
+ De betekenis van de apocalyptische profetieën was voor de meeste mensen niet goed te begrijpen.
66
+ Het is moeilijk om te zeggen dat het altijd zo is geweest en daarom zal het niet zo blijven.
67
+ Mensen maken de aarde warmer door het verbranden van fossiele brandstoffen en het werken met fabrieken.
68
+ De analyse van de gegevens wordt beïnvloed door verschillende manieren van denken, zoals de manier waarop we de gegevens analyseren, en de manier waarop we die analyse gebruiken.
69
+ De manier waarop de werknemers hun best deden om hun werk goed te maken, maakte dat ze er allemaal een beetje anders uitzagen.
70
+ Het is verwarrend dat de commotie over klimaatverandering is begonnen nadat de mensen het niet eens zijn over hoe het klimaat verandert.
71
+ Kwantumverstrengeling betekent dat twee deeltjes met elkaar verbonden zijn op een manier waarbij de toestand van het ene deeltje altijd samenhangt, zelfs als ze ver uit elkaar zijn.
72
+ Het protocol werkte niet goed genoeg en daarom hebben we het niet goed gedaan.
73
+ Als iemand een moeilijke taak uitvoert, is het soms moeilijk om te begrijpen wat er moet gebeuren.
74
+ Omdat het universum zo groot is, is het bijna onmogelijk om het te begrijpen omdat het zo groot is.
75
+ Quantumverstrengeling is wanneer twee deeltjes zo verbonden zijn dat de toestand van het ene deeltje direct invloed heeft op het andere, zelfs als ze ver uit elkaar zijn.
76
+ Kwantumverstrengeling betekent dat kleine deeltjes met elkaar verbonden zijn en dat hun interacties met elkaar samenhangen.
77
+ Het menselijk brein is een ingewikkeld onderdeel dat verantwoordelijk is voor dingen als zien, praten en emoties.
78
+ Het is duidelijk dat mensen verschillen in hun denkvermogen door hun denkvermogen.
79
+ Cognitieve dissonantie gebeurt wanneer iemand iets doet dat niet past bij wat ze doen of wat ze doen.
80
+ Om dit onderwerp op te lossen, heb je veel kennis van dit onderwerp nodig.
81
+ Als iemand zich bewust wordt van wat existentiële angst betekent, kan dat voor problemen zorgen of als iemand moeite heeft met het leven.
82
+ Het is lastig om precies te begrijpen hoe hersenactiviteit en gedrag invloed hebben op hoe mensen zich gedragen.
83
+ Omdat de rente steeds hoger wordt, kan het verstandig zijn om de rente voor een lange periode vast te houden.
84
+ Quantumverstrengeling betekent dat twee of meer deeltjes met elkaar verbonden zijn op een manier waarbij de toestand van het ene deeltje afhankelijk is van het andere deeltje, zelfs als ze ver uit elkaar zijn.
85
+ Een moeilijke taak kost meer tijd om te voltooien.
86
+ De geprojecteerde economische groei van de BRICS-landen wordt hoger dan de geprojecteerde economische groei van de BRICS-landen.
87
+ Het klimaat verandert omdat het steeds warmer wordt en er steeds meer water en hittegolven ontstaan.
88
+ Hoewel de rechter nog niet precies heeft gezegd wat er moet gebeuren, zijn er nog veel mensen die hun mening hebben over de kwestie.
89
+ De overheid heeft geïmplementeerde beleidsmaatregelen om de werkgelegenheid te verbeteren en zo veel mogelijk mensen te laten werken.
90
+ De tekst was verwarrend omdat de paragrafen niet goed met elkaar praatten.
91
+ De onderzoekers dachten dat het medicijn beter zou werken als het medicijn beter werkt.
92
+ Het bloed door ons lichaam wordt door ons lichaam gedragen en de hormonen die door ons lichaam werken worden geregeld.
93
+ Bij de wetenschappelijke methode wordt het lastiger om te begrijpen wat er bedoeld wordt als wetenschappelijke methode.
94
+ De meeste mensen begrijpen de abstracte ideeën van de metafysische realiteit niet goed.
95
+ Het utilitarisme zegt dat het niet kan gebeuren als er zoveel mensen geluk hebben.
96
+ Als er maar één soort mensen werkt in een bedrijf, kan dat ervoor zorgen dat sommige mensen zich buitengesloten voelen en uitgesloten worden.
97
+ Om dit wiskunde probleem op te lossen, heb je veel kennis van algebraïsche structuren en getaltheorie nodig.
98
+ Hoe ingewikkeld de realiteit is, hangt af van hoe snel je hersenen werken en hoe je ze in balans houdt.
99
+ Door verschillende expertises te combineren, hebben we meer focus op het probleem.
100
+ Het is belangrijk dat we een duidelijke visie hebben over hoe we deze strategie moeten uitvoeren.
101
+ Onderzoekers hebben onderzoek gedaan naar hoe alcoholgebruik invloed heeft op het brein en het brein.
102
+ Een woord wordt vervangen door een omschrijving van de betekenis, waardoor het lastiger wordt om het te begrijpen.
103
+ Deze studie gaat over hoe mensen zich voelen en hoe ze zich voelen.
104
+ Als verschillende afdelingen samenwerken, kan dit ervoor zorgen dat er problemen ontstaan door verschillende afdelingen.
105
+ Omdat er veel verschillende gegevens zijn, is de analyse minder betrouwbaar.
106
+ Het menselijk brein is erg ingewikkeld en het is lastig om helemaal te begrijpen hoe het werkt.
107
+ Omdat de taal ingewikkeld is, kunnen we verschillende manieren van denken en communiceren begrijpen.
108
+ De relativiteitstheorie gaat over hoe snel het licht beweegt en hoe snel het beweegt.
109
+ Het is belangrijk om te begrijpen wat er in die tijd aan de hand is in de cultuur en de geschiedenis om te begrijpen wat het doel is.
110
+ Als er verschillende dingen in een ecosysteem zijn, is het moeilijk om te voorspellen wat er gaat gebeuren.
111
+ De manier waarop zenuwcellen zich in de loop van de tijd aanpassen, kan veranderen door verschillende dingen die ze doen.
112
+ De kwantumfysica legt uit hoe hele kleine deeltjes zich gedragen en gebruikt daarvoor een rekensom uit.
113
+ Als je te veel dingen tegelijk doet, word je moe in je hoofd en ga je slechter presteren.
114
+ Het gesteente dat tijdens de seismische activiteit wordt gebruikt, is niet altijd betrouwbare voorspellers van aardbevingen.
115
+ Omdat technologieën tegenwoordig ingewikkeld zijn, kunnen we ze beter begrijpen en beheersen.
116
+ We kunnen kijken hoe kleine deeltjes zich gedragen door een kleine lens.
117
+ We moeten nog meer onderzoek doen voordat we zeker kunnen weten wat er aan de hand is.
118
+ Het is belangrijk om samen te werken om duurzame ontwikkelingsdoelen te bereiken.
119
+ Het corpus callosum is een zwarte stof die de twee hersenhelften met elkaar verbinden en ervoor zorgen dat ze met elkaar kunnen praten.
120
+ De kwantummechanica is moeilijk te begrijpen voor sommige mensen omdat het heel ingewikkeld is.
121
+ Het is belangrijk om te bedenken hoe je een bepaalde uitdrukking begrijpt in verschillende contexten.
122
+ Een fysieke substantie ontstaat door een nieuwe fase in de gasvormige fase, zonder dat de substantie smelt.
123
+ De wiskundige formule is lastig te begrijpen hoe de parameters elkaar beïnvloeden.
124
+ De manier waarop we het dialect spreken verschilt veel van de standaardtaal.
125
+ Als de passagiers geen nooduitgangen hebben die zich aan weerszijden van het voertuig bevinden, kunnen de passagiers de nooduitgangen gebruiken die zich aan weerszijden van het voertuig bevinden.
126
+ Bij het onderzoek werken deskundigen uit verschillende vakgebieden samen.
127
+ Onderzoekers denken dat als er verschillende eigenschappen zijn, dat die ervoor zorgen dat er verschillende eigenschappen zijn die hetzelfde laten zien.
128
+ Taalkennis kan gebeuren door te leren van ervaringen met de taal in verschillende contexten.
pytorch_model.bin CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:25a244d07f808acfee1079e83ad09a7c3ef8ce4d5c368a6297d393609aad5943
3
  size 307910149
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6e00f507732778fe0ab7e8ebe24111ff096d44e7cc0b5fb688166d91a0f51442
3
  size 307910149