BramVanroy commited on
Commit
ff28cd1
1 Parent(s): 8c47302

init model

Browse files
README.md CHANGED
@@ -1,3 +1,138 @@
1
  ---
2
  license: cc-by-nc-sa-4.0
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: cc-by-nc-sa-4.0
3
+ tags:
4
+ - generated_from_trainer
5
+ - simplification
6
+ task_categories:
7
+ - text2text-generation
8
+ task_ids:
9
+ - text-simplification
10
+ language:
11
+ - nl
12
+ datasets:
13
+ - BramVanroy/chatgpt-dutch-simplification
14
+ metrics:
15
+ - rouge
16
+ - sari
17
+ model-index:
18
+ - name: BramVanroy/ul2-base-dutch-simplification-mai-2023
19
+ results:
20
+ - task:
21
+ type: text-simplification
22
+ name: Text Simplification
23
+ dataset:
24
+ type: BramVanroy/chatgpt-dutch-simplification
25
+ name: ChatGPT Dutch Simplification
26
+ metrics:
27
+ - type: rouge
28
+ value: 41.5749
29
+ name: Eval Rouge-1
30
+ - type: rouge
31
+ value: 19.9
32
+ name: Eval Rouge-2
33
+ - type: rouge
34
+ value: 36.3204
35
+ name: Eval RougeL
36
+ - type: rouge
37
+ value: 36.2596
38
+ name: Eval RougeLsum
39
+ - type: sari
40
+ value: 53.0091
41
+ name: Eval SARI
42
+ - type: rouge
43
+ value: 44.2877
44
+ name: Test Rouge-1
45
+ - type: rouge
46
+ value: 20.8132
47
+ name: Test Rouge-2
48
+ - type: rouge
49
+ value: 39.0951
50
+ name: Test RougeL
51
+ - type: rouge
52
+ value: 39.2709
53
+ name: Test RougeLsum
54
+ - type: sari
55
+ value: 52.9621
56
+ name: Test SARI
57
+ widget:
58
+ - example_title: "Cooking"
59
+ text: "Op bepaalde tijdstippen verlang ik naar de smaakvolle culinaire creaties welke door de ambachtelijke expertise van mijn grootmoeder zijn vervaardigd."
60
+
61
  ---
62
+
63
+
64
+ # ul2-base-dutch-simplification-mai-2023
65
+
66
+ This model is intended to simplify Dutch sentences.
67
+
68
+ This model is a fine-tuned version of [yhavinga/ul2-base-dutch](https://huggingface.co/yhavinga/ul2-base-dutch) on
69
+ the [BramVanroy/chatgpt-dutch-simplification](https://huggingface.co/datasets/BramVanroy/chatgpt-dutch-simplification)
70
+ dataset.
71
+
72
+ The model was created in light of the master thesis of Charlotte Van de Velde in the Master of Science in Artificial
73
+ Intelligence (MAI) at KU Leuven in 2023. Dataset creation by Charlotte, model training by Bram.
74
+
75
+ ## Quick links
76
+
77
+ - [Repository](https://github.com/BramVanroy/mai-simplification-nl-2023#22-hyperparameter-sweep): includes training code and model creation log
78
+ - [Dataset](https://huggingface.co/datasets/BramVanroy/chatgpt-dutch-simplification): `BramVanroy/chatgpt-dutch-simplification`
79
+ - [Parent model](https://huggingface.co/yhavinga/ul2-base-dutch): this model was finetuned on `yhavinga/ul2-base-dutch`
80
+
81
+ ## Intended uses & limitations, and dataset
82
+
83
+ The model is intended for sentence-level simplification of Dutch. It might extend to document-level simplification
84
+ but most of the dataset is limited to sentences so document-level performance is not guaranteed.
85
+
86
+ The dataset has been generated automatically (cf.
87
+ [dataset description](https://huggingface.co/datasets/BramVanroy/chatgpt-dutch-simplification)) and has not been
88
+ manually verified. On top of that, this model has been fine-tuned and we did not scrutinize the parent model or its
89
+ training data. Output of the current model is therefore subject to unexpected results (as most if not all neural
90
+ networks).
91
+
92
+ Because the dataset was generated with ChatGPT, this model cannot be used for commercial purposes.
93
+
94
+ ## Training procedure
95
+
96
+ ### Training hyperparameters
97
+
98
+ The following hyperparameters were used during training:
99
+ - learning_rate: 0.00026885245616406115
100
+ - train_batch_size: 12
101
+ - optimizer: Adafactor
102
+ - num_epochs: 26
103
+
104
+ These hyperarameters were found through Bayesian hyperparameter search with `wandb`. This is described in the
105
+ [repository](https://github.com/BramVanroy/mai-simplification-nl-2023#22-hyperparameter-sweep).
106
+
107
+ ### Training results
108
+
109
+ `eval` results are on the evaluation set, `predict` results are on the test set. These were achieved with
110
+ beam search (num_beams=3).
111
+
112
+ ```json
113
+ {
114
+ "eval_gen_len": 21.206349206349206,
115
+ "eval_loss": 2.598172903060913,
116
+ "eval_rouge1": 41.5749,
117
+ "eval_rouge2": 19.9,
118
+ "eval_rougeL": 36.3204,
119
+ "eval_rougeLsum": 36.2596,
120
+ "eval_sari": 53.0091,
121
+
122
+ "predict_gen_len": 22.40625,
123
+ "predict_loss": 2.517918586730957,
124
+ "predict_rouge1": 44.2877,
125
+ "predict_rouge2": 20.8132,
126
+ "predict_rougeL": 39.0951,
127
+ "predict_rougeLsum": 39.2709,
128
+ "predict_sari": 52.9621
129
+ }
130
+ ```
131
+
132
+
133
+ ### Framework versions
134
+
135
+ - Transformers 4.29.2
136
+ - Pytorch 2.0.1+cu117
137
+ - Datasets 2.12.0
138
+ - Tokenizers 0.13.3
added_tokens.json ADDED
@@ -0,0 +1,30 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "[new_id_0]": 32100,
3
+ "[new_id_10]": 32110,
4
+ "[new_id_11]": 32111,
5
+ "[new_id_12]": 32112,
6
+ "[new_id_13]": 32113,
7
+ "[new_id_14]": 32114,
8
+ "[new_id_15]": 32115,
9
+ "[new_id_16]": 32116,
10
+ "[new_id_17]": 32117,
11
+ "[new_id_18]": 32118,
12
+ "[new_id_19]": 32119,
13
+ "[new_id_1]": 32101,
14
+ "[new_id_20]": 32120,
15
+ "[new_id_21]": 32121,
16
+ "[new_id_22]": 32122,
17
+ "[new_id_23]": 32123,
18
+ "[new_id_24]": 32124,
19
+ "[new_id_25]": 32125,
20
+ "[new_id_26]": 32126,
21
+ "[new_id_27]": 32127,
22
+ "[new_id_2]": 32102,
23
+ "[new_id_3]": 32103,
24
+ "[new_id_4]": 32104,
25
+ "[new_id_5]": 32105,
26
+ "[new_id_6]": 32106,
27
+ "[new_id_7]": 32107,
28
+ "[new_id_8]": 32108,
29
+ "[new_id_9]": 32109
30
+ }
all_results.json ADDED
@@ -0,0 +1,24 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "eval_gen_len": 21.206349206349206,
3
+ "eval_loss": 2.598172903060913,
4
+ "eval_rouge1": 41.5749,
5
+ "eval_rouge2": 19.9,
6
+ "eval_rougeL": 36.3204,
7
+ "eval_rougeLsum": 36.2596,
8
+ "eval_runtime": 14.7656,
9
+ "eval_samples": 126,
10
+ "eval_samples_per_second": 8.533,
11
+ "eval_sari": 53.0091,
12
+ "eval_steps_per_second": 1.084,
13
+ "predict_gen_len": 22.40625,
14
+ "predict_loss": 2.517918586730957,
15
+ "predict_rouge1": 44.2877,
16
+ "predict_rouge2": 20.8132,
17
+ "predict_rougeL": 39.0951,
18
+ "predict_rougeLsum": 39.2709,
19
+ "predict_runtime": 16.4028,
20
+ "predict_samples": 128,
21
+ "predict_samples_per_second": 7.804,
22
+ "predict_sari": 52.9621,
23
+ "predict_steps_per_second": 0.975
24
+ }
config.json ADDED
@@ -0,0 +1,31 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "yhavinga/ul2-base-dutch",
3
+ "architectures": [
4
+ "T5ForConditionalGeneration"
5
+ ],
6
+ "d_ff": 2048,
7
+ "d_kv": 64,
8
+ "d_model": 768,
9
+ "decoder_start_token_id": 0,
10
+ "dense_act_fn": "gelu_new",
11
+ "dropout_rate": 0.1,
12
+ "eos_token_id": 1,
13
+ "feed_forward_proj": "gated-gelu",
14
+ "initializer_factor": 1.0,
15
+ "is_encoder_decoder": true,
16
+ "is_gated_act": true,
17
+ "layer_norm_epsilon": 1e-06,
18
+ "model_type": "t5",
19
+ "num_decoder_layers": 12,
20
+ "num_heads": 12,
21
+ "num_layers": 12,
22
+ "output_past": true,
23
+ "pad_token_id": 0,
24
+ "relative_attention_max_distance": 128,
25
+ "relative_attention_num_buckets": 32,
26
+ "tie_word_embeddings": false,
27
+ "torch_dtype": "float32",
28
+ "transformers_version": "4.29.2",
29
+ "use_cache": true,
30
+ "vocab_size": 32128
31
+ }
generated_predictions.txt ADDED
@@ -0,0 +1,128 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ Onze hersenen kunnen ingewikkelde dingen doen door middel van elektrische verbindingen tussen zenuwcellen die informatie verwerken en doorsturen.
2
+ We hebben getest hoe goed de ziekte was door naar de patiënt te kijken en tests uit te voeren.
3
+ Om deze opdracht goed te kunnen uitvoeren, moet je veel weten over de materie en de regels.
4
+ Het is belangrijk om niet te voorspellen wat er kan gebeuren door dingen die onvoorspelbaar zijn.
5
+ Hij kon het niet goed uitleggen, ook al was hij heel slim.
6
+ Bij het uitvoeren van de taak waren er veel onverwachte problemen die het eindresultaat negatief beïnvloedden.
7
+ Mensen produceren gassen die bijdragen aan het veranderen van het klimaat.
8
+ Omdat deze materie erg ingewikkeld is, is het logisch dat er soms twijfels kunnen ontstaan over hoe we dit concept moeten uitleggen.
9
+ Als twee deeltjes verstrengeld zijn, beïnvloedt de toestand van het ene deeltje direct de toestand van het andere, zelfs als ze ver uit elkaar zijn.
10
+ Het is belangrijk om te bedenken wat er kan gebeuren als je een bepaalde beslissing maakt.
11
+ Het constructivisme zegt dat kennis wordt opgebouwd door te handelen en contact te maken met anderen.
12
+ Het is belangrijk om te bedenken wat we kunnen doen om klimaatverandering tegen te gaan.
13
+ Hoewel zij niet goed genoeg kon doen, heeft ze geen kans gehad om haar vaardigheden te testen.
14
+ Als je te veel insuline gebruikt, kan dat leiden tot problemen met het hart, zoals diabetische retinopathie, neuropathie en longziektes.
15
+ Het is belangrijk om na te denken over hoe we duurzame energie gaan gebruiken.
16
+ Mensen hebben allemaal dezelfde ervaring die ze al heel lang kennen, en die ook belangrijk is voor hun cultuur en geschiedenis.
17
+ Dit probleem is heel ingewikkeld en vereist veel verschillende expertises en aandacht voor de situatie.
18
+ Mensen veroorzaken de klimaatverandering door het uitstoten van broeikasgassen.
19
+ Gezondheidswerkers weten nog niet genoeg over het gebruik van een vaginale ring, ook al is het al heel lang bekend.
20
+ Deze auto is heel flexibel en heeft veel vermogen om te kunnen rijden op lage snelheid.
21
+ Mensen willen altijd verbinding en sociaal contact, wat we vaak zien bij groepsgedrag en het vormen van gemeenschappen.
22
+ Kwantummechanica gaat over hele kleine deeltjes die soms als golven en soms als deeltjes functioneren.
23
+ In de westerse filosofie denken mensen dat het universum zich in het centrum van de wereld bevindt.
24
+ Als de data niet goed is, kan dat ervoor zorgen dat de resultaten niet kloppen.
25
+ Elektromagnetische straling heeft verschillende soorten golven, zoals gammastraling met hoge frequenties en energieën, en radiogolven met lage frequenties en energieën.
26
+ Onze hersenen zijn ingewikkeld en hebben verschillende onderdelen zoals zien, horen, ruiken en praten.
27
+ Hoewel de medicatie en de leefstijl goed waren, waren de deelnemers niet gezonder.
28
+ In het retorisch discours gebruik je vaak hyperbolen en metaforen om de boodschap extra kracht te geven.
29
+ Ik denk dat het gebruik van deze nieuwe software voor de huidige systemen geen problemen zal veroorzaken.
30
+ Als we verder denken op basis van deze gegevens, kunnen we verkeerde conclusies trekken.
31
+ Kwantummechanica is gebaseerd op moeilijke wiskunde en vereist veel kennis van de hogere wiskunde.
32
+ Het is belangrijk om te begrijpen dat het niet betekent dat een idee waar is, alleen kan worden bewezen door middel van proeven.
33
+ Het verschijnsel is moeilijk te begrijpen omdat het niet altijd duidelijk is.
34
+ Het is duidelijk dat de behandeling afhankelijk is van verschillende dingen, zoals hoe de patiënt zich voelt en welke medicijnen hij of zij gebruikt.
35
+ Het is ingewikkeld hoe verschillende partijen in het geldsysteem met elkaar omgaan, en dat is een probleem voor beleidsmakers.
36
+ Als er te veel stikstofrijke verbindingen in de grond zitten, kan dat ervoor zorgen dat planten en dieren zich anders gaan gedragen.
37
+ Onze hersenen kunnen niet goed begrijpen wat er gebeurt omdat ons brein erg ingewikkeld is.
38
+ Als je veel weet over de kwestie, kun je een conclusie trekken die waarschijnlijk klopt.
39
+ De wetenschap heeft veel gedaan aan het begrijpen van dit fenomeen, ook al is het ingewikkeld.
40
+ Als je het menselijk lichaam goed bekijkt, kun je zien dat er verschillende soorten structuren zijn die hun eigen functies en processen hebben.
41
+ Kwantumsuperpositie betekent dat een deeltje op meerdere plaatsen tegelijk kan zijn, totdat iemand het bekijkt of meet.
42
+ Hoe dik twee oppervlakken zijn, hangt af van hoe dik ze zijn en hoe sterk ze zijn.
43
+ Om de natuurkunde op een niveau van kleine deeltjes te begrijpen, moet je het idee van kwantummechanica begrijpen.
44
+ Kwantumverstrengeling betekent dat als twee deeltjes ooit met elkaar in contact zijn gekomen, ze nog steeds met elkaar verbonden zijn, zelfs als ze ver uit elkaar zijn.
45
+ De gegevens laten zien dat het fenomeen steeds groter kan worden, wat slecht is voor de economie.
46
+ Het is moeilijk om deze ingewikkelde materie in begrijpelijke taal te vertalen.
47
+ De manier waarop we dingen weten, is niet overeenkomen met wat we hadden verwacht.
48
+ De coëfficiënt van deze twee dingen is laag, wat betekent dat er misschien geen verband is tussen beide of dat het verband niet-lineair is.
49
+ Bij het maken van een plan om beleid te analyseren, moet je kijken naar welke kenmerken het systeem heeft.
50
+ Om de onderneming goed te laten functioneren, moeten de afdelingen goed met elkaar kunnen samenwerken.
51
+ Door de slechte allocatie van geld is het moeilijk om genoeg productieve bronnen te hebben.
52
+ Omdat de ziekte erg lang duurt, is het moeilijk om te voorspellen wat er gaat gebeuren door de vele klachten en het verloop.
53
+ De tentoonstelling in de oude museumzaal was erg interessant.
54
+ Om tot overeenstemming te komen over een groep mensen met verschillende ideeën, is het belangrijk om compromissen te sluiten.
55
+ Als je dingen doet die niet passen bij wat je denkt, kun je daarvan in de war raken en dat kan voor stress zorgen.
56
+ Omdat deze discussie over kennis en waarheid gaat, moeten we onze eigen ideeën over wat we weten en wat waar is, onderzoeken.
57
+ Uit deze gegevens blijkt dat er in de toekomst steeds meer mensen zullen zijn.
58
+ De manier waarop een organisme zich gedraagt, bepaalt hoe genetische eigenschappen zich gedragen.
59
+ De virtuele werkelijkheid is een manier om een virtuele werkelijkheid te creëren die anders is dan wat je in een echt gebouw ziet.
60
+ Linguïstische relativiteit betekent dat de taal die we spreken invloed heeft op hoe we de wereld zien en begrijpen.
61
+ Hoe iemand eruitziet, hangt af van hun genen en omgeving.
62
+ Het placebo-effect is wanneer mensen een nepmedicijn gebruiken dat geen actieve ingrediënten bevat.
63
+ De cognitieve dissonantietheorie zegt dat mensen geneigd zijn om dingen te veranderen of minder vaak te doen om een harmonieus gevoel te behouden.
64
+ De begrippen individualisme en collectivisme worden gebruikt om te beschrijven of culturen zich richten op het verkrijgen van persoonlijke vrijheid of op het onderhouden van goede relaties met anderen.
65
+ De betekenis van de apocalyptische voorspellingen was voor de meeste mensen niet goed te begrijpen.
66
+ Het is niet goed om te zeggen dat het altijd zo is geweest en dat het daarom zo zal blijven.
67
+ Mensen maken de aarde warmer door het verbranden van fossiele brandstoffen en het kappen van bossen.
68
+ Hoewel de informatie in de rapporten duidelijk is, wordt de analyse van de gegevens beschermd door strenge methoden en analyses.
69
+ De manier waarop de werknemers met hun baas praatten en omgingen, was heel goed.
70
+ Het is interessant dat de discussie over klimaatverandering is afgenomen sinds de COVID-19-pandemie.
71
+ Kwantumverstrengeling betekent dat twee deeltjes met elkaar verbonden zijn op een manier waarbij de toestand van het ene deeltje afhangt van de toestand van het andere deeltje, zelfs als ze ver uit elkaar zijn.
72
+ We hebben het protocol niet goed begrepen en hebben slechte resultaten in ons experimenten.
73
+ Bij een moeilijke taak zijn er soms menselijke fouten.
74
+ Omdat het universum zo groot is en het zich steeds uitbreidt, is het moeilijk om te begrijpen hoe het universum steeds groter wordt.
75
+ Als twee deeltjes met elkaar verbonden zijn, beïnvloedt de toestand van het ene deeltje direct de toestand van het andere, zelfs als ze ver uit elkaar zijn.
76
+ Kwantumverstrengeling gaat over hele kleine deeltjes en hoe ze met elkaar omgaan, en het heeft veel invloed op technologieën en toepassingen, zoals quantumcomputers en cryptografie.
77
+ Onze hersenen zijn een ingewikkeld apparaat dat zorgt voor dingen als zien, horen, praten en emoties.
78
+ Het is duidelijk dat mensen verschillen in hun denkvermogen.
79
+ Cognitieve dissonantie is wanneer je niet goed begrijpt wat iemand doet en wat hij of zij doet.
80
+ Het is belangrijk om dit onderwerp goed te kennen.
81
+ Existentiale angst kan ontstaan als je je bewust bent van de zinloosheid of het gebrek aan betekenis in je leven.
82
+ Het is lastig om te begrijpen hoe onze hersenen werken en hoe we ons gedrag beïnvloeden omdat het erg ingewikkeld is.
83
+ Omdat de rente momenteel laag is, kun je overwegen om de rente langer vast te houden om te profiteren van de lage rente.
84
+ Quantumverstrengeling betekent dat twee of meer deeltjes zo verbonden zijn dat de toestand van het ene deeltje afhangt van de toestand van het andere deeltje, zelfs als ze ver uit elkaar zijn.
85
+ Een moeilijke taak kost meer tijd om te voltooien.
86
+ De som van de economische groei van de BRICS-landen is hoger dan de som van de S&P 500-index en de Amerikaanse dollar.
87
+ Door klimaatverandering worden het steeds warmere weer zoals overstromingen, droogtes en hittegolven.
88
+ Er zijn al verschillende politieke partijen die het eens zijn over de zaak, ook al weten we nog niet precies wat de rechter gaat beslissen.
89
+ Het is duidelijk dat de plannen om de economie te veranderen in de regio veel invloed zullen hebben op de werkgelegenheid en inkomens van de mensen.
90
+ De tekst was verwarrend omdat de woorden niet goed in elkaar zaten en de zinsopbouw niet goed was.
91
+ De onderzoekers dachten dat als ze meer van het medicijn in hun bloed hadden, het beter zou werken.
92
+ Het bloed circuleert door het lichaam en de hormonen die door de endocriene klieren worden geproduceerd.
93
+ De wetenschappelijke methode werkt met een logische redenatie die gebaseerd is op een bepaalde hypothetische gedachte.
94
+ De meeste mensen begrijpen niet de ingewikkelde filosofieën van de metaforen realiteit.
95
+ Het utilitarisme zegt dat het belangrijk is om zoveel mogelijk geluk te hebben voor de meeste mensen.
96
+ Als er maar één soort mensen werkt bij een bedrijf, kunnen sommige mensen zich buitengesloten voelen en andere mensen juist belangrijk vinden.
97
+ Om dit probleem op te lossen, moet je veel weten over algebraïsche structuren en getaltheorie.
98
+ Hoe ingewikkeld de realiteit is, hangt af van hoe goed je hersenen werken en hoe goed je nadenkt.
99
+ Door verschillende expertises te combineren, hebben we het probleem beter kunnen begrijpen.
100
+ Het is belangrijk dat we een plan maken om de strategie uit te voeren.
101
+ We hebben onderzocht hoe alcoholgebruik bij oudere mannen invloed kan hebben op hoe slim ze zijn.
102
+ Bij de onomasiologische omschrijving wordt een woord vervangen door een omschrijving van wat het betekent.
103
+ Deze studie gaat over verschillende aspecten van identiteit.
104
+ Als verschillende groepen binnen een bedrijf samenwerken, kan het soms problemen veroorzaken die we niet hadden verwacht.
105
+ Als de gegevens niet regelmatig veranderen, is de analyse minder betrouwbaar.
106
+ Het menselijk brein is erg ingewikkeld, daarom begrijpen we niet helemaal hoe het werkt.
107
+ Omdat taalverwerving ingewikkeld is, kunnen we verschillende manieren van denken en begrijpen gebruiken die helpen bij het begrijpen van de taal.
108
+ De relativiteitstheorie gaat over hoe snel het licht gaat als je beweegt, en dat dit afhankelijk is van hoe je beweegt.
109
+ Om te begrijpen wat kunstvoorwerpen betekenen, moeten we kijken naar wat ze waard zijn en naar de geschiedenis van de kunstvoorwerpen.
110
+ Het is moeilijk om te voorspellen welke planten en dieren zich voortplanten vanwege de complexiteit van het ecosysteem.
111
+ De groei van zenuwcellen in de hippocampus wordt beïnvloed door dingen die in de hersenen gebeuren.
112
+ De kwantumfysica legt uit hoe hele kleine deeltjes zich gedragen en wordt uitgelegd met ingewikkelde rekensommen.
113
+ Als je te veel dingen tegelijk doet, word je moe in je hoofd en ga je slechter presteren.
114
+ Het is niet altijd goed om te voorspellen wat er gaat gebeuren door de geluidsintensiteit van het gesteente.
115
+ De technologieën die we tegenwoordig gebruiken zijn erg ingewikkeld en kunnen ons moeilijk helpen om ze te begrijpen en te beheersen.
116
+ Met een microscoop kan je de vorm van de deeltjes in de vloeistof bekijken.
117
+ Voordat we conclusies trekken, moeten we bespreken wat er aan de hand is.
118
+ Het is belangrijk dat we verschillende manieren van werken gebruiken om duurzame ontwikkeling te bereiken.
119
+ Het corpus callosum is een stof die de twee hersenhelften met elkaar verbindt en zorgt dat ze met elkaar kunnen praten.
120
+ De kwantummechanica is moeilijk te begrijpen voor de meeste mensen omdat het een ingewikkeld idee is.
121
+ Het is belangrijk om te bedenken hoe een uitdrukking gebruikt wordt in verschillende situaties.
122
+ Het sublimeren van een fysieke substantie gebeurt door de overgang van de vaste fase naar de gasvormige fase, zonder dat de substantie eerst smelt om een vloeibare fase te creëren.
123
+ Het is lastig om te begrijpen hoe verschillende dingen invloed hebben op elkaar.
124
+ Het dialect is anders dan de standaardtaal.
125
+ Als het voertuig onvoorspelbaar is, kunnen de passagiers de nooduitgangen gebruiken die aan weerszijden van het voertuig zijn.
126
+ Om het onderzoek goed te laten verlopen, moeten deskundigen uit verschillende vakgebieden samenwerken.
127
+ De theorie dat genetisch materiaal invloed heeft op welke eigenschappen iemand heeft, wordt ondersteund door de experimentele resultaten.
128
+ Taalkennis kan worden opgedaan door het opdoen van ervaringen met taal in verschillende situaties.
generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "decoder_start_token_id": 0,
4
+ "eos_token_id": 1,
5
+ "pad_token_id": 0,
6
+ "transformers_version": "4.29.2"
7
+ }
pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:b22209aeb7d67666bf7a5973396e584fd8351fbe61d6a22ba1cbd5e76036182b
3
+ size 990408885
special_tokens_map.json ADDED
@@ -0,0 +1,107 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "additional_special_tokens": [
3
+ "<extra_id_0>",
4
+ "<extra_id_1>",
5
+ "<extra_id_2>",
6
+ "<extra_id_3>",
7
+ "<extra_id_4>",
8
+ "<extra_id_5>",
9
+ "<extra_id_6>",
10
+ "<extra_id_7>",
11
+ "<extra_id_8>",
12
+ "<extra_id_9>",
13
+ "<extra_id_10>",
14
+ "<extra_id_11>",
15
+ "<extra_id_12>",
16
+ "<extra_id_13>",
17
+ "<extra_id_14>",
18
+ "<extra_id_15>",
19
+ "<extra_id_16>",
20
+ "<extra_id_17>",
21
+ "<extra_id_18>",
22
+ "<extra_id_19>",
23
+ "<extra_id_20>",
24
+ "<extra_id_21>",
25
+ "<extra_id_22>",
26
+ "<extra_id_23>",
27
+ "<extra_id_24>",
28
+ "<extra_id_25>",
29
+ "<extra_id_26>",
30
+ "<extra_id_27>",
31
+ "<extra_id_28>",
32
+ "<extra_id_29>",
33
+ "<extra_id_30>",
34
+ "<extra_id_31>",
35
+ "<extra_id_32>",
36
+ "<extra_id_33>",
37
+ "<extra_id_34>",
38
+ "<extra_id_35>",
39
+ "<extra_id_36>",
40
+ "<extra_id_37>",
41
+ "<extra_id_38>",
42
+ "<extra_id_39>",
43
+ "<extra_id_40>",
44
+ "<extra_id_41>",
45
+ "<extra_id_42>",
46
+ "<extra_id_43>",
47
+ "<extra_id_44>",
48
+ "<extra_id_45>",
49
+ "<extra_id_46>",
50
+ "<extra_id_47>",
51
+ "<extra_id_48>",
52
+ "<extra_id_49>",
53
+ "<extra_id_50>",
54
+ "<extra_id_51>",
55
+ "<extra_id_52>",
56
+ "<extra_id_53>",
57
+ "<extra_id_54>",
58
+ "<extra_id_55>",
59
+ "<extra_id_56>",
60
+ "<extra_id_57>",
61
+ "<extra_id_58>",
62
+ "<extra_id_59>",
63
+ "<extra_id_60>",
64
+ "<extra_id_61>",
65
+ "<extra_id_62>",
66
+ "<extra_id_63>",
67
+ "<extra_id_64>",
68
+ "<extra_id_65>",
69
+ "<extra_id_66>",
70
+ "<extra_id_67>",
71
+ "<extra_id_68>",
72
+ "<extra_id_69>",
73
+ "<extra_id_70>",
74
+ "<extra_id_71>",
75
+ "<extra_id_72>",
76
+ "<extra_id_73>",
77
+ "<extra_id_74>",
78
+ "<extra_id_75>",
79
+ "<extra_id_76>",
80
+ "<extra_id_77>",
81
+ "<extra_id_78>",
82
+ "<extra_id_79>",
83
+ "<extra_id_80>",
84
+ "<extra_id_81>",
85
+ "<extra_id_82>",
86
+ "<extra_id_83>",
87
+ "<extra_id_84>",
88
+ "<extra_id_85>",
89
+ "<extra_id_86>",
90
+ "<extra_id_87>",
91
+ "<extra_id_88>",
92
+ "<extra_id_89>",
93
+ "<extra_id_90>",
94
+ "<extra_id_91>",
95
+ "<extra_id_92>",
96
+ "<extra_id_93>",
97
+ "<extra_id_94>",
98
+ "<extra_id_95>",
99
+ "<extra_id_96>",
100
+ "<extra_id_97>",
101
+ "<extra_id_98>",
102
+ "<extra_id_99>"
103
+ ],
104
+ "eos_token": "</s>",
105
+ "pad_token": "<pad>",
106
+ "unk_token": "<unk>"
107
+ }
spiece.model ADDED
@@ -0,0 +1,3 @@
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:caa6e2f21aeec181276ab80273e3f869ce303ccb8602d68e0524783c3581092d
3
+ size 800223
tokenizer_config.json ADDED
@@ -0,0 +1,113 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "additional_special_tokens": [
3
+ "<extra_id_0>",
4
+ "<extra_id_1>",
5
+ "<extra_id_2>",
6
+ "<extra_id_3>",
7
+ "<extra_id_4>",
8
+ "<extra_id_5>",
9
+ "<extra_id_6>",
10
+ "<extra_id_7>",
11
+ "<extra_id_8>",
12
+ "<extra_id_9>",
13
+ "<extra_id_10>",
14
+ "<extra_id_11>",
15
+ "<extra_id_12>",
16
+ "<extra_id_13>",
17
+ "<extra_id_14>",
18
+ "<extra_id_15>",
19
+ "<extra_id_16>",
20
+ "<extra_id_17>",
21
+ "<extra_id_18>",
22
+ "<extra_id_19>",
23
+ "<extra_id_20>",
24
+ "<extra_id_21>",
25
+ "<extra_id_22>",
26
+ "<extra_id_23>",
27
+ "<extra_id_24>",
28
+ "<extra_id_25>",
29
+ "<extra_id_26>",
30
+ "<extra_id_27>",
31
+ "<extra_id_28>",
32
+ "<extra_id_29>",
33
+ "<extra_id_30>",
34
+ "<extra_id_31>",
35
+ "<extra_id_32>",
36
+ "<extra_id_33>",
37
+ "<extra_id_34>",
38
+ "<extra_id_35>",
39
+ "<extra_id_36>",
40
+ "<extra_id_37>",
41
+ "<extra_id_38>",
42
+ "<extra_id_39>",
43
+ "<extra_id_40>",
44
+ "<extra_id_41>",
45
+ "<extra_id_42>",
46
+ "<extra_id_43>",
47
+ "<extra_id_44>",
48
+ "<extra_id_45>",
49
+ "<extra_id_46>",
50
+ "<extra_id_47>",
51
+ "<extra_id_48>",
52
+ "<extra_id_49>",
53
+ "<extra_id_50>",
54
+ "<extra_id_51>",
55
+ "<extra_id_52>",
56
+ "<extra_id_53>",
57
+ "<extra_id_54>",
58
+ "<extra_id_55>",
59
+ "<extra_id_56>",
60
+ "<extra_id_57>",
61
+ "<extra_id_58>",
62
+ "<extra_id_59>",
63
+ "<extra_id_60>",
64
+ "<extra_id_61>",
65
+ "<extra_id_62>",
66
+ "<extra_id_63>",
67
+ "<extra_id_64>",
68
+ "<extra_id_65>",
69
+ "<extra_id_66>",
70
+ "<extra_id_67>",
71
+ "<extra_id_68>",
72
+ "<extra_id_69>",
73
+ "<extra_id_70>",
74
+ "<extra_id_71>",
75
+ "<extra_id_72>",
76
+ "<extra_id_73>",
77
+ "<extra_id_74>",
78
+ "<extra_id_75>",
79
+ "<extra_id_76>",
80
+ "<extra_id_77>",
81
+ "<extra_id_78>",
82
+ "<extra_id_79>",
83
+ "<extra_id_80>",
84
+ "<extra_id_81>",
85
+ "<extra_id_82>",
86
+ "<extra_id_83>",
87
+ "<extra_id_84>",
88
+ "<extra_id_85>",
89
+ "<extra_id_86>",
90
+ "<extra_id_87>",
91
+ "<extra_id_88>",
92
+ "<extra_id_89>",
93
+ "<extra_id_90>",
94
+ "<extra_id_91>",
95
+ "<extra_id_92>",
96
+ "<extra_id_93>",
97
+ "<extra_id_94>",
98
+ "<extra_id_95>",
99
+ "<extra_id_96>",
100
+ "<extra_id_97>",
101
+ "<extra_id_98>",
102
+ "<extra_id_99>"
103
+ ],
104
+ "clean_up_tokenization_spaces": true,
105
+ "eos_token": "</s>",
106
+ "extra_ids": 100,
107
+ "model_max_length": 1000000000000000019884624838656,
108
+ "pad_token": "<pad>",
109
+ "sp_model_kwargs": {},
110
+ "tokenizer_class": "T5Tokenizer",
111
+ "unk_token": "<unk>",
112
+ "use_fast_tokenizer": false
113
+ }