jcmc commited on
Commit
0e735fe
1 Parent(s): cee3305

Upload eval.py

Browse files
.ipynb_checkpoints/eval-checkpoint.py ADDED
@@ -0,0 +1,137 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ #!/usr/bin/env python3
2
+ import argparse
3
+ import re
4
+ from typing import Dict
5
+
6
+ import torch
7
+ from datasets import Audio, Dataset, load_dataset, load_metric
8
+
9
+ from transformers import AutoFeatureExtractor, pipeline
10
+
11
+
12
+ def log_results(result: Dataset, args: Dict[str, str]):
13
+ """DO NOT CHANGE. This function computes and logs the result metrics."""
14
+
15
+ log_outputs = args.log_outputs
16
+ dataset_id = "_".join(args.dataset.split("/") + [args.config, args.split])
17
+
18
+ # load metric
19
+ wer = load_metric("wer")
20
+ cer = load_metric("cer")
21
+
22
+ # compute metrics
23
+ wer_result = wer.compute(references=result["target"], predictions=result["prediction"])
24
+ cer_result = cer.compute(references=result["target"], predictions=result["prediction"])
25
+
26
+ # print & log results
27
+ result_str = f"WER: {wer_result}\n" f"CER: {cer_result}"
28
+ print(result_str)
29
+
30
+ with open(f"{dataset_id}_eval_results.txt", "w") as f:
31
+ f.write(result_str)
32
+
33
+ # log all results in text file. Possibly interesting for analysis
34
+ if log_outputs is not None:
35
+ pred_file = f"log_{dataset_id}_predictions.txt"
36
+ target_file = f"log_{dataset_id}_targets.txt"
37
+
38
+ with open(pred_file, "w") as p, open(target_file, "w") as t:
39
+
40
+ # mapping function to write output
41
+ def write_to_file(batch, i):
42
+ p.write(f"{i}" + "\n")
43
+ p.write(batch["prediction"] + "\n")
44
+ t.write(f"{i}" + "\n")
45
+ t.write(batch["target"] + "\n")
46
+
47
+ result.map(write_to_file, with_indices=True)
48
+
49
+
50
+ def normalize_text(text: str) -> str:
51
+ """DO ADAPT FOR YOUR USE CASE. this function normalizes the target text."""
52
+
53
+ chars_to_ignore_regex = '[,?.!\-\;\:"“%‘”�—’…–]' # noqa: W605 IMPORTANT: this should correspond to the chars that were ignored during training
54
+
55
+ text = re.sub(chars_to_ignore_regex, "", text.lower())
56
+
57
+ # In addition, we can normalize the target text, e.g. removing new lines characters etc...
58
+ # note that order is important here!
59
+ token_sequences_to_ignore = ["\n\n", "\n", " ", " "]
60
+
61
+ for t in token_sequences_to_ignore:
62
+ text = " ".join(text.split(t))
63
+
64
+ return text
65
+
66
+
67
+ def main(args):
68
+ # load dataset
69
+ dataset = load_dataset(args.dataset, args.config, split=args.split, use_auth_token=True)
70
+
71
+ # for testing: only process the first two examples as a test
72
+ # dataset = dataset.select(range(10))
73
+
74
+ # load processor
75
+ feature_extractor = AutoFeatureExtractor.from_pretrained(args.model_id)
76
+ sampling_rate = feature_extractor.sampling_rate
77
+
78
+ # resample audio
79
+ dataset = dataset.cast_column("audio", Audio(sampling_rate=sampling_rate))
80
+
81
+ # load eval pipeline
82
+ if args.device is None:
83
+ args.device = 0 if torch.cuda.is_available() else -1
84
+ asr = pipeline("automatic-speech-recognition", model=args.model_id, device=args.device)
85
+
86
+ # map function to decode audio
87
+ def map_to_pred(batch):
88
+ prediction = asr(
89
+ batch["audio"]["array"], chunk_length_s=args.chunk_length_s, stride_length_s=args.stride_length_s
90
+ )
91
+
92
+ batch["prediction"] = prediction["text"]
93
+ batch["target"] = normalize_text(batch["sentence"])
94
+ return batch
95
+
96
+ # run inference on all examples
97
+ result = dataset.map(map_to_pred, remove_columns=dataset.column_names)
98
+
99
+ # compute and log_results
100
+ # do not change function below
101
+ log_results(result, args)
102
+
103
+
104
+ if __name__ == "__main__":
105
+ parser = argparse.ArgumentParser()
106
+
107
+ parser.add_argument(
108
+ "--model_id", type=str, required=True, help="Model identifier. Should be loadable with 🤗 Transformers"
109
+ )
110
+ parser.add_argument(
111
+ "--dataset",
112
+ type=str,
113
+ required=True,
114
+ help="Dataset name to evaluate the `model_id`. Should be loadable with 🤗 Datasets",
115
+ )
116
+ parser.add_argument(
117
+ "--config", type=str, required=True, help="Config of the dataset. *E.g.* `'en'` for Common Voice"
118
+ )
119
+ parser.add_argument("--split", type=str, required=True, help="Split of the dataset. *E.g.* `'test'`")
120
+ parser.add_argument(
121
+ "--chunk_length_s", type=float, default=None, help="Chunk length in seconds. Defaults to 5 seconds."
122
+ )
123
+ parser.add_argument(
124
+ "--stride_length_s", type=float, default=None, help="Stride of the audio chunks. Defaults to 1 second."
125
+ )
126
+ parser.add_argument(
127
+ "--log_outputs", action="store_true", help="If defined, write outputs to log file for analysis."
128
+ )
129
+ parser.add_argument(
130
+ "--device",
131
+ type=int,
132
+ default=None,
133
+ help="The device to run the pipeline on. -1 for CPU (default), 0 for the first GPU and so on.",
134
+ )
135
+ args = parser.parse_args()
136
+
137
+ main(args)
.ipynb_checkpoints/mozilla-foundation_common_voice_7_0_ga-IE_test_eval_results-checkpoint.txt ADDED
@@ -0,0 +1,2 @@
 
 
 
1
+ WER: 0.39103690685413006
2
+ CER: 0.16464767104589662
eval.py ADDED
@@ -0,0 +1,137 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ #!/usr/bin/env python3
2
+ import argparse
3
+ import re
4
+ from typing import Dict
5
+
6
+ import torch
7
+ from datasets import Audio, Dataset, load_dataset, load_metric
8
+
9
+ from transformers import AutoFeatureExtractor, pipeline
10
+
11
+
12
+ def log_results(result: Dataset, args: Dict[str, str]):
13
+ """DO NOT CHANGE. This function computes and logs the result metrics."""
14
+
15
+ log_outputs = args.log_outputs
16
+ dataset_id = "_".join(args.dataset.split("/") + [args.config, args.split])
17
+
18
+ # load metric
19
+ wer = load_metric("wer")
20
+ cer = load_metric("cer")
21
+
22
+ # compute metrics
23
+ wer_result = wer.compute(references=result["target"], predictions=result["prediction"])
24
+ cer_result = cer.compute(references=result["target"], predictions=result["prediction"])
25
+
26
+ # print & log results
27
+ result_str = f"WER: {wer_result}\n" f"CER: {cer_result}"
28
+ print(result_str)
29
+
30
+ with open(f"{dataset_id}_eval_results.txt", "w") as f:
31
+ f.write(result_str)
32
+
33
+ # log all results in text file. Possibly interesting for analysis
34
+ if log_outputs is not None:
35
+ pred_file = f"log_{dataset_id}_predictions.txt"
36
+ target_file = f"log_{dataset_id}_targets.txt"
37
+
38
+ with open(pred_file, "w") as p, open(target_file, "w") as t:
39
+
40
+ # mapping function to write output
41
+ def write_to_file(batch, i):
42
+ p.write(f"{i}" + "\n")
43
+ p.write(batch["prediction"] + "\n")
44
+ t.write(f"{i}" + "\n")
45
+ t.write(batch["target"] + "\n")
46
+
47
+ result.map(write_to_file, with_indices=True)
48
+
49
+
50
+ def normalize_text(text: str) -> str:
51
+ """DO ADAPT FOR YOUR USE CASE. this function normalizes the target text."""
52
+
53
+ chars_to_ignore_regex = '[,?.!\-\;\:"“%‘”�—’…–]' # noqa: W605 IMPORTANT: this should correspond to the chars that were ignored during training
54
+
55
+ text = re.sub(chars_to_ignore_regex, "", text.lower())
56
+
57
+ # In addition, we can normalize the target text, e.g. removing new lines characters etc...
58
+ # note that order is important here!
59
+ token_sequences_to_ignore = ["\n\n", "\n", " ", " "]
60
+
61
+ for t in token_sequences_to_ignore:
62
+ text = " ".join(text.split(t))
63
+
64
+ return text
65
+
66
+
67
+ def main(args):
68
+ # load dataset
69
+ dataset = load_dataset(args.dataset, args.config, split=args.split, use_auth_token=True)
70
+
71
+ # for testing: only process the first two examples as a test
72
+ # dataset = dataset.select(range(10))
73
+
74
+ # load processor
75
+ feature_extractor = AutoFeatureExtractor.from_pretrained(args.model_id)
76
+ sampling_rate = feature_extractor.sampling_rate
77
+
78
+ # resample audio
79
+ dataset = dataset.cast_column("audio", Audio(sampling_rate=sampling_rate))
80
+
81
+ # load eval pipeline
82
+ if args.device is None:
83
+ args.device = 0 if torch.cuda.is_available() else -1
84
+ asr = pipeline("automatic-speech-recognition", model=args.model_id, device=args.device)
85
+
86
+ # map function to decode audio
87
+ def map_to_pred(batch):
88
+ prediction = asr(
89
+ batch["audio"]["array"], chunk_length_s=args.chunk_length_s, stride_length_s=args.stride_length_s
90
+ )
91
+
92
+ batch["prediction"] = prediction["text"]
93
+ batch["target"] = normalize_text(batch["sentence"])
94
+ return batch
95
+
96
+ # run inference on all examples
97
+ result = dataset.map(map_to_pred, remove_columns=dataset.column_names)
98
+
99
+ # compute and log_results
100
+ # do not change function below
101
+ log_results(result, args)
102
+
103
+
104
+ if __name__ == "__main__":
105
+ parser = argparse.ArgumentParser()
106
+
107
+ parser.add_argument(
108
+ "--model_id", type=str, required=True, help="Model identifier. Should be loadable with 🤗 Transformers"
109
+ )
110
+ parser.add_argument(
111
+ "--dataset",
112
+ type=str,
113
+ required=True,
114
+ help="Dataset name to evaluate the `model_id`. Should be loadable with 🤗 Datasets",
115
+ )
116
+ parser.add_argument(
117
+ "--config", type=str, required=True, help="Config of the dataset. *E.g.* `'en'` for Common Voice"
118
+ )
119
+ parser.add_argument("--split", type=str, required=True, help="Split of the dataset. *E.g.* `'test'`")
120
+ parser.add_argument(
121
+ "--chunk_length_s", type=float, default=None, help="Chunk length in seconds. Defaults to 5 seconds."
122
+ )
123
+ parser.add_argument(
124
+ "--stride_length_s", type=float, default=None, help="Stride of the audio chunks. Defaults to 1 second."
125
+ )
126
+ parser.add_argument(
127
+ "--log_outputs", action="store_true", help="If defined, write outputs to log file for analysis."
128
+ )
129
+ parser.add_argument(
130
+ "--device",
131
+ type=int,
132
+ default=None,
133
+ help="The device to run the pipeline on. -1 for CPU (default), 0 for the first GPU and so on.",
134
+ )
135
+ args = parser.parse_args()
136
+
137
+ main(args)
log_mozilla-foundation_common_voice_7_0_ga-IE_test_predictions.txt ADDED
@@ -0,0 +1,1018 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ ní bhíonn aon bhlas ar iasc gan sáin
3
+ 1
4
+ donn an chlán ar fad a chéile
5
+ 2
6
+ corainn na breataine
7
+ 3
8
+ bí an long ag fácht is chuma ar bord lárach
9
+ 4
10
+ an chéadín
11
+ 5
12
+ chéid an ritear nadóg agus chríochta an caite ar chóscóir
13
+ 6
14
+ ní bhur mar faiclennithe
15
+ 7
16
+ bhí an tarpórt dubh le daoine
17
+ 8
18
+ a ordmhéara agus a dhaoine uaisle
19
+ 9
20
+ aon seasca pionteálba an tuigdiom
21
+ 10
22
+ co dé cheann dar
23
+ 11
24
+ oscail í dhríotha ghrifead abhann
25
+ 12
26
+ ní raibh beairle ag locht a dhéanta
27
+ 13
28
+ sráid mhuir é air i rís
29
+ 14
30
+ is leor an dróilín a nead
31
+ 15
32
+ níor mhaith im a bheith ag beathair
33
+ 16
34
+ do chuimsé go leor don to maith é
35
+ 17
36
+ in éirinn
37
+ 18
38
+ troid ach laighn mbódar trí
39
+ 19
40
+ bíonn sí anseo is an siúd
41
+ 20
42
+ is an atá caintar fad le daonaid
43
+ 21
44
+ is mór an pléisiúr dom a bheith ais anseo a san bhanasca
45
+ 22
46
+ imir diarmud go maith sa chliáin
47
+ 23
48
+ tá sé tite bheo le copleabrianus
49
+ 24
50
+ diodhait
51
+ 25
52
+ ba mhór an tógann croí dhúin ar fad i
53
+ 26
54
+ bhí an ndáil sin loa
55
+ 27
56
+ lítear dóitaim
57
+ 28
58
+ ospaire a chlois den huscail i gailiadh
59
+ 29
60
+ ar dheis labh sé go raibh a anam dílis
61
+ 30
62
+ bhí na tonta i búlú i gcoinne na gcairgeathe
63
+ 31
64
+ tír ar aonchaim le gach tír eile ar den
65
+ 32
66
+ bhíodh go léir ag caint
67
+ 33
68
+ is fearr coince bhris den ón par le ciste
69
+ 34
70
+ an bhreasíúil
71
+ 35
72
+ is mór an pléisiúir dom a bheith anseo lia i bríosún bhunseol
73
+ 36
74
+ dochta risteord do hindebearc
75
+ 37
76
+ níl ach tá peann an fóc aige
77
+ 38
78
+ a phribhléid mhór ghomsabhad ranforsadh slim ríthábhachtach seo
79
+ 39
80
+ óráid an uachsaráin i gaeilscoilí choileáin
81
+ 40
82
+ to stádas aici mór thangafh gileoghuis oibre an aontasorpeach
83
+ 41
84
+ éirí chur a spánt san fhuinneoig
85
+ 42
86
+ tá antábhacht ag baint leis an stair mar ábhair scoile agus mar bhunchloch don todhchaí
87
+ 43
88
+ na daoine dá dagraítear sanolt
89
+ 44
90
+ tá lá is troca i mí na nollaigh
91
+ 45
92
+ agus thug sé a chúlair go mícheadadht agus dimisé
93
+ 46
94
+ sé bhri maitha eile
95
+ 47
96
+ tréaslaíom leis na hagrthoirí agus leis na starrtha uilig
97
+ 48
98
+ tá an chaithaoir mhór ag an doras agus tá an chathair bheag ag an bhfuinneog
99
+ 49
100
+ an bhfuil cóta mór ort
101
+ 50
102
+ an grád mí chomais
103
+ 51
104
+ thosí an cruinneadh araib dath a chlog
105
+ 52
106
+ níl sé ó láidir leis an bhfear
107
+ 53
108
+ ceird bliana
109
+ 54
110
+ is buí ata uaim
111
+ 55
112
+ laigí fada atá bhuain
113
+ 56
114
+ agus a hairde gal
115
+ 57
116
+ tá fíor shon fáilte romhaibh ar fad go baile cliath agus go héireann
117
+ 58
118
+ fréamh charnach a naoi sin a trí
119
+ 59
120
+ tá na leabhairth go léir ar an mbord
121
+ 60
122
+ an ceathrú acht déag
123
+ 61
124
+ go raibh maith agaibh go léir
125
+ 62
126
+ tréaslaíom sibh as bhur gcarthanochas agus as bhur sa anacht
127
+ 63
128
+ a cúig a chlog
129
+ 64
130
+ a dcoitheim sa lá
131
+ 65
132
+ don na chlaib
133
+ 66
134
+ comórtas na malte slachthur a suparbheiliú gá mhíle a seacht déag
135
+ 67
136
+ ar an drochoir níor oiréig leis an phlean a bhí acu agus gabhadh mac aspainn
137
+ 68
138
+ níl a máthair anseo
139
+ 69
140
+ a airí a sheachtaí dála a sheanadóirí a dhaoine uaisle a chairde gael
141
+ 70
142
+ a gcuid san eolais
143
+ 71
144
+ tá dúilgas agus ról againn ar fad sondíorcht seo
145
+ 72
146
+ an bhfuil a mróga ar na buachaillí
147
+ 73
148
+ is liom a dhuine uasil
149
+ 74
150
+ tá fíor chaoin fáilte romhaibh ar fad thuig áras in ugctráin inniu
151
+ 75
152
+ aráigh líon mar sin go díon príomhchúis a bhfuil mais anseo inniu
153
+ 76
154
+ ní ga héasca a huirlis é
155
+ 77
156
+ a aon oirirce a mhisinéirí a dhaoine huaisle agus a dhaoine córa ar fad
157
+ 78
158
+ tá a dhuine uasail
159
+ 79
160
+ an é sin tmást
161
+ 80
162
+ is iontach an rud í gach teanga
163
+ 81
164
+ agus dhaoineoga agus dhaltaí scoil é aibitháirithe
165
+ 82
166
+ an inite
167
+ 83
168
+ mo hoc féin
169
+ 84
170
+ bhí an gathar ina naoi
171
+ 85
172
+ ar an lámh
173
+ 86
174
+ tá seán chomh mór leiséamas
175
+ 87
176
+ is é cuireann túthól an sliabh is airde in éireann
177
+ 88
178
+ cad é an sliabh is airde ar domhan
179
+ 89
180
+ a íona uile agus dhaoinioga octhoiridhe
181
+ 90
182
+ nach mór atá pól
183
+ 91
184
+ a dó a chlog
185
+ 92
186
+ an bhfuil grá agat dom
187
+ 93
188
+ an raibh aon tae agat
189
+ 94
190
+ bhfuair mé an ghal mhó sin
191
+ 95
192
+ cén bhrí atá leis a maith
193
+ 96
194
+ tááthas orm bheith libh ar fear anseo
195
+ 97
196
+ cá méid sí ar an mbaraig
197
+ 98
198
+ le high na scroibneorcta ifigceola
199
+ 99
200
+ cá bhfuil an leabhar dubh a mhair
201
+ 100
202
+ bainigí soilt as an cuid éire den leo
203
+ 101
204
+ laoinmist orainn mar phobal ag saorúna poblachta agus ag síorú na gaeilge
205
+ 102
206
+ aiscí
207
+ 103
208
+ ainm
209
+ 104
210
+ is cuid leathair dár nord iad na hoileáin amach ó chósta na tíre seo
211
+ 105
212
+ ar an mhór mé
213
+ 106
214
+ ná créid a bheici tú
215
+ 107
216
+ is críoch iontach í an ceol choirm seo ar lá iontach gceathair thaisce
217
+ 108
218
+ an bhfuil aon ghram feor aige
219
+ 109
220
+ is í an ná seo in or chríoch is mó ar domhan
221
+ 110
222
+ teac an tagairt
223
+ 111
224
+ cá bhfuil an ghrian
225
+ 112
226
+ is mású bál beo ná mara
227
+ 113
228
+ tháinig sé leis an bhfear
229
+ 114
230
+ an bhfuil bhur leabhair agaibh go léir a bhuichlaí
231
+ 115
232
+ cur na leabhar sá ar an mbord
233
+ 116
234
+ oráid an uachtaráin ag bronnadh gradam chomrsáide an reachtais dhá mhíle a sé déag
235
+ 117
236
+ an choirt a thugann braon agus cóleannaineachas don niomlán
237
+ 118
238
+ tosú an bhfuil sibhag baint taitneamh as an leath
239
+ 119
240
+ thig á sin go tí ar nóg
241
+ 120
242
+ tur cabhair don oireann
243
+ 121
244
+ tá mé an bhíodh díobh sé go léir freisin as an fíorchaoin fáilte a deairsibh róil
245
+ 122
246
+ tá fáilte raibh go léir chuig áras an uachtaráin tráthnóna
247
+ 123
248
+ an éadáil
249
+ 124
250
+ an leabhar sin
251
+ 125
252
+ sin é duine uasail
253
+ 126
254
+ diobhúin
255
+ 127
256
+ tá a bhean uasal tut sé faoin mbord
257
+ 128
258
+ léiriú agus a dráin
259
+ 129
260
+ is fearr bthán buamhear nó caisleón gcorsag
261
+ 130
262
+ ó ghaltaí scoil air
263
+ 131
264
+ an bhfuil chta oirchaigh
265
+ 132
266
+ an gcarsúin laidar
267
+ 133
268
+ gorabhmaith agaibh as ucht a fáilte cinialtaith
269
+ 134
270
+ cá raibh sé
271
+ 135
272
+ air siad an locht
273
+ 136
274
+ i né a chíle a thógtar na ceaislain
275
+ 137
276
+ is mór an pléisiúr tú é an chúrthoil tábhachtach seo a sheolaigh
277
+ 138
278
+ a ceathair déag dmhícheth
279
+ 139
280
+ aichnainn de saghas a bhí á
281
+ 140
282
+ acht ón airactas
283
+ 141
284
+ nuair airí ar ad píosa oilinne a shainmhíni doirt sé
285
+ 142
286
+ tááthas orm shin agus ar haidhmhín go bhfuil sibh inár gcoludear
287
+ 143
288
+ ceapann sé anois go leis shin an dá cheann cuig
289
+ 144
290
+ a dó dhéag de mhíithe
291
+ 145
292
+ tá áthas orm a bheith mhéar fad anseo inniu
293
+ 146
294
+ ní hé lán gutha lán scod
295
+ 147
296
+ is mór an cholaint éadon dlí agus déiraini gcoitínn
297
+ 148
298
+ is mór an pléisiúr don a bheith anseo arís inniu
299
+ 149
300
+ chathaoirligh agus da dhaoine uaisle go léir
301
+ 150
302
+ an leabhar bán
303
+ 151
304
+ tá seasmhacht ag baint le saothair agus oihrocht edird do léoini
305
+ 152
306
+ an rabrdar go léir ag obair
307
+ 153
308
+ agus cad é an dath atá air
309
+ 154
310
+ caoi le caol agus leathann len leathan
311
+ 155
312
+ doibrigh daoine a slámh a chéile
313
+ 156
314
+ níl aon leabhar ag an doras ac tá leabhar ar an mbord
315
+ 157
316
+ ceacht a de
317
+ 158
318
+ ar an mbala
319
+ 159
320
+ bíonn súil le more ach ní bhíonn súil le tír
321
+ 160
322
+ tá áthas orm a bheith anseo in leabhair linn teastar bísí inocht
323
+ 161
324
+ ar an bróg
325
+ 162
326
+ an bhfuil an leabhar dearg ar an urlár a mhichíol
327
+ 163
328
+ go raibh míle maith agaibh agus beirgí libh mo fhanacht ó croí
329
+ 164
330
+ tainn sé leis rothaíocht faoin roinn brá
331
+ 165
332
+ cá bhfuil an mála dearg
333
+ 166
334
+ tá mo dhóthain aráin agam
335
+ 167
336
+ ní deas an rud é
337
+ 168
338
+ is maith an scáthán súl chairad
339
+ 169
340
+ óráid an uachtaráin ag comórtas peille na noileán dhá mhíle as sé déag
341
+ 170
342
+ ar an gcóta
343
+ 171
344
+ ní bheidh siad ní bheidh mhál ó murchú ar scoil amárach
345
+ 172
346
+ a choimisinéirí oifig na noibricea poiblí
347
+ 173
348
+ bíonn clúsa air na clathaca
349
+ 174
350
+ an cúigúbliain
351
+ 175
352
+ is é seo an fear
353
+ 176
354
+ a héin a chlog
355
+ 177
356
+ tá sé a ceathair a chlog
357
+ 178
358
+ tá fáilte agus fiche romhaibh ar fad anseo cuig áras an uachtarán
359
+ 179
360
+ ar an ordóg
361
+ 180
362
+ tá an mála buí ar an mbinse
363
+ 181
364
+ cad é an condé is mó in éirinn
365
+ 182
366
+ cá bhfuil sé inniu
367
+ 183
368
+ tá i mar mbisca
369
+ 184
370
+ tá muid go mbeidh
371
+ 185
372
+ mí an peata
373
+ 186
374
+ tús maith leath na hoibre
375
+ 187
376
+ brisean giall mo thine
377
+ 188
378
+ is bosca é seo
379
+ 189
380
+ tá an spéir ina chriathair
381
+ 190
382
+ nach raibh an dá leabhar aige inné
383
+ 191
384
+ agus nach breá an píosa déan scoth atá cnothaí aca
385
+ 192
386
+ tá seán ag an doras
387
+ 193
388
+ níaradhtas poill slaibh an céad
389
+ 194
390
+ aire mhoirá agus bog an cliabhán
391
+ 195
392
+ tá roinnt agaí taca ón naoltacht agus cuid el ón agaibh ón náltocht
393
+ 196
394
+ is lú é seo ná é siúd
395
+ 197
396
+ dún do leabhar anois
397
+ 198
398
+ tá a bhean uasail
399
+ 199
400
+ cailín deas don
401
+ 200
402
+ tad ag an hiarracht
403
+ 201
404
+ sé an taigéan ciúin an taigéan is mór donn
405
+ 202
406
+ do mhór
407
+ 203
408
+ ar an éadach
409
+ 204
410
+ ná ar cháil
411
+ 205
412
+ an bhfuil an chathaoir ag a tine a shíle
413
+ 206
414
+ túir g an bhean sin é
415
+ 207
416
+ níl aon cinn acaibh an sin
417
+ 208
418
+ na seamrog glas beag
419
+ 209
420
+ tá a dearfar sa bhaile
421
+ 210
422
+ cuid de na far
423
+ 211
424
+ ní bheidh si at
425
+ 212
426
+ am cinniúinach a bhíos na nóchidí i star ón chailecáin
427
+ 213
428
+ tá oscaid ghaoil agam leat
429
+ 214
430
+ an séú ceacht
431
+ 215
432
+ an ciste dearlaic
433
+ 216
434
+ a seacht a chlog
435
+ 217
436
+ mólanóige agus tioicisí
437
+ 218
438
+ ní fáil go haoir é
439
+ 219
440
+ tá a thathair anseo
441
+ 220
442
+ scaip séin a leabhair
443
+ 221
444
+ bhfuil aon ní ar an urlár
445
+ 222
446
+ cearca lár
447
+ 223
448
+ a ceathair na mairt sé é choda mar air
449
+ 224
450
+ a ard mhéara
451
+ 225
452
+ cead a tirim an t anois a bhriainn
453
+ 226
454
+ bhí sé beoir éigin
455
+ 227
456
+ mar sé an tarm i de seo hóga buleliubh
457
+ 228
458
+ é sin an taon chúis le giolgolaim dár nuige
459
+ 229
460
+ mona bhfuil timpeallacht sláintiúil an ní bheidh geilleagar sláintiúl ná sochaí sláintiúil an ach oirit
461
+ 230
462
+ an bhfuil a ghrátháir anseo i dhirmait
463
+ 231
464
+ páistí óga iad sin
465
+ 232
466
+ a cúig déag fiche ithe
467
+ 233
468
+ is mian le rá a ríst chomh mór is atáim as an tús seo fáil
469
+ 234
470
+ ní shá a dhuine uasail
471
+ 235
472
+ bhí sí ina suí ar an urlár a dí sin ag cardáil
473
+ 236
474
+ tá mé buíoch daoibh as an gcuireadh agus as an bhfáil te íorchaoin a chur sibh romham
475
+ 237
476
+ bhí sé anseo déag daoin í
477
+ 238
478
+ bíogí ar bhur suaimhneas
479
+ 239
480
+ tá de bhróg ort
481
+ 240
482
+ cas siad le chéile roimh an gcinneadh
483
+ 241
484
+ cailín ag mór agus mór i gciridéirca
485
+ 242
486
+ ba mhóir an onóir dom freisin cuireadh a fháil chun chráin a chrainnseo
487
+ 243
488
+ bhain sé leas as an gaeilge san irseochtchomaith céim cheann bródíoch eile
489
+ 244
490
+ níl mé sásta go hiomlán gur glacadh le mé oirtes ar gach leibhéal
491
+ 245
492
+ ba mhaith liom mo bhuíochas a ghabháil le don cumainn iormhéire na cathrach seo
493
+ 246
494
+ an bhfuil tú níos feor nad a chriathair
495
+ 247
496
+ a cheann foirne agus a ógalchánn na héireann
497
+ 248
498
+ beagán aráin
499
+ 249
500
+ mathach sa féin
501
+ 250
502
+ a thochtdéag d aici
503
+ 251
504
+ di dhaoibh go léir
505
+ 252
506
+ tollán fear breá in éirinn
507
+ 253
508
+ gabhaim buíochas le cisigeallaithar uachtaráin chraobh na héireann an bhacadh
509
+ 254
510
+ crónaomach is fearr dhó sin
511
+ 255
512
+ an é sean tomás
513
+ 256
514
+ air norán léithúl
515
+ 257
516
+ an cuideachta a orcainad
517
+ 258
518
+ an raibh diarmand ag obair
519
+ 259
520
+ tá chóta bán ar ndóra
521
+ 260
522
+ acht a cháin ná órúnú
523
+ 261
524
+ an clár do thrádálaithatéi
525
+ 262
526
+ fítéadach
527
+ 263
528
+ sail a sholáthróirí obair iontach do chách
529
+ 264
530
+ tá dhuine uasail agus an leabhar gorm agus an leabhar dó
531
+ 265
532
+ tioimislímóc mharú seacht sa hacht le héin
533
+ 266
534
+ an linn coltaí
535
+ 267
536
+ tá an bosca aran gcathaoir
537
+ 268
538
+ bei páraic ó conaire a light sí is caighdeán na sroneoireachta sa fuadhailn
539
+ 269
540
+ is liom a bhean uasail
541
+ 270
542
+ tá sé do díol
543
+ 271
544
+ chon comhghardas dheanamh libh as ó chomórtas na mailte a bhuachaint
545
+ 272
546
+ an mbeidh dón le lhíre anseo
547
+ 273
548
+ is mór an pléisiúr dom é an chomhdháil tháchtach seo oscailt
549
+ 274
550
+ fuair bás an séaúláde mhí dhear póir míle na i gcéad fiche hocht
551
+ 275
552
+ an cúigú cheacht
553
+ 276
554
+ an áit an bhfuil séimh
555
+ 277
556
+ cá bhfuil le capall
557
+ 278
558
+ a óglachan héirinn
559
+ 279
560
+ is maith leis na fir mhí an speaisdóracht
561
+ 280
562
+ fear mór crua é siúd
563
+ 281
564
+ bei beann acht
565
+ 282
566
+ bhí siad ag macht le fáiin
567
+ 283
568
+ gur i céad míle maith agaibh as an bhforchaoin fáilte sin a dair sibhróaid
569
+ 284
570
+ tá an chuma ar an scéal go raibh mí thuiscint ar dhaoine áirithe ina thaobh
571
+ 285
572
+ maidir leis an obair féin dearcán an daonna de pipalséicáirn
573
+ 286
574
+ agus a móid sé i gcolairne a márach
575
+ 287
576
+ an ir rua
577
+ 288
578
+ si maíonn thar na barta
579
+ 289
580
+ tá sul agam gor tráthnóna torthúl a mbeidh an díobh
581
+ 290
582
+ an ghaelga teanga dhúchais an ilánseo
583
+ 291
584
+ ama chuid salán
585
+ 292
586
+ ceacht a héaon déag
587
+ 293
588
+ luí an liorchán seo
589
+ 294
590
+ tá cuideachú seo holc
591
+ 295
592
+ tá cáilín deas ar an bhfuinneog
593
+ 296
594
+ parlaimint na chorpa
595
+ 297
596
+ is i méirle a leabhar siamas
597
+ 298
598
+ cimeid fearg ard na faide
599
+ 299
600
+ ar an cathaoir
601
+ 300
602
+ tááthas orm a fhógairt go bhfuil tús leis an ochtú tríú comórtas náisiúnta treamhadáreachta
603
+ 301
604
+ tá áis orm shan agus ar thaidhbhín fáilte a airidhbromhaimh thig áras an uachtaráin
605
+ 302
606
+ tá áthas orm shan agus ar thaibhín fáilte arad romhaibh a thar as an uachtaráin
607
+ 303
608
+ domprig siad an tollad is tac ar an doras
609
+ 304
610
+ tá sé i gcorcaig
611
+ 305
612
+ cá bhfuil siad
613
+ 306
614
+ cháir an gcnoic
615
+ 307
616
+ níl cro ar bi ort
617
+ 308
618
+ an bhfeiceann tú an díol
619
+ 309
620
+ is maith an scéal í an aimsir
621
+ 310
622
+ an bhfuil do leabhar féin agat
623
+ 311
624
+ tír ina raibh an ghaeilge beo beag
625
+ 312
626
+ maoin an go is saicht
627
+ 313
628
+ tá cuid do sineólg
629
+ 314
630
+ an fear mór
631
+ 315
632
+ ní raibh spide faoi air
633
+ 316
634
+ go raibh míle maith guibh as ucht na faoicáin fáilte a dtéir sibh romhabh
635
+ 317
636
+ tá mo bhróga orm
637
+ 318
638
+ a chloigeann iad thall atá ag an teanga
639
+ 319
640
+ sin tús na párta
641
+ 320
642
+ go raibh míle meth agabh as bhur bhfíorthain fáilte
643
+ 321
644
+ dúirt sé go deich is
645
+ 322
646
+ is lá é seo hun chill air é ann
647
+ 323
648
+ an bhfuil do dhearthar théann ar scoil inniu
649
+ 324
650
+ ar an leabhar
651
+ 325
652
+ an bhfuil an capall agat
653
+ 326
654
+ an iomarca isce
655
+ 327
656
+ na fáinní deasad
657
+ 328
658
+ ní dhearna an cillach ag imeacht laithrea agus an scéal a inti stair antí
659
+ 329
660
+ níos luaithe inniu bhí rinn searmanis againn chun an caomhaon oibhíinn a thomrúdh
661
+ 330
662
+ beidh sé anseo
663
+ 331
664
+ to scóip mí
665
+ 332
666
+ tá áthas orm mar aorladh ar crúiseog fheilidis éireann lort libh inniu
667
+ 333
668
+ is mór an pléisiúr do a bheith anseo inniu
669
+ 334
670
+ achomhairc ginne cinna na cúirte dtoithe
671
+ 335
672
+ bhí an fear ba mhó ina shuí sa thoithoirbolú
673
+ 336
674
+ ar an dheoin saol orainn sé chun an teanga aichnútháin agus alathna
675
+ 337
676
+ an fhróg agus an madra riail
677
+ 338
678
+ deir sé go bhuil leor buí aige
679
+ 339
680
+ an ciste gráin
681
+ 340
682
+ comhghairdeas ó chroí libh
683
+ 341
684
+ balla ísil is ea é sin
685
+ 342
686
+ ábhar ginearálta
687
+ 343
688
+ tá fíorchaoin fáilte romhaibh ar fad go bhaile átha clia agus go héireann
689
+ 344
690
+ airleacain in ais iaca
691
+ 345
692
+ tá sé ar ceann dena bócfoinntsí ar iolra sóisialta na héireann
693
+ 346
694
+ ar an mir
695
+ 347
696
+ nach raibh na búcaillí ag caint leis
697
+ 348
698
+ buí is fearr
699
+ 349
700
+ an bhliain
701
+ 350
702
+ chos aige orthu ag cardáil arís
703
+ 351
704
+ an bhfuil as agatsa a sháraigh
705
+ 352
706
+ gur fada bun sibh agus go raibh míle maith agaibh go léir
707
+ 353
708
+ thusaig móra i gcabhail chrnán na bunoibre do gclár íseal
709
+ 354
710
+ mbeidh sé anseo amáreach
711
+ 355
712
+ bhfuil bhua bróga araigh
713
+ 356
714
+ an chéad cheacht
715
+ 357
716
+ céard aon difríocht ama idir seo agus fear seo
717
+ 358
718
+ ní dhiomáil
719
+ 359
720
+ toil do fái agus turfar dit é
721
+ 360
722
+ an bhfuil do chárta beag ar an mbord a mhichíl
723
+ 361
724
+ an duine gal
725
+ 362
726
+ cá haon a bheidh sé anseo
727
+ 363
728
+ a chairde na héireann agus na héatópa
729
+ 364
730
+ an a tóip
731
+ 365
732
+ cur i cé letáin
733
+ 366
734
+ tá sí go maith
735
+ 367
736
+ leith an sean chaol í sin
737
+ 368
738
+ for lámh as na ná
739
+ 369
740
+ ní dhá inte drugaí
741
+ 370
742
+ céard aon tír is mó ar domhan
743
+ 371
744
+ is fearr romaith n�� drocheasa
745
+ 372
746
+ an chionmhaireacht a leighdófar an méid ó luachaladh
747
+ 373
748
+ an taonú ceacht déag
749
+ 374
750
+ tá ann bhróg ag an seanmháthair
751
+ 375
752
+ fuacht na haimsire
753
+ 376
754
+ dá fad an lá tagann an trómóra
755
+ 377
756
+ tugann sé deis do scéalaithe na nua físe a ghardolam agus a mhaisiú
757
+ 378
758
+ mar a dúirt an foile séamusshoní
759
+ 379
760
+ ach níl a gcasóga orthu
761
+ 380
762
+ is ábhar márta seo is bród daoibh an méid sin
763
+ 381
764
+ a chairde na héireann agus na síne
765
+ 382
766
+ is mór an pléisiúr dom an tochtú séú comórtas náisiúnta tréomhdárachta a oscailt
767
+ 383
768
+ cá bhfuil sé a bhuishíl
769
+ 384
770
+ an príomhstúrthoir
771
+ 385
772
+ gabhann buíochas leat as a chuid focal coinálta nocht a hacht aráin
773
+ 386
774
+ ban an crios sin diat
775
+ 387
776
+ fearim fíorchon fáilte roimh gach duine atá linn tráthnóna
777
+ 388
778
+ an deathú ceacht
779
+ 389
780
+ cad eile a bhí agat
781
+ 390
782
+ bhí an madra rua ann
783
+ 391
784
+ bhí sé air cré
785
+ 392
786
+ mo tháleann tú uair ar madin beidh tú á tóraíocht i rith an léi
787
+ 393
788
+ cé li mo ch arad
789
+ 394
790
+ na cailíní beaga
791
+ 395
792
+ go raime agaibh
793
+ 396
794
+ an cad is gaire don scoirnach
795
+ 397
796
+ an chionmhaireacht a laghdófar an méadú ar an luacháil
797
+ 398
798
+ ach cathmaid léirmheas a dhéana ar na mbóna
799
+ 399
800
+ táim dolta
801
+ 400
802
+ airleacain ó údráistithe chun tithe á oirigniú a dheisiú agus asú
803
+ 401
804
+ maracalscéir is mian no mo thuíoch is a chomháillibh rís aschur bhlaithiúlacht
805
+ 402
806
+ cad aon theocht mac an chait a chlochairú
807
+ 403
808
+ mo chrua sa an té a bhfuil sin aige
809
+ 404
810
+ bhí aráin agus im agam
811
+ 405
812
+ sagairt is ea é
813
+ 406
814
+ an raibh aon ní eile agat
815
+ 407
816
+ go noirí leat
817
+ 408
818
+ go raibh míle maith agaibh go léir
819
+ 409
820
+ go mbarig sé sin
821
+ 410
822
+ níl sé na gcréithra
823
+ 411
824
+ cradach sé go miag
825
+ 412
826
+ ceathair lá toréis lá nollaigh sin an naoú lá is fiche de bhí na nollaigh
827
+ 413
828
+ bhí máira ní ceallaigh anseo in né ach níl sí anseo inniu
829
+ 414
830
+ déir siamus go mbeidh siad i gcilarna
831
+ 415
832
+ an tríú ceacht
833
+ 416
834
+ is éard is bille ann ná crann mór na chaife
835
+ 417
836
+ is mór an pléisiúr dom a bheith anseo libh ar fad inniu
837
+ 418
838
+ an comhthéacs as a dtagann faidireachtí dunnio agus don todhchaí
839
+ 419
840
+ feasaar daire chinntigh air drochch chun tú a bhí gceist
841
+ 420
842
+ támthárbhe sásta a bheith anseo libh inniu
843
+ 421
844
+ le róid mé i méile ar fathamalín ar fána de thuigisiobh sibh irbál
845
+ 422
846
+ tá sí go maith go raibh maith agat
847
+ 423
848
+ is lei míchál ó tú m éi
849
+ 424
850
+ a héiráin í thrithedátha
851
+ 425
852
+ is mór an pléisiúir dom a bheith ar ais anseo samfranseasco
853
+ 426
854
+ bhí leabhar buí agam an lá faoi deir ach níor sé agam anois
855
+ 427
856
+ a trí déag dfhichithe
857
+ 428
858
+ an bord do cheannach agus do ghal cruithneachta
859
+ 429
860
+ beoir bua agus beannacht
861
+ 430
862
+ bar beannacht don todhchaí
863
+ 431
864
+ céad bliain ó fail sí ag an leabhar
865
+ 432
866
+ treasliaoim libh agus déanam córgháirdeas libh as an tor obair seo atá curtha i gcrích agaibh
867
+ 433
868
+ cé hiad na toisí onainn a spreagann muid chun troda
869
+ 434
870
+ bhí idir cailíní agus fao c li ann
871
+ 435
872
+ ruga an tochtú lá is fiche de bhí feabhra míle ocht gcéad ocht a dó
873
+ 436
874
+ is mar gheabhall air sin
875
+ 437
876
+ ainmneacha torann cheantair iascaigh
877
+ 438
878
+ ní thaid go deimhin
879
+ 439
880
+ is minic an aran a searbh
881
+ 440
882
+ an raibh na cailíní ag obair
883
+ 441
884
+ san air
885
+ 442
886
+ an raing
887
+ 443
888
+ impí morabh gan na mbáid a leagann le sroch
889
+ 444
890
+ diíolthaimé an comhair leat uair aige
891
+ 445
892
+ ní dóigh liom go dorfaí post do
893
+ 446
894
+ as ba céile at air
895
+ 447
896
+ is minic cuma angal ar an deal féin
897
+ 448
898
+ níl aon tinte mar de hinsean féin
899
+ 449
900
+ tá sibh bailithe ón arnó phríobháideach an airnó dheonach agus an stát chóras
901
+ 450
902
+ tréaslaím sé bh as bhur ag arthnathas agus aschur saor anocht
903
+ 451
904
+ bhí athbheochan na gaeilge ina príomhaidhm a cion rí an ir amach
905
+ 452
906
+ cim rath agus sonas oraibh go léir
907
+ 453
908
+ na seanóirí glas bige
909
+ 454
910
+ co cairdeas libh go léir agus go mear si ar a laghad an chéad
911
+ 455
912
+ an bhfuil capall ar bei agat
913
+ 456
914
+ ar an gcois
915
+ 457
916
+ níl agus ní bheidh sí anseo amárach
917
+ 458
918
+ is uaisle an rí ná an bochtáin
919
+ 459
920
+ teach fór é sin
921
+ 460
922
+ paradacsúil teibíachuigcó ní ábhartha
923
+ 461
924
+ tastí an mínú ar an scéal
925
+ 462
926
+ bhí tar mhiscairdí agus mamhóroir cuig saint i nár daoin na mbláth
927
+ 463
928
+ go ndéana
929
+ 464
930
+ tá sé sa bhaile
931
+ 465
932
+ ba ger ghann naíonán ina hircimci súinn
933
+ 466
934
+ cac duine to sa go thóir ithe
935
+ 467
936
+ an chead chomhairle a bhunú
937
+ 468
938
+ is í sin briad
939
+ 469
940
+ is comannomocht sin ag an teist
941
+ 470
942
+ ní raibh ach bhí uachtair agam
943
+ 471
944
+ an bhfuil sé a trí a chlog fós
945
+ 472
946
+ cá bhfuil an blefón
947
+ 473
948
+ i dtús an shíl
949
+ 474
950
+ tá sé anseo anois
951
+ 475
952
+ ní liom is leis féin mé
953
+ 476
954
+ fraomh chearnach fiche a cúig sin a chúig
955
+ 477
956
+ níl go baileach ach is deasliom a bheag bhfaighmúh
957
+ 478
958
+ comhghairdethas mór le cnoic an an an fhinn
959
+ 479
960
+ aird rialtas áitiúil
961
+ 480
962
+ ceathru leo
963
+ 481
964
+ bhí mocar gach mall aige
965
+ 482
966
+ beidh sí sa bhaile
967
+ 483
968
+ níl a bhean uasail
969
+ 484
970
+ óráid an uachtaráin micheordí ó chiúin a coisiúgh bhailgasi ghairdín
971
+ 485
972
+ an fear mór
973
+ 486
974
+ chúig sí an don go dí an cliabhann
975
+ 487
976
+ tá áthas orm a bheith anseo inniu chun ólamhéireann le folaíocht nua a hógairt
977
+ 488
978
+ an bhuúcanach meig ag opair
979
+ 489
980
+ an habhair
981
+ 490
982
+ an ar an mbord atá an chathaoir
983
+ 491
984
+ a dhaoine uaisle a chairde gaol
985
+ 492
986
+ tá tanic bar feiste an seachtú leada bhíomháirte dhá mhíre a chúig déag
987
+ 493
988
+ a bhfuichalí a chailíní agus a chairde go léir
989
+ 494
990
+ is mó an tleis úr on é an tochtú cúig chomórtas naisiúnta treamhdeoiraocht a oscailt
991
+ 495
992
+ dam buíochas libh a chairde táimid ag tríú de tuile araib air ba
993
+ 496
994
+ an fheiceann tú an leabhair seach a charnach
995
+ 497
996
+ an dara ceacht déag
997
+ 498
998
+ na séanróga glas a beaga
999
+ 499
1000
+ ifeascatha
1001
+ 500
1002
+ nach mian atá sí
1003
+ 501
1004
+ ag an fhuinneog
1005
+ 502
1006
+ airnaois ag an stát a aistriú chun a noríis
1007
+ 503
1008
+ an ní ó ceacht
1009
+ 504
1010
+ a bhaill líon taobh as ghlas i in
1011
+ 505
1012
+ bíonn achtú súl ag
1013
+ 506
1014
+ bíodh an capalig an bheag do bheag
1015
+ 507
1016
+ an ghaoil bhí anseo
1017
+ 508
1018
+ comhall grefiúir a thomáis
log_mozilla-foundation_common_voice_7_0_ga-IE_test_targets.txt ADDED
@@ -0,0 +1,1018 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 0
2
+ ní bhíonn aon bhlas ar iasc gan salann
3
+ 1
4
+ dfhan an chlann ar fad le chéile
5
+ 2
6
+ corn na breataine
7
+ 3
8
+ bhí an long ag fanacht is chuamar ar bord láithreach
9
+ 4
10
+ an chéadaoin
11
+ 5
12
+ shéid an réiteoir an fheadóg agus chríochnaigh an cluiche ar chomhscór
13
+ 6
14
+ ní bhfuaireamar faic le nithe
15
+ 7
16
+ bhí an taerphort dubh le daoine
17
+ 8
18
+ a ard mhéara agus a dhaoine uaisle
19
+ 9
20
+ aon seans go bpeinteálfá an tig dom
21
+ 10
22
+ contae chill dara
23
+ 11
24
+ ascaill uí ghríofa griffith avenue
25
+ 12
26
+ ní raibh béarla ag lucht a dhéanta
27
+ 13
28
+ sráid mhuire mary street
29
+ 14
30
+ is leor don dreoilín a nead
31
+ 15
32
+ níor mhaith liom a bheith ag brath air
33
+ 16
34
+ do chum sé go leor dánta maithe
35
+ 17
36
+ in éirinn
37
+ 18
38
+ sráid theach laighean molesworth street
39
+ 19
40
+ bíonn sí anseo is ansiúd
41
+ 20
42
+ *is ann atá caint ar fad le déanaí
43
+ 21
44
+ is mór an pléisiúir dom a bheith ar ais anseo i san francisco
45
+ 22
46
+ dimir diarmaid go maith sa chliathán
47
+ 23
48
+ tá sé tite i bhfeoil le cúpla bliain anuas
49
+ 24
50
+ dia dhuit
51
+ 25
52
+ ba mhór an tógaint croí dúinn ar fad é
53
+ 26
54
+ bhí an fheoil sin lofa
55
+ 27
56
+ dlítear duit uaim
57
+ 28
58
+ ospidéal chuláiste na hollscoile gaille
59
+ 29
60
+ ar dheis lámh dé go raibh a anam dílis
61
+ 30
62
+ bhí na tonnta ag bualadh i gcoinne na gcarraigeacha
63
+ 31
64
+ tír ar aon chéim le gach tír eile ar domhan
65
+ 32
66
+ bhíodar go leir ag caint
67
+ 33
68
+ is fearr gaeilge bhriste ná béarla cliste
69
+ 34
70
+ an bhrasaíl
71
+ 35
72
+ is mór an pléisiúir dom a bheith anseo libh i bpríosún mhuinseo
73
+ 36
74
+ dr risteard de hindeberg
75
+ 37
76
+ níl ach tá peann ina phóca aige
77
+ 38
78
+ ba phribhléid mhór domsa a bheith rannpháirteach san imeacht ríthábhachtach seo
79
+ 39
80
+ óráid an uachtaráin ag gaelscoil uí choileáin
81
+ 40
82
+ tá stádas aici mar theanga oifigiúil agus oibre san aontas eorpach
83
+ 41
84
+ éadaí a chur ar taispeáint san fhuinneog
85
+ 42
86
+ tá antábhacht ag baint leis an stair mar ábhar scoile agus mar bhunchloch don todhchaí
87
+ 43
88
+ na daoine dá dtagraítear san alt
89
+ 44
90
+ tá lá is tríocha i mí na nollag
91
+ 45
92
+ agus thug sé a chúl air go mícheadtach agus dimigh sé
93
+ 46
94
+ sé bhur mbeatha uile
95
+ 47
96
+ tréaslaím leis na heagarthóirí agus leis na staraithe uilig
97
+ 48
98
+ tá an chathaoir mhór ag an doras agus tá an chathaoir bheag ag an bhfuinneog
99
+ 49
100
+ an bhfuil cóta mór ort
101
+ 50
102
+ an grád míchumais
103
+ 51
104
+ thosaigh an cruinniú ar a deich a chlog
105
+ 52
106
+ níl sé chomh láidir leis an bhfear
107
+ 53
108
+ ceithre bliana
109
+ 54
110
+ is buí atá uaim
111
+ 55
112
+ luí fada atá uaim
113
+ 56
114
+ agus a chairde gael
115
+ 57
116
+ tá fíorchaoin fáilte romhaibh ar fad go bhaile átha cliath agus go héireann
117
+ 58
118
+ fréamh chearnach a naoi sin a trí
119
+ 59
120
+ tá na leabhair go léir ar an mbord
121
+ 60
122
+ an ceathrú ceacht déag
123
+ 61
124
+ go raibh maith agaibh go léir
125
+ 62
126
+ tréaslaím sibh as bhúr carthanachas agus as bhúr saoránacht
127
+ 63
128
+ a cúig a chlog
129
+ 64
130
+ a gcaithim sa lá
131
+ 65
132
+ dún do chlab
133
+ 66
134
+ comórtas na mbailte slachtmhara supervalu dhá mhíle a seacht déag
135
+ 67
136
+ ar an drochuair níor éirigh leis an phlean a bhí acú agus gabhadh mac easmainn
137
+ 68
138
+ níl a máthair anseo
139
+ 69
140
+ a airí a theachtaí dála a sheanadóirí a dhaoine uaisle a chairde gael
141
+ 70
142
+ a gcuid saineolais
143
+ 71
144
+ tá dualgas agus ról againn ar fad san iarracht seo
145
+ 72
146
+ an bhfuil a mbróga ar na buachaillí
147
+ 73
148
+ is liom a dhuine uasail
149
+ 74
150
+ tá fíorchaoin fáilte romhaibh ar fad chuig áras an uachtaráin inniu
151
+ 75
152
+ ar aghaidh linn mar sin go dtí an phríomhchúis a bhfuilimid anseo inniu
153
+ 76
154
+ ní go héasca a tharla sé
155
+ 77
156
+ a aíonna oirirce a mhisinéirí a dhaoine uaisle agus a dhaoine córa ar fad
157
+ 78
158
+ tá a dhuine uasail
159
+ 79
160
+ an é sin tomás
161
+ 80
162
+ is iontach an rud í gach teanga
163
+ 81
164
+ agus a dhaoine óga agus a dhaltaí scoile ach go háirithe
165
+ 82
166
+ an india
167
+ 83
168
+ mo theach féin
169
+ 84
170
+ bhí an gadhar ina luí
171
+ 85
172
+ ar an lámh
173
+ 86
174
+ tá seán chomh mór le séamas
175
+ 87
176
+ is é corrán tuathail an sliabh is airde in éirinn
177
+ 88
178
+ cad é an sliabh is airde ar domhan
179
+ 89
180
+ a aíonna uile agus a dhaoine óga ach go háirithe
181
+ 90
182
+ nach mór atá pól
183
+ 91
184
+ a dó a chlog
185
+ 92
186
+ an bhfuil grá agat dom
187
+ 93
188
+ an raibh aon tae agat
189
+ 94
190
+ fuair mé anghal uaidh sin
191
+ 95
192
+ cén bhrí atá leis an mbeatha
193
+ 96
194
+ tá áthas orm bheith libh ar fad anseo
195
+ 97
196
+ cá mbeidh siad amárach
197
+ 98
198
+ le haghaidh na scríbhneoireachta oifigiúla
199
+ 99
200
+ cá bhfuil an leabhar dubh a mháire
201
+ 100
202
+ bainigí sult as an chuid eile den lá
203
+ 101
204
+ leanaimis orainn mar phobal ag saothrú na poblachta agus ag saothrú na gaeilge
205
+ 102
206
+ aiscí
207
+ 103
208
+ ainm
209
+ 104
210
+ is cuid luachmhar dár noidhreacht iad na hoileáin amach ó cósta na tíre seo
211
+ 105
212
+ ar an bhfuarma
213
+ 106
214
+ ná creid a bhfeicfidh tú
215
+ 107
216
+ is críoch íontach í an ceolchoirm seo ar lá íontach i gcathair ghlaschú
217
+ 108
218
+ an bhfuil aon ghreim feola aige
219
+ 109
220
+ is í an áise an ilchríoch is mó ar domhan
221
+ 110
222
+ teach an tsagairt
223
+ 111
224
+ cá bhfuil an ghrian
225
+ 112
226
+ is maith sú bó beo nó marbh
227
+ 113
228
+ tháinig sé leis an bhfear
229
+ 114
230
+ an bhfuil bhur leabhair agaibh go léir a bhuachaillí
231
+ 115
232
+ cuir na leabhair seo ar an mbord
233
+ 116
234
+ óráid an uachtaráin ag bronnadh gradaim chumarsáide an oireachtais dhá mhíle a sé déag
235
+ 117
236
+ an chuid a thugann brí agus comhleanúnachas don iomlán
237
+ 118
238
+ tá súil agam go bhfuil sibh ag baint taitneamh as an lá
239
+ 119
240
+ chuaigh oisín go tír na nóg
241
+ 120
242
+ tabhair cabhair don fhoireann
243
+ 121
244
+ tá mé anbhuíoch díbhse go léir freisin as an bhfíorchaoin fáilte a dfhear sibh romham
245
+ 122
246
+ tá fáilte romhaibh go léir chuig áras an uachtaráin tráthnóna
247
+ 123
248
+ an iodáil
249
+ 124
250
+ an leabhar sin
251
+ 125
252
+ sin é a dhuine uasail
253
+ 126
254
+ de bhun
255
+ 127
256
+ tá a bhean uasal tá sé faoin mbord
257
+ 128
258
+ léiriú agus eadráin
259
+ 129
260
+ is fearr bothán biamhar ná caisleán gortach
261
+ 130
262
+ ó dhaltaí scoile
263
+ 131
264
+ an bhfuil hata uirthi
265
+ 132
266
+ an garsún láidir
267
+ 133
268
+ go raibh maith agaibh as ucht na fáilte cineálta
269
+ 134
270
+ cá raibh sé
271
+ 135
272
+ air siúd an locht
273
+ 136
274
+ i ndiaidh a chéile a thógtar na caisleáin
275
+ 137
276
+ is mór an pléisiúr dom é an chomhdháil thábhachtach seo a sheoladh
277
+ 138
278
+ a ceathair déag d'fhichithe
279
+ 139
280
+ acmhainn de shaghas a bhí ann
281
+ 140
282
+ acht ón oireachtas
283
+ 141
284
+ nuair a iarradh ar eddie píosa ealaíne a shainmhíniú dúirt sé
285
+ 142
286
+ tá áthas orm féin agus ar shaidhbhín go bhfuil sibh inár gcomhluadar
287
+ 143
288
+ ceapann sé anois gur leis féin an dá cheann acu
289
+ 144
290
+ a dó dhéag d'fhichithe
291
+ 145
292
+ tá áthas orm a bheith libh ar fad anseo inniu
293
+ 146
294
+ ní hé lá na gaoithe lá na scolb
295
+ 147
296
+ is mór an chailliúint é don dlí agus d'éirinn i gcoitinne
297
+ 148
298
+ is mór an pléisiúr dúinn a bheith anseo arís inniu
299
+ 149
300
+ a chathaoirligh agus a dhaoine uaisle go léir
301
+ 150
302
+ an leabhar bán
303
+ 151
304
+ tá seasmhacht ag baint le saothar agus oidhreacht edward delaney
305
+ 152
306
+ an rabhadar go léir ag obair
307
+ 153
308
+ agus cad é an dath atá air
309
+ 154
310
+ caol le caol agus leathan le leathan
311
+ 155
312
+ d'oibrigh daoine as lámha a chéile
313
+ 156
314
+ níl aon leabhar ag an doras ach tá leabhar ar an mbord
315
+ 157
316
+ ceacht a deich
317
+ 158
318
+ ar an mballa
319
+ 159
320
+ bíonn súil le muir ach ní bhíonn súil le tír
321
+ 160
322
+ tá áthas orm a bheith anseo i leabharlann chester beatty anocht
323
+ 161
324
+ ar an mbróg
325
+ 162
326
+ an bhfuil an leabhar dearg ar an urlár a mhichíl
327
+ 163
328
+ go raibh míle maith agaibh agus beirigí libh mo bheannacht ó chroí
329
+ 164
330
+ thaitin sé leis rothaíocht faoin ngrian bhreá
331
+ 165
332
+ cá bhfuil an mála dearg
333
+ 166
334
+ tá mo dhóthain aráin agam
335
+ 167
336
+ ní deas an rud é
337
+ 168
338
+ is maith an scáthán súil charad
339
+ 169
340
+ óráid an uachtaráin ag comórtas peile na noileán dhá mhíle a sé déag
341
+ 170
342
+ ar an gcóta
343
+ 171
344
+ ní bheidh siad ní bheidh mícheál ó murchú ar scoil amárach
345
+ 172
346
+ a choimisinéirí oifig na noibreacha poiblí
347
+ 173
348
+ bíonn cluasa ar na clathacha
349
+ 174
350
+ an cúigiú bliain
351
+ 175
352
+ is é seo an fear
353
+ 176
354
+ a haon a chlog
355
+ 177
356
+ tá sé a ceathair a chlog
357
+ 178
358
+ tá fáilte agus fiche romhaibh ar fad anseo chuig áras an uachtaráin
359
+ 179
360
+ ar an ordóg
361
+ 180
362
+ tá an mála buí ar an mbinse
363
+ 181
364
+ cad é an contae is mó in éirinn
365
+ 182
366
+ cá bhfuil sé inniu
367
+ 183
368
+ táim ar meisce
369
+ 184
370
+ táimid go maith
371
+ 185
372
+ mí an mhárta
373
+ 186
374
+ tús maith leath na hoibre
375
+ 187
376
+ briseadh giall mo dhuine
377
+ 188
378
+ is bosca é seo
379
+ 189
380
+ tá an spéir ina criathar
381
+ 190
382
+ nach raibh an dá leabhar aige inné
383
+ 191
384
+ agus nach breá an píosa den scoth atá cruthaithe acu
385
+ 192
386
+ tá seán ag an doras
387
+ 193
388
+ ní raibh teas pill sa bhlaincéad
389
+ 194
390
+ éirigh a mháire agus bog an cliabhán
391
+ 195
392
+ tá roinnt agaibh tagtha ón ngaeltacht agus cuid eile agaibh ón ngalltacht
393
+ 196
394
+ is lú é seo ná é siúd
395
+ 197
396
+ dún do leabhar anois
397
+ 198
398
+ tá a bhean uasal
399
+ 199
400
+ cailín deas donn
401
+ 200
402
+ tada gan iarracht
403
+ 201
404
+ is é an taigéan ciúin an taigéan is mó ar domhan
405
+ 202
406
+ de bharr
407
+ 203
408
+ ar an éadach
409
+ 204
410
+ nár chaill
411
+ 205
412
+ an bhfuil an chathaoir ag an tine a shíle
413
+ 206
414
+ tabhair don bhean sin é
415
+ 207
416
+ níl aon ceann acu ansin
417
+ 208
418
+ na seamróg glas beag
419
+ 209
420
+ tá a deirfiúr sa bhaile
421
+ 210
422
+ cuid de na fearaibh
423
+ 211
424
+ ní bheidh siad
425
+ 212
426
+ am cinniúnach a bhí sna nóchaidí i stair an chraolacháin
427
+ 213
428
+ tá ioscaid ghaoil agam leat
429
+ 214
430
+ an séú ceacht
431
+ 215
432
+ an ciste dearlaice
433
+ 216
434
+ a seacht a chlog
435
+ 217
436
+ mol an óige agus tiocfaidh sí
437
+ 218
438
+ ní fál go haer é
439
+ 219
440
+ tá a hathair anseo
441
+ 220
442
+ scaip sé na leabhair
443
+ 221
444
+ an bhfuil aon ní ar an urlár
445
+ 222
446
+ ceart go leor
447
+ 223
448
+ i gcathair na mart is ea chodail mé aréir
449
+ 224
450
+ a ardmhéara
451
+ 225
452
+ cad atá ar an mbinse anois a bhriain
453
+ 226
454
+ bhí sé beo ar éigean
455
+ 227
456
+ mar sin tá áthas orm an deis seo a bheith agam bualadh libh
457
+ 228
458
+ ní hé sin an taon chúis le gaeilge a fhoghlaim dar ndóigh
459
+ 229
460
+ muna bhfuil timpeallacht shláintiúil ann ní bheidh geilleagar sláintiúil ná sochaí shláintiúil ann ach oiread
461
+ 230
462
+ an bhfuil do dheartháir anseo a dhiarmaid
463
+ 231
464
+ páistí óga iad sin
465
+ 232
466
+ a cúig déag d'fhichithe
467
+ 233
468
+ is mian liom a rá arís chomh mór is atáim as an duais seo a fháil
469
+ 234
470
+ ní hea a dhuine uasail
471
+ 235
472
+ bhí sí ina suí ar an urlár go dtí sin ag cardáil
473
+ 236
474
+ tá mé buíoch díobh as an gcuireadh agus as an bhfáilte fhíorchaoin a chur sibh romham
475
+ 237
476
+ bhí sé anseo dé domhnaigh
477
+ 238
478
+ bígí ar bhur suaimhneas
479
+ 239
480
+ tá do bhróga ort
481
+ 240
482
+ chas siad le chéile roimh an gcruinniú
483
+ 241
484
+ cail��n ag mór agus mór ag iarraidh déirce
485
+ 242
486
+ ba mhór an onóir dom freisin cuireadh a fháil chun crann a chur anseo
487
+ 243
488
+ bhain sé leas as an ngaeilge san iriseoireacht chomh maith céim cheannródaíoch eile
489
+ 244
490
+ níl mé sásta go hiomlán gur glacadh le miarratas ar gach leibhéal
491
+ 245
492
+ ba mhaith liom mo bhuíochas a ghabháil le john cummins iarmhéara na cathrach seo
493
+ 246
494
+ an bhfuil tú níos fearr ná do dheartháir
495
+ 247
496
+ a cheann foirne agus a óglacha na héireann
497
+ 248
498
+ beagán aráin
499
+ 249
500
+ mo theachsa féin
501
+ 250
502
+ a hocht déag d'fhichithe
503
+ 251
504
+ dia dhaoibh go léir
505
+ 252
506
+ tá a lán fear breá in éirinn
507
+ 253
508
+ gabhaim buíochas le kitty gallagher uachtarán chraobh na héireann an wafa
509
+ 254
510
+ cró na muc is fearr dó sin
511
+ 255
512
+ an é sin tomás
513
+ 256
514
+ ár narán laethúil
515
+ 257
516
+ an chuideachta a fhoirceannadh
517
+ 258
518
+ an raibh diarmaid ag obair
519
+ 259
520
+ tá cóta bán ar nóra
521
+ 260
522
+ achtacháin a oiriúnú
523
+ 261
524
+ an clár de thrádálaithe tae
525
+ 262
526
+ figh an téadach
527
+ 263
528
+ samhail a sholáthróidh obair fhiúntach do chách
529
+ 264
530
+ tá a dhuine uasail agus an leabhar gorm agus an leabhar dubh
531
+ 265
532
+ is iomaí slí muc a mharú seachas a thachtadh le him
533
+ 266
534
+ an líon comhaltaí
535
+ 267
536
+ tá an bosca ar an gcathaoir
537
+ 268
538
+ ba é pádraic ó conaire a leag síos caighdeán na scríbhneoireachta sa nuaghaeilge
539
+ 269
540
+ is liom a bhean uasal
541
+ 270
542
+ tá sé le díol
543
+ 271
544
+ chun comhghairdeas a dhéanamh libh as ucht comórtas na mbailte a bhuachan
545
+ 272
546
+ an mbeidh dónall ó laoire anseo
547
+ 273
548
+ is mór an pléisiúr dom é an chomhdháil thábhachtach seo a oscailt
549
+ 274
550
+ fuair bás an séú lá de mhí dheireadh fómhair míle naoi gcéad fiche a hocht
551
+ 275
552
+ an cúigiú ceacht
553
+ 276
554
+ an áit ina bhfuil sé
555
+ 277
556
+ cá bhfuil do chapall
557
+ 278
558
+ a óglacha na héireann
559
+ 279
560
+ is maith leis na fir bhuí an spaisteoireacht
561
+ 280
562
+ fear mór crua é siúd
563
+ 281
564
+ beir beannacht
565
+ 282
566
+ bhí siad ag imeacht le fán
567
+ 283
568
+ go raibh céad míle maith agaibh as an bhfíorchaoin fáilte sin a dfhear sibh romhainn
569
+ 284
570
+ tá an chuma ar an scéal go raibh míthuiscint ar dhaoine áirithe ina thaobh
571
+ 285
572
+ maidir leis an obair féin dearcán na ndaoine the peoples acorn
573
+ 286
574
+ agus an mbeidh sé i gcill airne amárach
575
+ 287
576
+ an iorua
577
+ 288
578
+ sin maoin thar na bearta
579
+ 289
580
+ tá súil agam gur tráthnóna torthúil a bheidh ann daoibh
581
+ 290
582
+ an ghaeilge teanga dhúchais an oileáin seo
583
+ 291
584
+ anchuid salainn
585
+ 292
586
+ ceacht a haon déag
587
+ 293
588
+ ligh an líreacán seo
589
+ 294
590
+ tá cuid acu seo olc
591
+ 295
592
+ tá cailín deas ag an bhfuinneog
593
+ 296
594
+ parlaimint na heorpa
595
+ 297
596
+ is i mbéarla a labhair séamus
597
+ 298
598
+ coimhéad fearg fhear na foighde
599
+ 299
600
+ ar an gcathaoir
601
+ 300
602
+ tá áthas orm a fhógairt go bhfuil tús leis an ochtó tríú comórtas náisiúnta treabhdóireachta
603
+ 301
604
+ tá áthas orm féin agus ar shaidhbhín fáilte a fhearadh romhaibh chuig áras an uachtaráin
605
+ 302
606
+ tá áthas orm féin agus ar shaidhbhín fáilte a fhearadh romhaibh go háras an uachtaráin
607
+ 303
608
+ d'iompraigh siad an tolg isteach ar an doras
609
+ 304
610
+ tá sé i gcorcaigh
611
+ 305
612
+ cá bhfuil siad
613
+ 306
614
+ thar an gcnoc
615
+ 307
616
+ níl cruth ar bith ort
617
+ 308
618
+ an bhfeiceann tú an daol
619
+ 309
620
+ is maith an scéalaí an aimsir
621
+ 310
622
+ an bhfuil do leabhar féin agat
623
+ 311
624
+ tír ina raibh an ghaeilge beo beathach
625
+ 312
626
+ múineann gá seift
627
+ 313
628
+ tá cuid de sin olc
629
+ 314
630
+ an fear mór
631
+ 315
632
+ ní raibh spide fí air
633
+ 316
634
+ go raibh míle maith agaibh as ucht na fíorchaoin fáilte a dfhear sibh romham
635
+ 317
636
+ tá mo bhróga orm
637
+ 318
638
+ a chloiginn úd thall atá gan teanga
639
+ 319
640
+ sin ciumhais na páirce
641
+ 320
642
+ go raibh míle maith agaibh as bhur bhfíorchaoin fáilte
643
+ 321
644
+ dúirt sé go dtiocfadh sé
645
+ 322
646
+ is lá é seo chun ceiliúradh a dhéanamh
647
+ 323
648
+ an bhfuil do dheartháir féin ar scoil inniu
649
+ 324
650
+ ar an leabhar
651
+ 325
652
+ an bhfuil aon chapall agat
653
+ 326
654
+ an iomarca uisce
655
+ 327
656
+ na fáinní deasa
657
+ 328
658
+ ní dhearna an coileach ach imeacht láithreach agus an scéal a insint dfhear an tí
659
+ 329
660
+ níos luaithe inniu bhí roinnt searmanas againn chun an craoibhín aoibhinn a chomóradh
661
+ 330
662
+ beidh sé anseo
663
+ 331
664
+ tá scóip faoi
665
+ 332
666
+ tá áthas orm mar éarlamh ar chnuasach bhéaloideas éireann labhairt libh inniu
667
+ 333
668
+ is mór an pléisiúr dom a bheith anseo inniu
669
+ 334
670
+ achomhairc i gcoinne cinneadh na cúirte dúiche
671
+ 335
672
+ bhí an fear ba mhó ina shuí sa chathaoir ba lú
673
+ 336
674
+ ar an gcion saoil a rinne sé chun an teanga a athnuachan agus a leathnú
675
+ 337
676
+ an frog agus an madra rua
677
+ 338
678
+ deir sé go bhfuil leabhar buí aige
679
+ 339
680
+ an ciste gráin
681
+ 340
682
+ comhghairdeas ó chroí libh
683
+ 341
684
+ balla íseal is ea é sin
685
+ 342
686
+ ábhar ginearálta
687
+ 343
688
+ tá fíorchaoin fáilte romhaibh ar fad go bhaile átha cliath agus go héirinn
689
+ 344
690
+ airleacain inaisíoctha
691
+ 345
692
+ tá sé ar cheann de na buaicphointí ar fhéilire sóisialta na héireann
693
+ 346
694
+ ar an méar
695
+ 347
696
+ nach raibh na buachaillí ag caint leis
697
+ 348
698
+ buí is fearr
699
+ 349
700
+ an bhliain
701
+ 350
702
+ thosaigh uirthi ag cardáil arís
703
+ 351
704
+ an bhfuil a fhios agatsa a phádraig
705
+ 352
706
+ gura fada buan sibh agus go raibh míle maith agaibh go léir
707
+ 353
708
+ thosaigh máire ag gabháil chrónán na banaltra de ghlór íseal
709
+ 354
710
+ an mbeidh sé anseo amárach
711
+ 355
712
+ an bhfuil bhur mbróga oraibh
713
+ 356
714
+ an chéad cheacht
715
+ 357
716
+ cad é an difríocht ama idir seo agus vársá
717
+ 358
718
+ oíche mhaith
719
+ 359
720
+ tuill do phá agus tabharfar duit é
721
+ 360
722
+ an bhfuil do chárta beag ar an mbord a mhichíl
723
+ 361
724
+ an duine geal
725
+ 362
726
+ cathain a bheidh sé anseo
727
+ 363
728
+ a chairde na héireann agus na haetóipe
729
+ 364
730
+ an aetóip
731
+ 365
732
+ cur i gcéill atá ann
733
+ 366
734
+ tá sí go maith
735
+ 367
736
+ leithinis anchaol í sin
737
+ 368
738
+ forlámhas na ngall
739
+ 369
740
+ ní chaitheann siad drugaí
741
+ 370
742
+ cad í an tír is mó ar domhan
743
+ 371
744
+ is fearr rith maith ná drochsheasamh
745
+ 372
746
+ an chionmhaireacht a laghdófar an méadú luachála
747
+ 373
748
+ an taonú ceacht déag
749
+ 374
750
+ tá an bhróg ag an tseanmháthair
751
+ 375
752
+ fuacht na haimsire
753
+ 376
754
+ dá fhada an lá tagann an tráthnóna
755
+ 377
756
+ tugann sé deis do scéalaithe na nuafhíse a gceird a fhoghlaim agus a mhaisiú
757
+ 378
758
+ mar a dúirt an file seamus heaney
759
+ 379
760
+ ach níl a gcasóga orthu
761
+ 380
762
+ is ábhar mórtais agus bróid daoibh an méid sin
763
+ 381
764
+ a chairde na héireann agus na síne
765
+ 382
766
+ is mór an pléisiúr dom an tochtó séú comórtas náisiúnta treabhdóireachta a oscailt
767
+ 383
768
+ cá bhfuil sé a mhichíl
769
+ 384
770
+ an príomhstiúrthóir
771
+ 385
772
+ gabhaim buíochas leat as do chuid focal cineálta anocht a uachtaráin
773
+ 386
774
+ bain an crios sin díot
775
+ 387
776
+ fearaim fíorchaoin fáilte roimh gach duine atá linn tráthnóna
777
+ 388
778
+ an deichiú ceacht
779
+ 389
780
+ cad eile a bhí agat
781
+ 390
782
+ bhí an madra rua ann
783
+ 391
784
+ bhí sé ar crith
785
+ 392
786
+ má chailleann tú uair ar maidin beidh tú á tóraíocht i rith an lae
787
+ 393
788
+ céile mo charad
789
+ 394
790
+ na cailíní beaga
791
+ 395
792
+ go raibh maith agaibh
793
+ 396
794
+ an gad is giorra don scornach
795
+ 397
796
+ an chionmhaireacht a laghdófar an méadú ar an luacháil
797
+ 398
798
+ ach caithfimid léirmheas a dhéanamh ar na modhanna
799
+ 399
800
+ táim dallta
801
+ 400
802
+ airleacain ó údaráis tithe chun tithe a athfhoirgniú a dheisiú agus a fheabhsú
803
+ 401
804
+ mar fhocal scoir is mian liom mo bhuíochas a ghabháil libh arís as bhur bhflaithiúlacht
805
+ 402
806
+ cad a dhéanfadh mac an chait ach luch a mharú
807
+ 403
808
+ mo thruasa an té a bhfuil sin aige
809
+ 404
810
+ bhí arán agus im agam
811
+ 405
812
+ sagart is ea é
813
+ 406
814
+ an raibh aon ní eile agat
815
+ 407
816
+ go néirí leat
817
+ 408
818
+ go raibh míle maith agaibh go léir
819
+ 409
820
+ go mairfidh sé sin
821
+ 410
822
+ nigh sé na gréithre
823
+ 411
824
+ chreideadh sé go mbíodh
825
+ 412
826
+ ceathair lá tar éis lá nollag sin an naoú lá is fiche de mhí na nollag
827
+ 413
828
+ bhí máire ní cheallaigh anseo inné ach níl sí anseo inniu
829
+ 414
830
+ deir séamus go mbeidh siad i gcill airne
831
+ 415
832
+ an tríú ceacht
833
+ 416
834
+ is éard is bile ann ná crann mór naofa
835
+ 417
836
+ is mór an pléisiúr dom a bheith anseo libh ar fad inniu
837
+ 418
838
+ an comhthéacs as a dtagann féidearthachtaí dinniu agus don todhchaí
839
+ 419
840
+ ar deireadh chinn sí gur drochchiontú a bhí i gceist
841
+ 420
842
+ táim thar a bheith sásta a bheith anseo libh inniu
843
+ 421
844
+ labhróidh mé i mbéarla ar feadh tamaillín ar fáthanna a thuigfidh sibh ar ball
845
+ 422
846
+ tá sí go maith go raibh maith agat
847
+ 423
848
+ is le mícheál ó tuama é
849
+ 424
850
+ a shaoránaigh dhroichead átha
851
+ 425
852
+ is mór an pléisiúr dom a bheith ar ais anseo i san francisco
853
+ 426
854
+ bhí leabhar buí agam an lá faoi dheireadh ach níl sé agam anois
855
+ 427
856
+ a trí déag d'fhichithe
857
+ 428
858
+ an bord do cheannach agus do dhíol cruithneachta
859
+ 429
860
+ beir bua agus beannacht
861
+ 430
862
+ beir beannacht don todhchaí
863
+ 431
864
+ céad bliain ó foilsíodh an leabhar
865
+ 432
866
+ treaslaím libh agus déanaim comhghairdeas libh as an tsárobair seo atá curtha i gcrích agaibh
867
+ 433
868
+ cé hiad na taibhsí ionainn a spreagann muid chun troda
869
+ 434
870
+ bhí idir chailíní agus bhuachaillí ann
871
+ 435
872
+ rugadh an tochtú lá is fiche de mhí feabhra míle ocht gcéad ochtó a dó
873
+ 436
874
+ is mar gheall air sin
875
+ 437
876
+ ainmneacha toghranna cheantar iascaigh
877
+ 438
878
+ ní hea go deimhin
879
+ 439
880
+ is minic an fhírinne searbh
881
+ 440
882
+ an raibh na cailíní ag obair
883
+ 441
884
+ san fhéar
885
+ 442
886
+ an fhrainc
887
+ 443
888
+ impím oraibh gan na maidí a ligean le sruth
889
+ 444
890
+ díolfaidh mé an comhar leat uair éigin
891
+ 445
892
+ ní dóigh liom go dtabharfaí post dó
893
+ 446
894
+ easpa céille atá air
895
+ 447
896
+ is minic cuma aingeal ar an diabhal féin
897
+ 448
898
+ níl aon tinteán mar do thinteán féin
899
+ 449
900
+ tá sibh bailithe ón earnáil phríobháideach an earnáil dheonach agus an státchóras
901
+ 450
902
+ tréaslaím sibh as bhur gcarthanachas agus as bhur saoránacht
903
+ 451
904
+ bhí athbheochan na gaeilge ina príomhaidhm ag ceannairí an éirí amach
905
+ 452
906
+ guím rath agus sonas oraibh go léir
907
+ 453
908
+ na seamróige glaise bige
909
+ 454
910
+ comhghairdeachas libh go léir agus go maire sibh ar a laghad an céad
911
+ 455
912
+ an bhfuil capaill ar bith agat
913
+ 456
914
+ ar an gcois
915
+ 457
916
+ níl agus ní bheidh sí anseo amárach
917
+ 458
918
+ is uaisle an rí ná an bochtán
919
+ 459
920
+ teach fuar é sin
921
+ 460
922
+ paradacsúil teibí ach i gcónaí ábhartha
923
+ 461
924
+ teastaíonn míniú ar an scéal
925
+ 462
926
+ bhí tara viscardi agus meadhbh o'rourke ag seinnt i ngairdín na mbláth
927
+ 463
928
+ go ndéanfadh
929
+ 464
930
+ tá sí sa bhaile
931
+ 465
932
+ ba ghearr go raibh an naíonán ina thoirchim suain
933
+ 466
934
+ gach duine tusa go háirithe
935
+ 467
936
+ an cheardchomhairle a bhunú
937
+ 468
938
+ is í sin bríd
939
+ 469
940
+ is cuma nó muc duine gan seift
941
+ 470
942
+ ní raibh ach bhí uachtar agam
943
+ 471
944
+ an bhfuil sé a trí a chlog fós
945
+ 472
946
+ cá bhfuil an bille fóin
947
+ 473
948
+ i dtús a shaoil
949
+ 474
950
+ tá sé anseo anois
951
+ 475
952
+ ní liom is leis féin é
953
+ 476
954
+ fréamh chearnach fiche a cúig sin a cúig
955
+ 477
956
+ níl go baileach ach is deas liom a bheith ag feidhmiú
957
+ 478
958
+ comhghairdeachas mór le cnocán an éin fhinn
959
+ 479
960
+ aire rialtais áitiúil
961
+ 480
962
+ cabhraigh liom
963
+ 481
964
+ bhí muc ar gach mala aige
965
+ 482
966
+ beidh sí sa bhaile
967
+ 483
968
+ níl a bhean uasal
969
+ 484
970
+ óráid an uachtaráin micheál d ó huiginn ag cóisir ghaeilge sa ghairdín
971
+ 485
972
+ an fear mór
973
+ 486
974
+ chuaigh sí anonn go dtí an cliabhán
975
+ 487
976
+ tá áthas orm a bheith anseo inniu chun ollamh éireann le filíocht nua a fhógairt
977
+ 488
978
+ an buachaill nach mbeidh ag obair
979
+ 489
980
+ an fhir mhóir
981
+ 490
982
+ an ar an mbord atá an chathaoir
983
+ 491
984
+ a dhaoine uaisle a chairde gael
985
+ 492
986
+ titanic béal feirste an seachtú lá de mhí an mhárta dhá mhíle a cúig déag
987
+ 493
988
+ a bhuachaillí a chailíní agus a chairde go léir
989
+ 494
990
+ is mór an pléisiúr dom é an tochtó cúigiú comórtas náisiúnta treabhdóireachta a oscailt
991
+ 495
992
+ gabhaim buíochas libh a chairde táimid ag tnúth le tuilleadh uaibh ar ball
993
+ 496
994
+ an bhfeiceann tú an leabhar seo a chormaic
995
+ 497
996
+ an dara ceacht déag
997
+ 498
998
+ na seamróga glasa beaga
999
+ 499
1000
+ ar feadh scaithimh
1001
+ 500
1002
+ nach mín atá sí
1003
+ 501
1004
+ ag an bhfuinneog
1005
+ 502
1006
+ airnéis ar an eastát a aistriú chun an fhorais
1007
+ 503
1008
+ an naoú ceacht
1009
+ 504
1010
+ a bhalla diontaobhas ghlas naíon
1011
+ 505
1012
+ bíonn gach tosú lag
1013
+ 506
1014
+ bheadh an capall ag an bhfear do b'fhearr
1015
+ 507
1016
+ anghaol a bhí ann tráth
1017
+ 508
1018
+ cá bhfuil do dheirfiúr a thomáis
mozilla-foundation_common_voice_7_0_ga-IE_test_eval_results.txt ADDED
@@ -0,0 +1,2 @@
 
 
 
1
+ WER: 0.39103690685413006
2
+ CER: 0.16464767104589662
n-gram.ipynb CHANGED
@@ -3,7 +3,7 @@
3
  {
4
  "cell_type": "code",
5
  "execution_count": 1,
6
- "id": "e960dfd7",
7
  "metadata": {},
8
  "outputs": [],
9
  "source": [
@@ -13,7 +13,7 @@
13
  {
14
  "cell_type": "code",
15
  "execution_count": 2,
16
- "id": "7168a253",
17
  "metadata": {},
18
  "outputs": [],
19
  "source": [
@@ -23,7 +23,7 @@
23
  {
24
  "cell_type": "code",
25
  "execution_count": 101,
26
- "id": "e170befe",
27
  "metadata": {},
28
  "outputs": [
29
  {
@@ -49,7 +49,7 @@
49
  {
50
  "cell_type": "code",
51
  "execution_count": 3,
52
- "id": "33973bd4",
53
  "metadata": {},
54
  "outputs": [],
55
  "source": [
@@ -73,7 +73,7 @@
73
  },
74
  {
75
  "cell_type": "markdown",
76
- "id": "53e62728",
77
  "metadata": {},
78
  "source": [
79
  "## N-gram KenLM"
@@ -82,7 +82,7 @@
82
  {
83
  "cell_type": "code",
84
  "execution_count": 4,
85
- "id": "cb04cc9d",
86
  "metadata": {},
87
  "outputs": [
88
  {
@@ -175,7 +175,7 @@
175
  {
176
  "cell_type": "code",
177
  "execution_count": 7,
178
- "id": "06ce00d3",
179
  "metadata": {},
180
  "outputs": [
181
  {
@@ -225,7 +225,7 @@
225
  {
226
  "cell_type": "code",
227
  "execution_count": 8,
228
- "id": "e076416d",
229
  "metadata": {},
230
  "outputs": [],
231
  "source": [
@@ -246,7 +246,7 @@
246
  {
247
  "cell_type": "code",
248
  "execution_count": 9,
249
- "id": "34ac1708",
250
  "metadata": {},
251
  "outputs": [
252
  {
@@ -283,7 +283,7 @@
283
  {
284
  "cell_type": "code",
285
  "execution_count": 10,
286
- "id": "a096b154",
287
  "metadata": {},
288
  "outputs": [],
289
  "source": [
@@ -295,7 +295,7 @@
295
  {
296
  "cell_type": "code",
297
  "execution_count": 11,
298
- "id": "097ae051",
299
  "metadata": {},
300
  "outputs": [],
301
  "source": [
@@ -306,7 +306,7 @@
306
  {
307
  "cell_type": "code",
308
  "execution_count": 12,
309
- "id": "edeb35c3",
310
  "metadata": {},
311
  "outputs": [
312
  {
@@ -330,7 +330,7 @@
330
  {
331
  "cell_type": "code",
332
  "execution_count": 13,
333
- "id": "3e8debd2",
334
  "metadata": {},
335
  "outputs": [],
336
  "source": [
@@ -346,7 +346,7 @@
346
  {
347
  "cell_type": "code",
348
  "execution_count": 15,
349
- "id": "e8f3f674",
350
  "metadata": {},
351
  "outputs": [
352
  {
@@ -366,7 +366,7 @@
366
  {
367
  "cell_type": "code",
368
  "execution_count": 16,
369
- "id": "a260b7f2",
370
  "metadata": {},
371
  "outputs": [
372
  {
@@ -387,7 +387,7 @@
387
  {
388
  "cell_type": "code",
389
  "execution_count": 17,
390
- "id": "b5958d5e",
391
  "metadata": {},
392
  "outputs": [],
393
  "source": [
@@ -397,7 +397,7 @@
397
  {
398
  "cell_type": "code",
399
  "execution_count": 19,
400
- "id": "34798422",
401
  "metadata": {},
402
  "outputs": [
403
  {
@@ -417,10 +417,107 @@
417
  },
418
  {
419
  "cell_type": "code",
420
- "execution_count": null,
421
- "id": "8f2900a8",
422
  "metadata": {},
423
- "outputs": [],
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
424
  "source": [
425
  "repo.push_to_hub(commit_message=\"Upload lm-boosted decoder\")"
426
  ]
 
3
  {
4
  "cell_type": "code",
5
  "execution_count": 1,
6
+ "id": "dd5128ea",
7
  "metadata": {},
8
  "outputs": [],
9
  "source": [
 
13
  {
14
  "cell_type": "code",
15
  "execution_count": 2,
16
+ "id": "b026bf65",
17
  "metadata": {},
18
  "outputs": [],
19
  "source": [
 
23
  {
24
  "cell_type": "code",
25
  "execution_count": 101,
26
+ "id": "dcd259e1",
27
  "metadata": {},
28
  "outputs": [
29
  {
 
49
  {
50
  "cell_type": "code",
51
  "execution_count": 3,
52
+ "id": "980f597f",
53
  "metadata": {},
54
  "outputs": [],
55
  "source": [
 
73
  },
74
  {
75
  "cell_type": "markdown",
76
+ "id": "6bc6ad37",
77
  "metadata": {},
78
  "source": [
79
  "## N-gram KenLM"
 
82
  {
83
  "cell_type": "code",
84
  "execution_count": 4,
85
+ "id": "8d206f65",
86
  "metadata": {},
87
  "outputs": [
88
  {
 
175
  {
176
  "cell_type": "code",
177
  "execution_count": 7,
178
+ "id": "7fbb7b5c",
179
  "metadata": {},
180
  "outputs": [
181
  {
 
225
  {
226
  "cell_type": "code",
227
  "execution_count": 8,
228
+ "id": "5a1f7707",
229
  "metadata": {},
230
  "outputs": [],
231
  "source": [
 
246
  {
247
  "cell_type": "code",
248
  "execution_count": 9,
249
+ "id": "41d18e68",
250
  "metadata": {},
251
  "outputs": [
252
  {
 
283
  {
284
  "cell_type": "code",
285
  "execution_count": 10,
286
+ "id": "7f046bf8",
287
  "metadata": {},
288
  "outputs": [],
289
  "source": [
 
295
  {
296
  "cell_type": "code",
297
  "execution_count": 11,
298
+ "id": "040e764f",
299
  "metadata": {},
300
  "outputs": [],
301
  "source": [
 
306
  {
307
  "cell_type": "code",
308
  "execution_count": 12,
309
+ "id": "4670cffe",
310
  "metadata": {},
311
  "outputs": [
312
  {
 
330
  {
331
  "cell_type": "code",
332
  "execution_count": 13,
333
+ "id": "47a55861",
334
  "metadata": {},
335
  "outputs": [],
336
  "source": [
 
346
  {
347
  "cell_type": "code",
348
  "execution_count": 15,
349
+ "id": "c1fcdaa6",
350
  "metadata": {},
351
  "outputs": [
352
  {
 
366
  {
367
  "cell_type": "code",
368
  "execution_count": 16,
369
+ "id": "a9d242c9",
370
  "metadata": {},
371
  "outputs": [
372
  {
 
387
  {
388
  "cell_type": "code",
389
  "execution_count": 17,
390
+ "id": "719546e1",
391
  "metadata": {},
392
  "outputs": [],
393
  "source": [
 
397
  {
398
  "cell_type": "code",
399
  "execution_count": 19,
400
+ "id": "fb1297ad",
401
  "metadata": {},
402
  "outputs": [
403
  {
 
417
  },
418
  {
419
  "cell_type": "code",
420
+ "execution_count": 20,
421
+ "id": "464b2582",
422
  "metadata": {},
423
+ "outputs": [
424
+ {
425
+ "name": "stderr",
426
+ "output_type": "stream",
427
+ "text": [
428
+ "Adding files tracked by Git LFS: ['5gram.arpa', '5gram_correct.arpa', 'text.txt']. This may take a bit of time if the files are large.\n"
429
+ ]
430
+ },
431
+ {
432
+ "data": {
433
+ "application/vnd.jupyter.widget-view+json": {
434
+ "model_id": "923b145932464690841cbd628875e90d",
435
+ "version_major": 2,
436
+ "version_minor": 0
437
+ },
438
+ "text/plain": [
439
+ "Upload file 5gram_correct.arpa: 0%| | 3.39k/359M [00:00<?, ?B/s]"
440
+ ]
441
+ },
442
+ "metadata": {},
443
+ "output_type": "display_data"
444
+ },
445
+ {
446
+ "data": {
447
+ "application/vnd.jupyter.widget-view+json": {
448
+ "model_id": "86826c7762294d078a11238e64ac705f",
449
+ "version_major": 2,
450
+ "version_minor": 0
451
+ },
452
+ "text/plain": [
453
+ "Upload file language_model/5gram.bin: 0%| | 3.39k/166M [00:00<?, ?B/s]"
454
+ ]
455
+ },
456
+ "metadata": {},
457
+ "output_type": "display_data"
458
+ },
459
+ {
460
+ "data": {
461
+ "application/vnd.jupyter.widget-view+json": {
462
+ "model_id": "63a86182e31841ebbde5cb858a86d306",
463
+ "version_major": 2,
464
+ "version_minor": 0
465
+ },
466
+ "text/plain": [
467
+ "Upload file text.txt: 0%| | 3.39k/28.5M [00:00<?, ?B/s]"
468
+ ]
469
+ },
470
+ "metadata": {},
471
+ "output_type": "display_data"
472
+ },
473
+ {
474
+ "data": {
475
+ "application/vnd.jupyter.widget-view+json": {
476
+ "model_id": "13a98591dfc94fb5b4a48b57f6060f44",
477
+ "version_major": 2,
478
+ "version_minor": 0
479
+ },
480
+ "text/plain": [
481
+ "Upload file wandb/offline-run-20220203_154548-23cvd7o7/run-23cvd7o7.wandb: 0%| | 3.39k/40.9M [00:00…"
482
+ ]
483
+ },
484
+ "metadata": {},
485
+ "output_type": "display_data"
486
+ },
487
+ {
488
+ "data": {
489
+ "application/vnd.jupyter.widget-view+json": {
490
+ "model_id": "ad9671ad9a0f476f90041ada1278c553",
491
+ "version_major": 2,
492
+ "version_minor": 0
493
+ },
494
+ "text/plain": [
495
+ "Upload file 5gram.arpa: 0%| | 3.39k/359M [00:00<?, ?B/s]"
496
+ ]
497
+ },
498
+ "metadata": {},
499
+ "output_type": "display_data"
500
+ },
501
+ {
502
+ "name": "stderr",
503
+ "output_type": "stream",
504
+ "text": [
505
+ "To https://huggingface.co/jcmc/wav2vec-cv7-1b-ir\n",
506
+ " e90ef2f..cee3305 main -> main\n",
507
+ "\n"
508
+ ]
509
+ },
510
+ {
511
+ "data": {
512
+ "text/plain": [
513
+ "'https://huggingface.co/jcmc/wav2vec-cv7-1b-ir/commit/cee330588cadf6700b6e7cf42971cde5342da76e'"
514
+ ]
515
+ },
516
+ "execution_count": 20,
517
+ "metadata": {},
518
+ "output_type": "execute_result"
519
+ }
520
+ ],
521
  "source": [
522
  "repo.push_to_hub(commit_message=\"Upload lm-boosted decoder\")"
523
  ]