text2tags / README.md
efederici's picture
Update README.md
dc27bce
|
raw
history blame
No virus
7.85 kB
metadata
language:
  - it
tags:
  - summarization
  - tags
  - Italian
inference:
  parameters:
    do_sample: false
    min_length: 0
    beam_size: 4
    early_stopping: true
widget:
  - text: >-
      Nel 1924 la scrittrice Virginia Woolf affrontò nel saggio Mr Bennett e Mrs
      Brown il tema della costruzione e della struttura del romanzo, genere
      all’epoca considerato in declino a causa dell’incapacità degli autori e
      delle autrici di creare personaggi realistici. Woolf raccontò di aver a
      lungo osservato, durante un viaggio in treno da Richmond a Waterloo, una
      signora di oltre 60 anni seduta davanti a lei, chiamata signora Brown. Ne
      rimase affascinata, per la capacità di quella figura di evocare storie
      possibili e fare da spunto per un romanzo: «tutti i romanzi cominciano con
      una vecchia signora seduta in un angolo». Immagini come quella della
      signora Brown, secondo Woolf, «costringono qualcuno a cominciare, quasi
      automaticamente, a scrivere un romanzo». Nel saggio Woolf provò ad
      analizzare le tecniche narrative utilizzate da tre noti scrittori inglesi
      dell’epoca – H. G. Wells, John Galsworthy e Arnold Bennett – per
      comprendere perché le convenzioni stilistiche dell’Ottocento risultassero
      ormai inadatte alla descrizione dei «caratteri» umani degli anni Venti. In
      un lungo e commentato articolo del New Yorker, la critica letteraria e
      giornalista Parul Sehgal, a lungo caporedattrice dell’inserto culturale
      del New York Times dedicato alle recensioni di libri, ha provato a
      compiere un esercizio simile a quello di Woolf, chiedendosi come gli
      autori e le autrici di oggi tratterebbero la signora Brown. E ha
      immaginato che probabilmente quella figura non eserciterebbe su di loro
      una curiosità e un fascino legati alla sua incompletezza e al suo aspetto
      misterioso, ma con ogni probabilità trasmetterebbe loro l’indistinta e
      generica impressione di aver subìto un trauma. Facendo riferimento non
      soltanto ai romanzi ma anche ai film, alle serie televisive e ad altri
      prodotti culturali della nostra epoca, il New Yorker si è chiesto setrauma
      non sia diventato un cliché alla base di innumerevoli narrazioni
      stereotipate e incapaci di generare trame che siano sostanzialmente
      differenti le une dalle altre. Ciò che accomunerebbe quelle di film, serie
      e racconti attuali sarebbe il costante indirizzamento dell’attenzione e
      della curiosità del pubblico verso il passato dei personaggi, come se il
      presupposto di ciascuna di quelle storie fosse il danno psicologico subìto
      da ciascuno di essi.
    example_title: Virginia Woolf
  - text: >-
      I lavori di ristrutturazione dell’interno della cattedrale di Notre-Dame a
      Parigi, seguiti al grande incendio che nel 2019 bruciò la guglia e buona
      parte del tetto, sono da settimane al centro di un acceso dibattito sui
      giornali francesi per via di alcune proposte di rinnovamento degli interni
      che hanno suscitato critiche e allarmi tra esperti e opinionisti
      conservatori. Il progetto ha ricevuto una prima approvazione dalla
      commissione nazionale competente, ma dovrà ancora essere soggetto a varie
      revisioni e ratifiche che coinvolgeranno tecnici e politici locali e
      nazionali, fino al presidente Emmanuel Macron. Ma le modifiche previste al
      sistema di viabilità per i visitatori, all’illuminazione, ai posti a
      sedere e alle opere d’arte che si vorrebbero esporre hanno portato alcuni
      critici a parlare di «parco a tema woke» e «Disneyland del politicamente
      corretto». Descrivendo il piano di restauro, Le Monde dice che la proposta
      è di far entrare i visitatori attraverso il portale centrale, e non più
      attraverso quello a sud. L’obiettivo, secondo il coordinatore padre
      Drouin, è «farsi catturare dall’assialità dell’edificio» e essere
      incoraggiati a spostarsi da nord a sud e non viceversa. Tutto intorno alla
      navata, il “percorso catecumenale” tenterà di spiegare al visitatore il
      cammino della fede, un percorso per passare simbolicamente «dalle tenebre
      alla luce». Sei delle sette cappelle a nord della navata sarebbero
      dedicate ciascuna a un passo dell’Antico Testamento. Superato il
      transetto, il visitatore entrerebbe poi nell’ambulacro «per vivere il
      mistero della fede» e vedere la corona di spine, la reliquia che avrebbe
      ricoperto il capo di Cristo. L’idea è poi quella di abbassare
      l’illuminazione e di rendere più soffusa la luce, «per ritrovare qualcosa
      del mistero della cattedrale», dice Le Monde. Le sedie in paglia
      dovrebbero essere sostituite con panche e banchi appositamente studiati
      per illuminare i messali durante le funzioni serali e notturne. Le sedute
      dovrebbero essere mobili: pensate, cioè, per essere spostate durante le
      funzioni meno frequentate. I banchi, poi, scrive sempre Le Monde, avranno
      anche la funzione di casse di risonanza «per dare voce al coro dei
      fedeli».
    example_title: Notre-Dame

text2tags-it

The model has been trained on a collection of 11k news articles with tags. Its purpose is to create tags suitable for the given article.

Usage

Sample code with an article from IlPost:

from transformers import T5ForConditionalGeneration,T5Tokenizer

model = T5ForConditionalGeneration.from_pretrained("efederici/text2tags-it")
tokenizer = T5Tokenizer.from_pretrained("efederici/text2tags-it")

article = '''
Nel 1924 la scrittrice Virginia Woolf affrontò nel saggio Mr Bennett e Mrs Brown il tema della costruzione e della struttura del romanzo, genere all’epoca considerato in declino a causa dell’incapacità degli autori e delle autrici di creare personaggi realistici. Woolf raccontò di aver a lungo osservato, durante un viaggio in treno da Richmond a Waterloo, una signora di oltre 60 anni seduta davanti a lei, chiamata signora Brown. Ne rimase affascinata, per la capacità di quella figura di evocare storie possibili e fare da spunto per un romanzo: «tutti i romanzi cominciano con una vecchia signora seduta in un angolo».
Immagini come quella della signora Brown, secondo Woolf, «costringono qualcuno a cominciare, quasi automaticamente, a scrivere un romanzo». Nel saggio Woolf provò ad analizzare le tecniche narrative utilizzate da tre noti scrittori inglesi dell’epoca – H. G. Wells, John Galsworthy e Arnold Bennett – per comprendere perché le convenzioni stilistiche dell’Ottocento risultassero ormai inadatte alla descrizione dei «caratteri» umani degli anni Venti.
In un lungo e commentato articolo del New Yorker, la critica letteraria e giornalista Parul Sehgal, a lungo caporedattrice dell’inserto culturale del New York Times dedicato alle recensioni di libri, ha provato a compiere un esercizio simile a quello di Woolf, chiedendosi come gli autori e le autrici di oggi tratterebbero la signora Brown. E ha immaginato che probabilmente quella figura non eserciterebbe su di loro una curiosità e un fascino legati alla sua incompletezza e al suo aspetto misterioso, ma con ogni probabilità trasmetterebbe loro l’indistinta e generica impressione di aver subìto un trauma.
'''

def tag(text: str):
    """ Generates tags from given text """
    text = text.strip().replace('\n', '')
    tokenized_text = tokenizer.encode(text, return_tensors="pt")

    tags_ids = model.generate(tokenized_text,
                                        num_beams=4,
                                        no_repeat_ngram_size=2,
                                        max_length=20,
                                        early_stopping=True)

    output = tokenizer.decode(tags_ids[0], skip_special_tokens=True)
    return output.split(',')

tags = tag(article)
print(tags)

Overview

  • Model: T5 (it5-small)
  • Language: Italian
  • Downstream-task: Summarization (for topic tagging)
  • Training data: Custom dataset
  • Code: See example
  • Infrastructure: 1x T4