Bảo Mai Chí
Update README.md
7a1b01a verified
metadata
license: apache-2.0
base_model: huggingface-course/mt5-finetuned-amazon-en-es
tags:
  - generated_from_trainer
  - vietnamese
metrics:
  - rouge
model-index:
  - name: vietnamese_mt5_summary_model
    results: []
datasets:
  - TrongNghiaCS/vietnews_clean
language:
  - vi
pipeline_tag: summarization
widget:
  - text: >-
      Phương án chuyển một số quỹ nhà tái định cư chưa sử dụng thành nhà ở xã
      hội từng được cơ quan chức năng tính đến nhưng vẫn gặp nhiều khó khăn khi
      triển khai. Tham gia tư vấn một trường hợp cụ thể, tôi mới cảm nhận rõ đây
      thực sự là bài toán khó từ nhiều khía cạnh: điều chỉnh thủ tục pháp lý,
      thiết kế và cả trở ngại từ phía địa phương.Thủ tục pháp lý là nút thắt đầu
      tiên khi chuyển đổi công năng nhà tái định cư bỏ hoang sang nhà ở xã hội.
      Xuất phát điểm của hai loại dự án này khác nhau nên thủ tục pháp lý, tiêu
      chuẩn thiết kế cũng khác biệt. Khi chuyển đổi công năng, cơ quan chức năng
      phải điều chỉnh lại gần như toàn bộ thủ tục pháp lý dự án.
    example_title: Example 1
  - text: >-
      Trẻ cuối cấp sẽ ráo riết ôn thi. Con gái người bạn tôi - được mẹ định
      hướng thi vào trường THPT hàng đầu ở thủ đô - đã bắt đầu từ tuần này lịch
      học sáu buổi mỗi tuần. Có hôm, cháu học cả ngày, trưa chỉ kịp ghé hàng
      quán, hoặc ăn vội bát mỳ ở nhà. Các buổi tối, cháu sẽ tập trung ôn lại
      kiến thức trong lớp học thêm. Bạn tôi nói, nếu không vào guồng như vậy,
      cháu sẽ không cạnh tranh nổi với tỷ lệ chọi mười em lấy một.Học sinh không
      thuộc các lớp cuối cấp cũng học hè để biết trước kiến thức mới, mà theo
      nhiều phụ huynh, là nhằm tạo đà, giúp con chạy nhanh hơn các bạn khi vào
      năm học chính thức. Số trẻ còn lại, không nhất thiết lao theo cuộc đua
      kiến thức và thành tích, thì cần một chỗ để ký gửi vì không có ai trông
      trong những ngày hè.
    example_title: Example 2
  - text: >-
      Vài tuần trước khi cháu thi vào lớp 10 - kỳ thi khốc liệt nhất trong cuộc
      đời đa số bạn trẻ ở Hà Nội, mẹ con lại nói chuyện. Tôi nói, 10 năm trước
      mắt có thể là 10 năm quan trọng nhất cuộc đời con. Vào trường nào, đại học
      ngành gì, công việc đầu tiên ở đâu, và rất có thể là mối tình thứ nhất,
      rồi kết hôn và sinh con. Tất cả đều có thể diễn ra trong khoảng thời gian
      15 đến 25 tuổi. Và những quyết định trong thời gian này, nhất là quyết
      định về nghề nghiệp, gần như sẽ ảnh hưởng tới toàn bộ quãng đời còn lại.
    example_title: Example 3
  - text: >-
      Giữa năm ngoái, Bộ Lao động, Thương binh và Xã hội ra hướng dẫn: lao động
      bị nợ bảo hiểm xã hội sẽ được giải quyết theo hướng đóng đến đâu hưởng đến
      đó, tức thời gian nợ được khoanh lại. Người lao động có thể tham gia bảo
      hiểm xã hội theo hình thức tự nguyện cho các tháng còn thiếu để được nhận
      lương hưu. Tuy nhiên, không phải ai cũng chấp nhận cách này. Vì số tiền
      một cục bỏ ra để đóng là khá lớn, trong khi lương hưu hàng tháng nhận được
      có thể chỉ hơn một triệu đồng, do không được nâng lên bằng lương cơ sở
      (1,8 triệu đồng) như người có cả quá trình tham gia bắt buộc. Hội bạn già
      của cô còn nói gở: đóng xong, xui rủi ra đường xe tông hoặc ốm đau, trời
      gọi sớm, thì coi như lỗ. Tuổi già lắm bệnh như chuối chín cây.
    example_title: Example 4

vietnamese_mt5_summary_model

This model is a fine-tuned version of huggingface-course/mt5-finetuned-amazon-en-es on the None dataset. It achieves the following results on the evaluation set:

  • Loss: 1.4447
  • Rouge1: 28.6205
  • Rouge2: 12.1892
  • Rougel: 22.6626
  • Rougelsum: 22.9635

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

  • learning_rate: 0.001
  • train_batch_size: 16
  • eval_batch_size: 16
  • seed: 42
  • optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
  • lr_scheduler_type: linear
  • lr_scheduler_warmup_steps: 3000
  • num_epochs: 10

Training results

Training Loss Epoch Step Validation Loss Rouge1 Rouge2 Rougel Rougelsum
2.7781 1.0 625 1.8391 28.5024 11.2717 22.108 22.4361
2.0622 2.0 1250 1.7576 28.0245 10.6112 21.7353 22.0685
1.8636 3.0 1875 1.6179 27.353 10.6238 21.4686 21.7512
1.7408 4.0 2500 1.6143 28.0928 11.2857 22.06 22.3629
1.6492 5.0 3125 1.5411 27.8209 10.9184 21.6819 21.9773
1.5448 6.0 3750 1.4802 28.0433 11.4232 22.0696 22.373
1.4454 7.0 4375 1.4621 27.8552 11.1708 21.8958 22.1949
1.3636 8.0 5000 1.4522 28.3264 11.7945 22.3563 22.6524
1.2978 9.0 5625 1.4347 28.444 11.9388 22.4279 22.7344
1.2445 10.0 6250 1.4447 28.6205 12.1892 22.6626 22.9635

Framework versions

  • Transformers 4.41.2
  • Pytorch 2.3.1+cu121
  • Datasets 2.19.2
  • Tokenizers 0.19.1