vn_bi_encoder_16neg / README.md
meandyou200175's picture
Add new SentenceTransformer model
06b4533 verified
metadata
base_model: bkai-foundation-models/vietnamese-bi-encoder
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
  - dot_accuracy@1
  - dot_accuracy@3
  - dot_accuracy@5
  - dot_accuracy@10
  - dot_precision@1
  - dot_precision@3
  - dot_precision@5
  - dot_precision@10
  - dot_recall@1
  - dot_recall@3
  - dot_recall@5
  - dot_recall@10
  - dot_ndcg@10
  - dot_mrr@10
  - dot_map@100
pipeline_tag: sentence-similarity
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:43804
  - loss:MultipleNegativesRankingLoss
widget:
  - source_sentence: >-
      Nhờ bác sĩ cho biết việc lựa chọn đóng đinh nội tủy và nẹp vít để kết hợp
      xương đòn dựa trên cơ sở nào ạ? Ca phẫu thuật thường kéo dài trong bao
      lâu? Bệnh nhân nằm viện mấy ngày?
    sentences:
      - ' Chào em, là bệnh mãn tính phải điều trị suốt đời, phải kiên nhẫn và kiên trì nên đôi khi lượng đường trong cơ thể không ổn định. Lúc đi khám xét nghiệm thì ổn do bản thân biết mai đi khám nên sẽ kiêng ăn, ăn ít... còn bệnh lâu dài nên trong ngày đôi khi thèm chút này hay thích ăn chút kia, quên uống thuốc, suy nghĩ, mất ngủ cũng làm đường không ổn định. Đường trong cơ thể lúc lên lúc xuống dễ đưa đến biến chứng. Em hay thấy bệnh nhân tiểu đường tháo khớp ngón chân, ngón tay, đôi khi tháo khớp gối, khớp háng, đây là do tê liệt hệ thần kinh nên khi va chạm bệnh nhân không phát hiện. Đến khi phát hiện thì đã nhiễm trùng nặng phải tháo khớp. Theo BS mẹ em có khả năng do biến chứng tiểu đường vì mẹ em bị bệnh khá lâu nên ít nhiều ảnh hưởng thần kinh bị tê liệt gây đau. Em nên nhớ dặn mẹ đi tái khám và điều trị cho thật ổn định nhé! Thân mến!'
      - ' Để lựa chọn phương pháp đóng đinh nội tủy hay nẹp vít cho bệnh nhân cần dựa vào nhiều yếu tố. Trong lòng tủy xương có một cái ống, nếu lòng tủy bệnh nhân nhỏ mà đường gãy không bị gãy thành nhiều mảnh thì nên lựa chọn phương pháp đóng đinh. Phương pháp này có nhược điểm dễ bị lộ phần đinh khi đinh vừa đóng, chưa chắc vào xương. Tuy nhiên, ưu điểm là khi đóng đinh, đường mổ sẽ nhỏ, đơn giản. Đối với nẹp vít, đường mổ dài hơn nhưng phần nắn chỉnh sẽ tuyệt đối, vững chắc hơn. Nhìn chung, giữa 2 phương pháp thời gian mổ không khác biệt nhau nhiều, từ 30-45 phút sẽ hoàn thành cuộc phẫu thuật kết hợp xương. Tại bệnh viện Nhân dân 115, sau khi bệnh nhân được làm phẫu thuật có thể xuất viện rất sớm trong vòng khoảng 3-5 ngày, tùy theo đường mổ lớn hay nhỏ. Giữa việc lựa chọn phẫu thuật hay bảo tồn, đinh nội tủy hay nẹp vít phụ thuộc vào lòng tủy của bệnh nhân và thói quen, sự đánh giá của phẫu thuật viên. Cá nhân tôi thường lựa chọn phương pháp phẫu thuật nẹp vít sẽ cho kết quả nắn chỉnh tốt, chắc hơn và bệnh nhân không bị biến chứng trồi đinh về sau. Thân mến.'
      - >-
        Chào em, Tình trạng người mệt mỏi, khó thở, tim đập nhanh xảy ra khi
        không gắng sức có thể do nhiều nguyên nhân, gồm tim mạch, hô hấp, thần
        kinh cơ, tiêu hóa (chủ yếu là ống tiêu hóa trên), tâm lý, bệnh lý nội
        tiết tố… Viêm dạ dày trào ngược có thể gây các triệu chứng này do dịch
        acid trào ngược từ dạ dày lên thực quản kích thích thần kinh tim. Mặt
        khác bệnh dạ dày là bệnh có thể tái phát, điều trị hết bệnh rồi thì bệnh
        vẫn có thể tái lại. Do đó, nếu em đã khám tim mạch và hô hấp bình
        thường, để biết có phải mình mệt mỏi do bệnh dạ dày gây ra hay không thì
        tốt nhất là em khám chuyên khoa nội tiêu hóa và điều trị trào ngược dạ
        dày thực quản thử, nếu triệu chứng cải thiện nhanh chóng thì chính hắn
        là nguyên nhân, em nhé.
  - source_sentence: >-
      Tôi bị tình trạng nuốt nước miếng có cảm giác bị vướng ở cổ, không đau
      rát, không ho sốt, ăn uống bình thường đã 1 ngày nay. Chỉ có nuốt nước
      miếng là có cảm giác vướng thôi, lỗ tai bên trái thì cảm giác ngứa nhẹ.
      Xin hỏi là bệnh gì vậy ạ?
    sentences:
      - "Em Lan thân mến, Hiện nay, xét nghiệm được xem là một xét nghiệm\r\nthường quy, nên thai kỳ của em cũng rất cần được làm những xét nghiệm này mặc\r\ndù gia đình em không có bệnh lý bất thường. Tuy nhiên, thai kỳ của em đã qua thời gian làm xét nghiệm Double test, bây\r\ngiờ em phải chờ đến lúc thai được 16 – 18 tuần tuổi, làm xét nghiệm Triple test\r\nem nhé! Chúc em và bé khỏe mạnh!"
      - >-
        Trường hợp thoái hóa cột sống thắt lưng gây đau mỏi liên tục dù đã dùng
        thuốc giảm đau liều cao Chào em, Thoái hóa khớp, thoái hóa cột sống là
        tiến trình lão hóa không thể tránh khỏi của con người, đặc biệt có thể
        xảy ra sớm và nhanh hơn ở người nữ sau mãn kinh, sinh nở nhiều, suy dinh
        dưỡng hay ăn uống thiếu chất khoáng, lao động vất vả lúc còn trẻ. Trường
        hợp thoái hóa cột sống thắt lưng gây đau mỏi liên tục dù đã dùng thuốc
        giảm đau liều cao, đặc biệt là đau lan xuống hai chân, tê yếu hai chân
        thì cần chụp MRI cột sống để tầm soát thoát vị đĩa đệm chèn ép tủy sống.
        Trường hợp của em, mới phát hiện thoái hóa cột sống thắt lưng gần đây,
        cũng mới uống thuốc 1 tuần và không duy trì nữa, việc đau lưng vẫn còn
        âm ỉ nhưng không lan xuống hai chân thì chưa đến mức cần chụp MRI cột
        sống thắt lưng. Nhưng mà, em cần tích cực điều trị để bệnh thoái hóa cột
        sống thắt lưng không tiến triển nặng hơn. Bệnh này trị khỏi hoàn toàn là
        không thể, vì sinh lão bệnh tử không thể cải hoàn, nhưng mà việc điều
        trị tích cực sẽ giúp khống chế được bệnh, giảm đau và giảm tốc độ tiến
        triển của bệnh. Về việc sử dụng thuốc, dù là thuốc Tây hay thuốc Đông y,
        em cũng cần phải thăm khám bs ck cơ xương khớp (Tây y) hay ck y học cổ
        truyền (Đông y) để được kê thuốc phù hợp. các thuốc thường dùng là giảm
        đau, giãn cơ, bổ sung vi khoáng chất (canxi, vitamin D3, magie...). Bên
        cạnh đó, về phương pháp giảm đau hỗ trợ không dùng thuốc, em nên chú ý:
        - Chú ý thay đổi tư thế trong quá trình làm việc, không giữ mãi một tư
        thế trong nhiều giờ liền. Ngồi làm việc đúng tư thế để tránh các bệnh
        cột sống. - Vận động đúng cách, khi vác vật nặng không vặn cột sống. -
        Thường xuyên tập thể dục rèn luyện để cột sống vững chắc, cơ thể dẻo
        dai, bơi cũng được mà yoga là tốt nhất. - Ăn uống khoa học, xây dựng chế
        độ dinh dưỡng hợp lý, tăng cường nhóm thực phẩm giàu canxi, vitamin D,
        omega 3… giúp nâng cao độ chắc khỏe của đĩa đệm cũng như xương khớp. -
        Duy trì cân nặng bình thường, tránh để tăng cân quá mức. - Tư thế ngủ:
        nằm ngửa trên ván cứng hay nệm bông ép chặt, tránh nệm lò xo hay nệm cao
        su quá mềm, có thể đệm ở vùng khoeo làm co nhẹ khớp gối và khớp háng,
        nên nằm đầu thấp không gối sẽ tốt cho cột sống cổ. - Có thể thực hiện
        điều trị vật lý và các liệu pháp phản xạ: bao gồm phương pháp nhiệt như
        chườm nóng (túi nước, muối rang, cám rang, lá lốt, lá ngải cứu nóng);
        dùng các dòng điện tại khoa vật lý trị liệu, điều trị bằng laser; châm
        cứu, kéo cơ để hỗ trợ giảm đau cơ cạnh sống. Trân trọng!
      - >-
        Chào bạn, Nuốt vướng ở cổ thường gặp trong một số bệnh lý viêm nhiễm hầu
        họng như viêm họng, viêm amidan mạn, trào ngược dạ dày thực quản, hội
        chứng chảy mũi sau… Đây là có thể là triệu chứng đầu tiên báo hiệu một
        đợt bùng phát cấp tính của viêm nhiễm hô hấp trên do triệu chứng mới chỉ
        xuất hiện 1 ngày. Bạn nên khám bác sĩ Tai mũi họng để thăm khám trực
        tiếp, đánh giá và kê toa điều trị bạn nhé! Thân mến.
  - source_sentence: >-
      Chào bác sĩ, em bị gãy xương gót, đã đóng đinh đến nay được gần 5 tuần.
      Vậy 6 tuần em tháo đinh được chưa ạ?
    sentences:
      - ' Chào em, gồm 2 trị số, trị số lớn nhất gọi là huyết áp tâm thu, bình thường < 140 và > 90 mmHg; trị số thấp nhất gọi là huyết áp tâm trương, bình thường < 90 và > 60 mmHg. Huyết áp có thể tăng khi căng thẳng, do lo lắng, do hội chứng áo choàng trắng (khi vào bv, khi gặp bác sĩ thì huyết áp cao), bệnh lý viêm nhiễm, do cafe, khi khó thở... nhìn chung là các stress đối với cơ thể. Như vậy, huyết áp ghi nhận ở những lúc cơ thể đang lo lắng, bồn chồn, có bệnh thì sẽ không phản ánh chính xác được huyết áp dao động bình thường của người bệnh. Do vậy em nên khám chuyên khoa tim mạch, bác sĩ sẽ thăm khám và làm xét nghiệm kiểm tra xem em có các dấu chứng của tăng huyết áp hay không (như dày thành tim, tiểu đạm, đo huyết áp 24 giờ...) để xác định em có tăng huyết áp hay không và điều trị thích hợp. Những triệu chứng hoa mắt, chóng mặt, đau đầu, đau 1 bên mắt, tiểu nhiều có thể là do bệnh tăng huyết áp gây ra (ảnh hưởng lên mạch máu não, lên thận...) hoặc là 1 bệnh lý khác như thiếu máu, rối loạn tiền đình, viêm nhiễm hệ thống, viêm mũi xoang, bệnh lý mạch máu não... (và tăng huyết áp chỉ là phản ứng của cơ thể khi có stress). Để tìm ra bệnh và giải quyết nỗi lo về bệnh, em nên đến bệnh viện để kiểm tra sức khỏe em nhé. Thân mến! '
      - ' Chào em, Thời điểm 6 tuần là quá sớm để rút đinh cố định xương gót (trừ trường hợp khung cố định xương bên ngoài). Tháo đinh vít kim loại chỉ bắt buộc thực hiện sớm trong những trường hợp bất thường như gãy vít, nhiễm trùng, khớp giả... gây ra các triệu chứng bất thường với bệnh nhân mà thôi. Em nên tái khám tại chuyên khoa Chấn thương Chỉnh hình để bác sĩ kiểm tra lại việc lành xương của em tốt chưa và dặn em lịch trình rút đinh phù hợp, em nhé. Thân mến.'
      - >-
        K dạ dày không điều trị tiên lượng sống khá ngắn Chào em, K dạ dày là
        ung thư dạ dày. Bệnh ung thư dạ dày là bệnh lý ác tính và có chỉ định
        phẫu thuật cắt khối u – cắt dạ dày khi còn có thể cắt được. Nếu đã phát
        hiện ung thư dạ dày mà không điều trị phẫu thuật thì thời gian sống của
        bệnh nhân trung bình là 6 tháng đến 1 năm tùy loại ung thư dạ dày, khi
        ung thư tiến triển di căn có thể gây nhiều đau đớn hơn. Hiện tại chị em
        đang bị suy nhược cơ thể nhiều, không ăn uống được, đau nhiều do ung thư
        dạ dày là có chỉ định vào bệnh viện nằm điều trị luôn rồi, chứ không thể
        nào lấy thuốc mà không tới phòng khám được đâu. Vô bệnh viện chị em sẽ
        được truyền dịch, chích thuốc, nâng thể trạng lên rồi mới tính đến
        chuyện điều trị khối ung thư kia. Em đưa chị em đến bệnh viện càng sớm
        càng tốt, tốt nhất là bệnh viện Ung bướu, em nhé.
  - source_sentence: "Thưa bác sĩ,\r\n\r\nEm bị đục thủy tinh thể do chấn thương và vừa mổ mắt về và em cũng bị cận thị. Thời gian khoảng 1 tuần em thấy mắt mình nhìn chỉ rõ hơn được 1 phần nào. Nhìn xa thì vẫn thấy nhưng vẫn mờ mờ. Bác sĩ cho em lời khuyên nên làm cách nào và mắt em có thể sáng lại như bình thường được không ạ?\r\n\r\nEm xin chân thành cảm ơn! (Minh Tiến - Bình Định)"
    sentences:
      - "Bạn Minh Tiến thân mến, Hiện nay phẫu thuật đục thủy tinh thể đã được y học nói chung và ngành Nhãn khoa Việt Nam thực hiện hoàn chỉnh đến mức tuyệt vời. Phẫu thuật này được xem như một cuộc cách mạng rất đáng tự hào của ngành nhãn khoa. Hàng ngày có thể tới hàng ngàn ca phẫu thuật\_đem lại ánh sáng cho người mù lòa đục thể thủy tinh tại Việt Nam. Nói như vậy để giúp cho bạn hiểu rõ phẫu thuật này các bác sĩ Việt Nam thực hiện rất thường xuyên và rất tốt. Tuy nhiên, với mắt đục thủy tinh thể do chấn thương của bạn là ca phẫu thuật tương đối không đơn giản. Thêm vào đó ngoài đục thủy tinh thể do chấn thương, mắt bạn cũng có thể kèm theo tổn thương ở các bộ phận khác của mắt mà trước mổ bác sĩ khó có thể chẩn đoán được. Với hai lý do nêu trên, nên đôi khi mắt mổ khó có thể tốt theo ý muốn của cả bệnh nhân lẫn thầy thuốc. Bạn cần có thời gian theo dõi và điều trị tiếp sau mổ. Sau thời gian ổn định khoảng 1 tháng, bạn cần đo thử kính xem có cải thiện thị lực thêm không? Chúc bạn may mắn!"
      - >-
        Chào em, Bình thường các hạch trong cơ thể không sưng to lên đến mức có
        thể sờ chạm hay nhận biết được. Vì thế, hạch sưng lên, hay thường gọi là
        nổi hạch, là một triệu chứng bất thường của cơ thể. Cho nên, em lo lắng
        là đúng khi phát hiện hạch ở vùng cổ. Hạch bạch huyết đóng vai trò quan
        trọng đối với hoạt động của hệ miễn dịch. Chúng chứa các tế bào miễn
        dịch như lympho bào, đại thực bào... có chức năng miễn dịch chống lại
        các yếu tố lạ như vi khuẩn, virus, kí sinh trùng... xâm nhập vào cơ thể.
        Trong quá trình đó các hạch có thể bị viêm và sưng lên. Một số trường
        hợp hạch sưng có thể là hạch ung thư hoặc di căn. Đặc điểm của hạch viêm
        là nhỏ, số lượng ít, bờ tròn đều, không phát triển theo thời gian, không
        xâm lấn da xung quanh. Thông thường đối với hạch viêm thì nguồn viêm có
        thể tấn công tại hạch, cũng có khi là hạch viêm phản ứng với ổ viêm
        nhiễm cạnh đó, điều trị hết viêm thì hạch sẽ lặn dần, có thể lặn chậm
        hơn vài tuần đến vài tháng, có một số loại hạch cũng là hạch viêm nhưng
        mà chỉ giảm kích thước rồi cứ "lì" vậy luôn - không lặn hẳn nhưng không
        còn sưng như trước và vẫn giữ hình ảnh của hạch viêm, cũng có loại hạch
        viêm sau lại chuyển sang xơ chai hóa như sẹo cũ và không lặn. Như vậy,
        em có 1 hạch vùng cổ đã được xác định là hạch viêm thông qua sinh thiết
        hạch cách đây 10 năm. Trong vòng 10 năm nay, hạch cổ đó không có triệu
        chứng bất thường. Gần đây, hạch cổ đó có biểu hiện viêm trở lại, mặc dù
        em uống thuốc (tự mua) thì hạch hết sưng đau, nhưng em cũng cần khám lại
        bên chuyên khoa ung bướu để kiểm tra tổng quát lại 1 lần, tìm nguyên
        nhân gây kích thích hạch viêm này tái hoạt động, xem là nguyên nhân lành
        tính hay tiềm ẩn nguyên nhân khác (vì lần kiểm tra trước đã cách đây 10
        năm rồi), em nhé.
      - ' Chào em, Trường hợp em mô tả là những bất thường của hệ hô hấp có thể là bệnh lý tai mũi họng hay hô hấp dưới như viêm phổi, viêm phế quản, em cần đến các cơ sở y tế chuyên sâu tai mũi họng hay hô hấp để khám thêm. Những biểu hiện đó hoàn toàn không có cơ sở nghĩ . Thân mến!'
  - source_sentence: >-
      Bác sĩ cho em hỏi, em bị rạn nứt xương gót chân bên phải. Em bị hơn 1
      tháng nay rồi. Em bỏ thuốc lá. Em muốn hỏi bác sĩ thông thường bó bột hơn
      hay thuốc lá hơn? Như của em khoảng bao lâu thì khỏi? Và giờ em vẫn chưa
      đi được bác sĩ ạ. Em cảm ơn.
    sentences:
      - >-
        Câu hỏi của em rất chân thành. Tự ý thức quyết tâm cai nghiệm là điều
        đáng quý. Nếu em tiếp tục sử dụng thì tình trạng sẽ tồi tệ hơn rất
        nhiều. Ba yếu tố quan trọng nhất và tiến hành đồng thời để cai nghiện
        thành công, đó là: 1. Ý chí 2. Sự hiểu biết thấu đáo 3. Môi trường thân
        thiện. Các Trung tâm cai nghiện sẽ giúp em phần 2 và phần 3, từ đó sẽ
        củng cố phần 1 của em. Trường hợp ở nhà mà em tự cai, thực hành mỗi ngày
        với 3 điều kiện trên, em sẽ thành công như nhiều bạn khác. Không nên nôn
        nóng, sốt ruột. Trước tiên em phải thuộc lòng và thực hành những quy tắc
        này thành thói quen và áp dụng suốt đời. Nhiều trường hợp cai được vài
        năm vẫn tái nghiện. Do đó, nên tránh xa những "nguồn" khiến em tái
        nghiện, tránh xa bạn bè nghiện ngập em nhé. Chúc em quyết tâm và đem lại
        niềm vui cho bố mẹ.
      - >-
        Chào em, Thứ nhất, bắt buộc phải có phim Xquang để biết em có thực sự
        nứt xương gót hay bị gãy phức tạp hơn, vì nhiều trường hợp tưởng chỉ nứt
        xương thôi nhưng thật ra là vỡ phức tạp, phải phẫu thuật mới nhanh ổn
        được. Thứ hai, theo nguyên tắc điều trị nứt gãy xương là phải cố định
        tốt để can xương mọc ra, chỗ nứt gãy mới được nối liền. Do đó, nếu bó
        bột thì chân sẽ được cố định liên tục trong 4-6 tuần, còn bó lá thì phải
        thay thường xuyên, mỗi lần thay là 1 lần xê dịch nên xương khó lành. Tốt
        hơn hết em nên đến Bệnh viện Chấn thương Chỉnh hình để được kiểm tra và
        điều trị thích hợp, em nhé. Thân mến.
      - >-
        Chào bạn, Qua hình ảnh sang thương và mô tả triệu chứng, bệnh lý của bạn
        có khả năng là chàm hay còn gọi là viêm da dị ứng với đặc điểm là viêm
        và nổi mụn nhỏ, ngứa ngáy. Nguyên nhân của chàm hiện nay chưa rõ nhưng
        có thể do cơ địa dị ứng (người mắc hen, viêm mũi dị ứng có nguy cơ cao
        mắc chàm), do kích thích của hóa chất như nước rửa chén, bột giặt, cao
        su, kim loại, chất liệu giày dép (chàm tiếp xúc),... Thời tiết lạnh,
        stress, đổ mồ hôi nhiều và phấn hoa... cũng là những nguyên nhân có thể
        khiến da bị chàm. Chàm cũng có thể gặp ở người bị suy van tĩnh mạch,
        giãn tĩnh mạch chân khiến tình trạng bệnh dai dẳng, kém đáp ứng điều
        trị. Điều trị chàm thường phải sử dụng một số loại thuốc bôi da kéo dài,
        có thể để lại tác dụng phụ, do đó bạn nên khám BS Da liễu để kê toa loại
        thuốc phù hợp. Ngoài ra, bạn nên chú ý xem có yếu tố nào thường kích
        thích khởi phát chàm để tránh cho bệnh tái phát bạn nhé! Thân mến.
model-index:
  - name: SentenceTransformer based on bkai-foundation-models/vietnamese-bi-encoder
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: Unknown
          type: unknown
        metrics:
          - type: cosine_accuracy@1
            value: 0.7003287070854638
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.8261504747991234
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.8676040905770636
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.9134404674945216
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.7003287070854638
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.2753834915997078
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.1735208181154127
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.09134404674945214
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.7003287070854638
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.8261504747991234
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.8676040905770636
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.9134404674945216
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.8067566615526722
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.7726399903764786
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.7764065721123147
            name: Cosine Map@100
          - type: dot_accuracy@1
            value: 0.6818845872899927
            name: Dot Accuracy@1
          - type: dot_accuracy@3
            value: 0.8153761869978087
            name: Dot Accuracy@3
          - type: dot_accuracy@5
            value: 0.8621256391526662
            name: Dot Accuracy@5
          - type: dot_accuracy@10
            value: 0.9101533966398831
            name: Dot Accuracy@10
          - type: dot_precision@1
            value: 0.6818845872899927
            name: Dot Precision@1
          - type: dot_precision@3
            value: 0.2717920623326029
            name: Dot Precision@3
          - type: dot_precision@5
            value: 0.1724251278305332
            name: Dot Precision@5
          - type: dot_precision@10
            value: 0.09101533966398831
            name: Dot Precision@10
          - type: dot_recall@1
            value: 0.6818845872899927
            name: Dot Recall@1
          - type: dot_recall@3
            value: 0.8153761869978087
            name: Dot Recall@3
          - type: dot_recall@5
            value: 0.8621256391526662
            name: Dot Recall@5
          - type: dot_recall@10
            value: 0.9101533966398831
            name: Dot Recall@10
          - type: dot_ndcg@10
            value: 0.7954203289199318
            name: Dot Ndcg@10
          - type: dot_mrr@10
            value: 0.758727115146035
            name: Dot Mrr@10
          - type: dot_map@100
            value: 0.7625999642800587
            name: Dot Map@100

SentenceTransformer based on bkai-foundation-models/vietnamese-bi-encoder

This is a sentence-transformers model finetuned from bkai-foundation-models/vietnamese-bi-encoder. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("meandyou200175/vn_bi_encoder_16neg")
# Run inference
sentences = [
    'Bác sĩ cho em hỏi, em bị rạn nứt xương gót chân bên phải. Em bị hơn 1 tháng nay rồi. Em bỏ thuốc lá. Em muốn hỏi bác sĩ thông thường bó bột hơn hay thuốc lá hơn? Như của em khoảng bao lâu thì khỏi? Và giờ em vẫn chưa đi được bác sĩ ạ. Em cảm ơn.',
    'Chào em, Thứ nhất, bắt buộc phải có phim Xquang để biết em có thực sự nứt xương gót hay bị gãy phức tạp hơn, vì nhiều trường hợp tưởng chỉ nứt xương thôi nhưng thật ra là vỡ phức tạp, phải phẫu thuật mới nhanh ổn được. Thứ hai, theo nguyên tắc điều trị nứt gãy xương là phải cố định tốt để can xương mọc ra, chỗ nứt gãy mới được nối liền. Do đó, nếu bó bột thì chân sẽ được cố định liên tục trong 4-6 tuần, còn bó lá thì phải thay thường xuyên, mỗi lần thay là 1 lần xê dịch nên xương khó lành. Tốt hơn hết em nên đến Bệnh viện Chấn thương Chỉnh hình để được kiểm tra và điều trị thích hợp, em nhé. Thân mến.',
    'Chào bạn, Qua hình ảnh sang thương và mô tả triệu chứng, bệnh lý của bạn có khả năng là chàm hay còn gọi là viêm da dị ứng với đặc điểm là viêm và nổi mụn nhỏ, ngứa ngáy. Nguyên nhân của chàm hiện nay chưa rõ nhưng có thể do cơ địa dị ứng (người mắc hen, viêm mũi dị ứng có nguy cơ cao mắc chàm), do kích thích của hóa chất như nước rửa chén, bột giặt, cao su, kim loại, chất liệu giày dép (chàm tiếp xúc),... Thời tiết lạnh, stress, đổ mồ hôi nhiều và phấn hoa... cũng là những nguyên nhân có thể khiến da bị chàm. Chàm cũng có thể gặp ở người bị suy van tĩnh mạch, giãn tĩnh mạch chân khiến tình trạng bệnh dai dẳng, kém đáp ứng điều trị. Điều trị chàm thường phải sử dụng một số loại thuốc bôi da kéo dài, có thể để lại tác dụng phụ, do đó bạn nên khám BS Da liễu để kê toa loại thuốc phù hợp. Ngoài ra, bạn nên chú ý xem có yếu tố nào thường kích thích khởi phát chàm để tránh cho bệnh tái phát bạn nhé! Thân mến.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.7003
cosine_accuracy@3 0.8262
cosine_accuracy@5 0.8676
cosine_accuracy@10 0.9134
cosine_precision@1 0.7003
cosine_precision@3 0.2754
cosine_precision@5 0.1735
cosine_precision@10 0.0913
cosine_recall@1 0.7003
cosine_recall@3 0.8262
cosine_recall@5 0.8676
cosine_recall@10 0.9134
cosine_ndcg@10 0.8068
cosine_mrr@10 0.7726
cosine_map@100 0.7764
dot_accuracy@1 0.6819
dot_accuracy@3 0.8154
dot_accuracy@5 0.8621
dot_accuracy@10 0.9102
dot_precision@1 0.6819
dot_precision@3 0.2718
dot_precision@5 0.1724
dot_precision@10 0.091
dot_recall@1 0.6819
dot_recall@3 0.8154
dot_recall@5 0.8621
dot_recall@10 0.9102
dot_ndcg@10 0.7954
dot_mrr@10 0.7587
dot_map@100 0.7626

Training Details

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • learning_rate: 2e-05
  • num_train_epochs: 1
  • warmup_ratio: 0.1
  • fp16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 2e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss Validation Loss cosine_map@100
0 0 - - 0.5553
0.0091 100 0.6282 - -
0.0183 200 0.4527 - -
0.0274 300 0.4177 - -
0.0365 400 0.4088 - -
0.0457 500 0.3093 - -
0.0548 600 0.3814 - -
0.0639 700 0.3428 - -
0.0731 800 0.3295 - -
0.0822 900 0.3977 - -
0.0913 1000 0.258 0.0514 0.6996
0.1004 1100 0.3543 - -
0.1096 1200 0.3309 - -
0.1187 1300 0.2932 - -
0.1278 1400 0.3873 - -
0.1370 1500 0.2808 - -
0.1461 1600 0.342 - -
0.1552 1700 0.2993 - -
0.1644 1800 0.226 - -
0.1735 1900 0.3545 - -
0.1826 2000 0.2887 0.0462 0.7226
0.1918 2100 0.2612 - -
0.2009 2200 0.2559 - -
0.2100 2300 0.196 - -
0.2192 2400 0.2857 - -
0.2283 2500 0.3215 - -
0.2374 2600 0.2601 - -
0.2466 2700 0.2874 - -
0.2557 2800 0.2423 - -
0.2648 2900 0.3145 - -
0.2739 3000 0.1669 0.0403 0.7133
0.2831 3100 0.2507 - -
0.2922 3200 0.2867 - -
0.3013 3300 0.2458 - -
0.3105 3400 0.2592 - -
0.3196 3500 0.1802 - -
0.3287 3600 0.2213 - -
0.3379 3700 0.2349 - -
0.3470 3800 0.2111 - -
0.3561 3900 0.2135 - -
0.3653 4000 0.2523 0.0344 0.7347
0.3744 4100 0.1877 - -
0.3835 4200 0.1469 - -
0.3927 4300 0.2843 - -
0.4018 4400 0.1577 - -
0.4109 4500 0.2056 - -
0.4201 4600 0.2424 - -
0.4292 4700 0.2554 - -
0.4383 4800 0.1342 - -
0.4474 4900 0.1934 - -
0.4566 5000 0.1909 0.0304 0.7436
0.4657 5100 0.245 - -
0.4748 5200 0.1876 - -
0.4840 5300 0.1235 - -
0.4931 5400 0.1824 - -
0.5022 5500 0.1909 - -
0.5114 5600 0.1481 - -
0.5205 5700 0.1943 - -
0.5296 5800 0.2303 - -
0.5388 5900 0.1724 - -
0.5479 6000 0.2524 0.0294 0.7519
0.5570 6100 0.196 - -
0.5662 6200 0.2202 - -
0.5753 6300 0.1482 - -
0.5844 6400 0.151 - -
0.5936 6500 0.1525 - -
0.6027 6600 0.1637 - -
0.6118 6700 0.1517 - -
0.6209 6800 0.134 - -
0.6301 6900 0.1924 - -
0.6392 7000 0.1174 0.0278 0.7584
0.6483 7100 0.1888 - -
0.6575 7200 0.1309 - -
0.6666 7300 0.2 - -
0.6757 7400 0.1652 - -
0.6849 7500 0.1599 - -
0.6940 7600 0.1289 - -
0.7031 7700 0.1533 - -
0.7123 7800 0.1765 - -
0.7214 7900 0.1403 - -
0.7305 8000 0.1288 0.0246 0.7680
0.7397 8100 0.1868 - -
0.7488 8200 0.1594 - -
0.7579 8300 0.2239 - -
0.7671 8400 0.175 - -
0.7762 8500 0.1437 - -
0.7853 8600 0.2118 - -
0.7944 8700 0.1631 - -
0.8036 8800 0.1228 - -
0.8127 8900 0.1362 - -
0.8218 9000 0.1135 0.0207 0.7757
0.8310 9100 0.196 - -
0.8401 9200 0.1598 - -
0.8492 9300 0.1214 - -
0.8584 9400 0.1826 - -
0.8675 9500 0.1273 - -
0.8766 9600 0.1006 - -
0.8858 9700 0.157 - -
0.8949 9800 0.1374 - -
0.9040 9900 0.1285 - -
0.9132 10000 0.2549 0.0211 0.7764
0.9223 10100 0.1642 - -
0.9314 10200 0.1402 - -
0.9406 10300 0.2119 - -
0.9497 10400 0.151 - -
0.9588 10500 0.0928 - -
0.9679 10600 0.1822 - -
0.9771 10700 0.085 - -
0.9862 10800 0.1557 - -
0.9953 10900 0.1201 - -

Framework Versions

  • Python: 3.10.14
  • Sentence Transformers: 3.2.1
  • Transformers: 4.45.1
  • PyTorch: 2.4.0
  • Accelerate: 0.34.2
  • Datasets: 3.0.1
  • Tokenizers: 0.20.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}