M3-retriever-Wiki / README.md
strongpear's picture
Add new SentenceTransformer model
6bc2672 verified
metadata
base_model: BAAI/bge-m3
library_name: sentence-transformers
pipeline_tag: sentence-similarity
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:148500
  - loss:MultipleNegativesRankingLoss
widget:
  - source_sentence: Thành phố San Fernando  một phần của nước nào   bao nhiêu dân số?
    sentences:
      - "Boule-d'Amont là một xã trong vùng Occitanie, thuộc tỉnh Pyrénées-Orientales, quận Prades, tổng Vinça. Tọa độ địa lý của xã là 42° 34' vĩ độ bắc, 02° 36' kinh độ đông. Boule-d'Amont nằm trên độ cao trung bình là 483 mét trên mực nước biển, có điểm thấp nhất là 234 mét và điểm cao nhất là 1.348 mét. Xã có diện tích 23,22\_km², dân số vào thời điểm 1999 là 73 người; mật độ dân số là 3 người/km²."
      - "Thành phố San Fernando là một trong ba thành phố lớn của Trinidad và Tobago, là đô thị lớn thứ hai. Thành phố có diện tịch 18\_km² và nằm ở phía tây nam của đảo Trinidad. Nó giáp sông Guaracara về phía bắc, giáp sông Oropouche về phía nam, giáp quốc lộ Sir Solomon Hochoy về phía đông, và vịnh Paria về phía tây. Dân số ước tính năm 2000 là 62.000 người. Đô thị San Fernando được nâng cấp thành thành phố ngày 18 tháng 11 năm 1988. Khẩu hiệu của San Fernando là: \"Sanitas Fortis\" - \"Trong một môi trường lành mạnh chúng ta sẽ tìm thấy sức mạnh\"."
      - >-
        Các dự án quân sự bản địa khác liên quan đến việc thiết kế và bổ sung
        hàng không mẫu hạm lớp "Vikrant" và tàu ngầm hạt nhân lớp "Arihant".

        Sau khi kết thúc Chiến tranh Lạnh,Ấn Độ tăng cường hợp tác về kinh
        tế,chiến lược  quân sự với Hoa Kỳ  Liên minh châu Âu. Năm 2008, Hoa
        Kỳ  Ấn Độ  kết một thỏa thuận hạt nhân dân sự.Mặc  đương thời Ấn
        Độ  quốc gia sở hữu  khí hạt nhân  không phải  một bên tham gia
        của Hiệp ước không phổ biến  khí hạt nhân,song quốc gia này vẫn nhận
        được sự miễn trừ từ  quan Năng lượng Nguyên tử Quốc tế  Nhóm các nhà
        cung cấp hạt nhân,do vậy thoát khỏi các hạn chế,rào cản trước đây đối
        với công nghệ  thương mại hạt nhân. Như một hệ quả, Ấn Độ trở thành
        quốc gia thứ sáu sở hữu  khí hạt nhân "trên thực tế". Ấn Độ sau đó 
        kết các thỏa thuận hợp tác liên quan đến năng lượng hạt nhân dân sự với
        Nga, Pháp, Anh Quốc,  Canada.

        Tổng thống Ấn Độ  thống soái tối cao của lực lượng  trang quốc gia
        với 1,6 triệu quân tại ngũ  xếp thứ ba thế giới trên tiêu chí này.
        Quân đội Ấn Độ gồm  lục quân, hải quân,  không quân; các tổ chức phụ
        trợ gồm  Bộ  lệnh chiến lược (Strategic Forces Command)  ba nhóm
        bán quân sự: Đội quân súng trường Assam, Lực lượng biên cảnh đặc chủng,
         Lực lượng bảo vệ bờ biển Ấn Độ. Ngân sách quốc phòng chính thức của
        Ấn Độ giai đoạn 2012-17 chiếm khoảng 2,5% GDP. Năm 2012, Ấn Độ  nước
        nhập khẩu  khí lớn nhất thế giới;từ năm 2007 đến năm 2011, tiền mua 
        khí của Ấn Độ chiếm 10% tổng phí tổn dành cho mua sắm  khí. Phần lớn
        chi tiêu quân sự tập trung vào phòng thủ đối với riêng Pakistan  chống
        lại ảnh hưởng ngày càng gia tăng của Trung Quốc tại Ấn Độ Dương.

        Một trận ẩu đả dữ dội giữa quân đội Trung Quốc  Ấn Độ tại khu vực lãnh
        thổ tranh chấp đã làm 20 binh  Ấn Độ  ít nhất 4 binh  Trung Quốc
        thiệt mạng.
  - source_sentence: Sự khác biệt giữa các loại sao về nhiệt độ bề mặt  gì?
    sentences:
      - >-
        Một khi việc cấp phát vùng nhớ động không còn cần thiết nữa thì phần bộ
        nhớ đó nên được trả về cho hệ điều hành. Thao tác này có thể tiến hành
        bằng hàm codice_134. Nó cần một tham số: tên của con trỏ mà trước đây đã
        xin cấp phát vùng nhớ. Một cách an toàn hơn là sau khi đã trả vùng nhớ
        về cho hệ điều hành, người lập trình cũng nên cài (hay gán) cho con trỏ
        liên đới giá trị codice_135 để hủy bỏ địa chỉ mà nó đang chỉ tới (nhằm
        tránh gây ra các hiệu ứng phụ do việc tham chiếu của con trỏ này có thể
        gây ra).

        Các mảng đa chiều.

        C  hỗ trợ việc dùng mảng đa chiều. Việc định nghĩa chúng giống như 
        tạo ra "mảng của các mảng ", mặc  vậy trong thực tế  không hoàn toàn
        đúng.  pháp sau:

        sẽ định nghĩa một mảng hai chiều; chiều thứ nhất  codice_136 phần tử.
        Chiều thứ hai sẽ  codice_137 các phần tử—một tập hợp của codice_138
        các phần tử  mỗi phần tử  một chiều thứ nhất.

        Các mảng đa chiều hoàn toàn  thể được xem như  dãy của các con trỏ.
        Trong thí dụ trên, codice_139 (nếu codice_136  1) sẽ  một tham chiếu
        giá trị nguyên   chỉ tới một mảng của codice_138 các phần tử.

        Dãy  tự.

        Dãy  tự  thể được thay đổi nội dung của   không cần đến thư viện
        chuẩn. Tuy nhiên, thư viện này  nhiều hàm  thể dùng cho cả dãy  tự
         kết thúc 0  mảng không   tự kết thúc kiểu codice_84. Trong phần
        này từ "dãy" được để chỉ dãy  tự.

        Các hàm thường dùng là:

        Các hàm ít dùng tới hơn là:

        Tập tin I/O.

        Trong C, I/O được tiến hành qua một nhóm các hàm trong thư viện chuẩn.
        Trong ANSI/ISO C, những hàm đó được định nghĩa trong codice_202.

        Tiêu chuẩn I/O.

        Ba tiêu chuẩn dòng I/O được định nghĩa sẵn là:

        Các dòng này được tự động mở  đóng lại bởi môi trường của thời gian
        thi hành, chúng không cần  không nên được mở một cách  ràng.

        Thí dụ sau minh họa làm thế nào một chương trình bộ lọc được cấu trúc
        một cách điển hình:

        Việc chuyển các đối số qua dòng lệnh.
      - >-
        Số lượng nguyên tử chì cao cũng làm tăng mật độ của vật liệu, vì chì có
        trọng lượng nguyên tử rất cao là 207,2, so với 40,08 đối với calci. Mật
        độ của ly soda là 2,4g/cm³ hoặc thấp hơn, trong khi tinh thể chì điển
        hình có mật độ khoảng 3,1g/cm³ và kính chì cao có thể trên 4,0g/cm³ hoặc
        thậm chí lên tới 5,9g/cm³ 

        Sự sáng chói của tinh thể chì phụ thuộc vào chỉ số khúc xạ cao gây ra
        bởi hàm lượng chì. Thủy tinh thông thường  chiết suất "n" = 1,5, trong
        khi việc bổ sung chì tạo ra phạm vi lên tới 1,7 hoặc 1,8. Chỉ số khúc xạ
        tăng cao này cũng tương quan với độ tán sắc tăng, đo mức độ  môi
        trường phân tách ánh sáng thành quang phổ thành phần của nó, như trong
        lăng kính. Kỹ thuật cắt pha  khai thác các tính chất này để tạo ra
        hiệu ứng lấp lánh rực rỡ khi mỗi khía cạnh cắt phản xạ  truyền ánh
        sáng qua vật thể. Chỉ số khúc xạ cao rất hữu ích cho việc chế tạo ống
        kính,   thể đạt được độ dài tiêu cự nhất định với ống kính mỏng hơn.
        Tuy nhiên, độ phân tán phải được hiệu chỉnh bởi các thành phần khác của
        hệ thống thấu kính nếu  bị mờ.

        Việc bổ sung oxide chì vào thủy tinh kali cũng làm giảm độ nhớt của nó,
        khiến  lỏng hơn thủy tinh soda thông thường trên nhiệt độ làm mềm
        (khoảng ), với điểm làm việc  . Độ nhớt của thủy tinh thay đổi hoàn
        toàn theo nhiệt độ, nhưng thủy tinh chì nhỏ hơn khoảng 100 lần so với
        kính soda thông thường trong phạm vi nhiệt độ làm việc (lên tới ). Từ
        quan điểm của thợ làm kính, điều này dẫn đến hai sự phát triển thực tế.
        Đầu tiên, thủy tinh chì  thể được chế tạo  nhiệt độ thấp hơn, dẫn đến
        việc sử dụng  trong việc tráng men,  thứ hai, các mạch  ràng 
        thể được làm sạch khỏi bọt khí bị kẹt với độ khó thấp hơn đáng kể so với
        kính thông thường, cho phép chế tạo các vật thể hoàn hảo,  ràng.

        Khi gõ, pha  chì tạo ra âm thanh vang lên, không giống như kính thông
        thường. Người tiêu dùng vẫn dựa vào đặc tính này để phân biệt với kính
        rẻ hơn.
      - >-
        Nhiệt độ bề mặt của sao, cùng với độ sáng biểu kiến tuyệt đối và các đặc
        trưng của vạch hấp thụ trong quang phổ, thường được sử dụng để phân loại
        sao (xem phân loại bên dưới).

        Các sao khối lượng lớn  dải chính  nhiệt độ bề mặt lên tới 50.000 K.
        Các sao nhỏ hơn như Mặt Trời  nhiệt độ 6000 K. Những sao khổng lồ đỏ
         nhiệt độ bề mặt tương đối thấp vào khoảng 3.600 K, nhưng chúng cũng
         độ trưng tương đối lớn do diện tích mặt ngoài lớn.

        Bức xạ.

        Năng lượng được sản xuất ra bởi sao,  sản phẩm của phản ứng tổng hợp
        hạt nhân, bức xạ vào trong không gian bằng cả bức xạ điện từ  bức xạ
        hạt. Ngôi sao phát ra bức xạ hạt cũng chính  gió Sao Thổi vào không
        gian (tồn tại như  một dòng các hạt tích điện ổn định, như proton, hạt
        anpha,  hạt beta, thoát ra từ các lớp ngoài cùng của sao)  dòng ổn
        định các hạt neutrino thoát ra từ lõi sao.

        Sản phẩm năng lượng tại lõi cũng  nguyên nhân tại sao ngôi sao chiếu
        sáng: mỗi lần hai hoặc nhiều hơn hạt nhân nguyên tử của một nguyên tố
        tổng hợp với nhau để tạo thành một hạt nhân của nguyên tố mới nặng hơn,
        các photon tia gamma được giải phóng từ phản ứng tổng hợp hạt nhân. Năng
        lượng này được biến đổi thành các dạng năng lượng điện từ khác, bao gồm
        ánh sáng khả kiến, theo thời gian chúng truyền đến các lớp bên ngoài của
        sao.

        Màu sắc của một sao, được xác định bởi đỉnh tần số của ánh sáng khả
        kiến, phụ thuộc vào nhiệt độ các lớp ngoài cùng của ngôi sao, bao gồm
        quang quyển của nó. Bên cạnh ánh sáng khả kiến, ngôi sao cũng phát ra
        các dạng bức xạ điện từ không nhìn thấy được bằng mắt thường. Thực tế
        bức xạ điện từ phát ra từ ngôi sao trải rộng trên toàn phổ điện từ, từ
        bước sóng dài nhất  sóng radio, hồng ngoại cho đến bước sóng ngắn nhất
        như tia tử ngoại, tia X,  tia gamma. Mọi bước sóng bức xạ điện từ của
        ngôi sao, cả nhìn thấy  không nhìn thấy, đều  ý nghĩa quan trọng.

        Sử dụng phổ của ngôi sao, các nhà thiên văn cũng xác định được nhiệt độ
        bề mặt, hấp dẫn tại bề mặt, tính kim loại (metallicity)  vận tốc tự
        quay của sao.
  - source_sentence: Tại sao vấn đề Đài Loan độc lập lại phức tạp?
    sentences:
      - >-
        Marie-Ségolène Royal (sinh ngày 22 tháng 9 năm 1953 tại Dakar, Senegal,
        Tây Phi thuộc Pháp), được gọi là Ségolène Royal (), là một chính trị gia
        Pháp. Bà là chủ tịch Hội đồng Vùng Nouvelle-Aquitaine, một cựu thành
        viên của Quốc hội, cựu bộ trưởng trong chính phủ, và là một thành viên
        có ảnh hưởng của Đảng Xã hội Pháp. Người phụ nữ đầu tiên tại Pháp được
        chỉ định bởi một đảng lớn làm ứng cử viên trong cuộc bầu cử tổng thống
        Pháp năm 2007 nhưng đã thua cuộc trước Nicolas Sarkozy ngày 6 tháng 5
        năm 2007.

        Ngày 28 tháng 11 năm 2008, Royal tuyên bố  cách ứng cử viên cho cuộc
        bầu cử Tổng thống Pháp trong cuộc bầu cử tổng thống năm 2012.

        Tuổi trẻ.

        Ségolène Royal ra đời tại một căn cứ quân sự  Ouakam, Dakar, Senegal
        ngày 22 tháng 9 năm 1953,  con gái của Hélène Dehaye  Jacques Royal,
        một cựu  quan pháp binh  trợ  cho thị trưởng Chamagne (Vosges).

        Cha mẹ  đã sinh tám người con trong chín năm: Marie-Odette,
        Marie-Nicole, Gérard, Marie-Ségolène, Antoine, Paul, Henri  Sigisbert.

        Sau khi học xong trung học, Marie-Ségolène vào trường đại học địa phương
        nơi  tốt nghiệp  vị trí thứ hai trong lớp ngành Kinh tế. Chị cả của
         sau đó hướng  chuẩn bị cho kỳ thi đầu vào Sciences Po   được
        học bổng tại đây. Trong trường  nghiên cứu chính trị của lớp  sự
        bình đẳng nam nữ. ("Sciences Po" khi ấy  tới 85% sinh viên thuộc tầng
        lớp trên người Paris  chủ yếu  nam giới). Mùa  năm 1971,  làm
        công không lương tại Dublin, Ireland. Năm 1972, khi 19 tuổi, Royal đã
        kiện cha mình  ông từ chối li dị mẹ   trả tiền cấp dưỡng  tiền
        nuôi dạy con cho việc học tập của các con.  thắng kiện sau nhiều năm
        hầu toà, ngay trước khi Jacques Royal chết  ung thư phổi năm 1981. Sáu
        trong tám người con đã từ chối gặp lại ông, trong đó  cả Ségolène.

        Royal, như hầu hết giới tinh hoa chính trị Pháp,  người tốt nghiệp
        Trường Hành chính quốc gia (ENA).  học cùng lớp với người bạn đời
        trong 30 năm, François Hollande (bà gặp ông tại một bữa tiệc), 
        Dominique de Villepin (thủ tướng dưới thời Jacques Chirac).
      - >-
        Mặc dù Trung Hoa Dân Quốc thống trị khu vực Đài Loan từ thập niên 1950
        có tính độc lập, đồng thời đa số dân chúng cho rằng tự thân có chủ quyền
        quốc gia, song do chịu uy hiếp quân sự của nước Cộng hòa Nhân dân Trung
        Hoa, khiến vấn đề Đài Loan độc lập cực kỳ phức tạp. Đại bộ phận dân
        chúng hy vọng duy trì hiện trạng hai bờ eo biển Đài Loan, song số lượng
        người chủ trương độc lập đông hơn người chủ trương thống nhất. Ngoài ra,
        một bộ phận nhân sĩ chủ trương việc Trung Hoa Dân Quốc thu hồi Đài Loan
        theo "Tuyên bố Cairo" có tranh nghị, cho rằng Trung Hoa Dân Quốc chỉ đại
        diện cho Đồng Minh chiếm lĩnh quân sự Đài Loan và Bành Hồ; đồng thời căn
        cứ theo Hiệp ước San Francisco tuyên bố chủ quyền Đài Loan chưa xác
        định,cho rằng Trung Hoa Dân Quốc là chính phủ lưu vong nước ngoài từ
        miền eo biển bên kia.

        Hành chính.

        Sau khi chính phủ Trung Hoa Dân Quốc dời sang Đài Loan vào năm 1949, họ
        chỉ  thể thống trị các đảo thuộc tỉnh Đài Loan (bao gồm đảo Đài Loan,
        quần đảo Bành Hồ)  tỉnh Phúc Kiến (bao gồm Kim Môn,  Tổ). Ngoài ra,
        chính phủ Trung Hoa Dân Quốc còn khống chế quần đảo Đông Sa,  đảo Ba
        Bình thuộc quần đảo Trường Sa trên biển Đông, giao các đảo này cho thành
        phố Cao Hùng phụ trách quản lý. Trung Hoa Dân Quốc tham gia tranh chấp
        chủ quyền quần đảo Trường Sa (gọi  Nam Sa)  quần đảo Senkaku (gọi 
        Điếu Ngư đài). Từ năm 1949 trở đi, chính phủ Trung Hoa Dân Quốc từng
        nhiều lần cải cách phân chia hành chính nhằm tổng hợp phát triển khu
        vực. Trong đó, chức năng của chính phủ cấp tỉnh của tỉnh Phúc Kiến 
        tỉnh Đài Loan lần lượt được tinh giản vào năm 1956  1998, chỉ duy trì
        công tác mang tính tượng trưng.

        Ngoài ra, vào năm 1967  năm 1979, thành phố Đài Bắc  thành phố Cao
        Hùng lần lượt được tách khỏi tỉnh Đài Loan để chuyển sang trực thuộc
        trung ương. Năm 2010, chính phủ lại chuyển các thành phố Tân Bắc, Đài
        Trung, Đài Nam sang trực thuộc trung ương. Năm thành phố này cũng  năm
        thành thị trọng yếu nhất của Trung Hoa Dân Quốc hiện nay, trong đó Tân
        Bắc nguyên  huyện Đài Bắc, Đài Trung cùng Đài Nam  Cao Hùng hợp nhất
        với các huyện cùng tên.
      - >-
        Theo luật, Quỹ bao gồm một hội đồng quản trị của năm công dân Thụy Điển
        hay Na Uy, với trụ sở tại Stockholm. Chủ tịch Hội đồng quản trị được Vua
        Thụy Điển bổ nhiệm, với bốn thành viên khác do ủy thác của các tổ chức
        trao giải thưởng bổ nhiệm. Một giám đốc điều hành được lựa chọn trong số
        các thành viên hội đồng quản trị, Phó giám đốc được Vua Thụy Điển bổ
        nhiệm, và hai phó chủ tịch được bổ nhiệm do người được ủy thác. Tuy
        nhiên, kể từ năm 1995, tất cả các thành viên của hội đồng quản trị được
        lựa chọn bởi các ủy viên quản trị; Giám đốc điều hành và các Phó Giám
        đốc chỉ định bởi chính hội đồng quản trị. Cũng như hội đồng quản trị,
        Quỹ Nobel được tạo thành từ các tổ chức trao giải (Viện Hàn lâm Khoa học
        Hoàng gia Thụy Điển, Đại hội đồng Nobel tại Viện Karolinska, Viện Hàn
        lâm Thụy Điển, và các Ủy ban Nobel Na Uy), người được ủy thác của các tổ
        chức trên, và các kiểm toán viên.

        Huy chương Nobel.

        Huy chương Nobel làm bằng 150 gram vàng 18 ca-ra chạm hình Alfred Nobel.
        Mặt sau của tấm huy chương giải Nobel Vật   Hóa học  hình một phụ
        nữ để ngực trần.

        Một số tấm huy chương Nobel đã được chủ nhân mang ra bán đấu giá. Tấm
        huy chương Nobel Hòa bình được bán rẻ nhất trong đấu giá đó  của
        Aristide Briand, người Pháp đã  đóng góp lớn trong năm 1926 vào cuộc
        hoà hợp ngắn ngủi Đức  Pháp. Năm 2008 huy chương Nobel này được bảo
        tàng Ecomusée của Saint-Nazaire mua về với khoản tiền 12 nghìn euro. Khá
        hơn một chút, huy chương Nobel Hoà bình của người Anh William Randal
        Cremer vinh danh năm 1903 đã bán với giá 17.000 đô la tại một cuộc đấu
        giá năm 1985.

        Từ năm 2014, việc bán huy chương Nobel trở nên phổ thông. Cho tới giờ 8
        huy chương đã được bán kể từ đó. Cũng về giải Nobel Hoà bình, tấm huy
        chương của người Bỉ Auguste Beernaert (được trao năm 1909) đã đạt tới
        giá 661 nghìn đô la  huy chương Nobel của Carlos Saavedra Lamas, người
        Argentina, nhận năm 1936, thậm chí đã tìm được người mua với giá kỷ lục
        1,16 triệu đô la.

        Kỷ lục hiện nay  huy chương của James Watson, người Mỹ được nhận giải
        nobel Y học năm 1962 cho những phát hiện ra cấu trúc DNA. Ông đã bán
        được tấm huy chương Nobel của mình với giá 4,76 triệu đô la Mỹ vào tháng
        12/2014.
  - source_sentence: >-
      Phong trào kháng chiến Na Uy đã hoạt động như thế nào trong thời gian
      chiếm đóng?
    sentences:
      - >-
        Michael Walzer (3/3/1935) là một trong số các triết gia chính trị hàng
        đầu của Mỹ, giáo sư về hưu của Institute for Advanced Study, Đại học
        Princeton ở New Jersey, đồng thời là tổng biên tập tạp chí khoa học
        Dissent, theo thiên hướng cánh tả, ra hàng quý, về chính trị và văn hóa.
        Các đề tài của ông trải rộng từ tính hợp pháp của các cuộc chiến cho tới
        dân tộc và nhân chủng học, kinh tế, xã hội và trách nhiệm chính trị, với
        27 sách và 300 bài viết, thành viên của hội triết gia Hoa Kỳ.

        Sinh  New York City, nhưng Walzer xuất thân từ một gia đình Do Thái gốc
        Đông Âu, được đào tạo bậc đại học trong ngôi trường Do Thái đầu tiên
        trên đất Mỹ Brandeis University. Một phần do môi trường chính trị Hoa Kỳ
        không  nhiều chỗ hoạt động cho cánh tả  ông quyết định xuống đường
        cùng phong trào sinh viên chống Chiến tranh Việt Nam.

        Một trong số các phạm trù chính của Walzer  khái niệm
        "communitarianism" trong chính trị học, bên cạnh các tên tuổi như
        Alasdair MacIntyre  Michael Sandel. Khái niệm này  lẽ nên được tạm
        dịch  Chủ nghĩa cộng đồng,   liên quan  bắt nguồn từ chữ
        "community",  đề cao các giá trị chung trong khuôn khổ  hội công dân
        ("civic society") như một phản đề đối với chủ nghĩa  nhân,   khác
        với "communalism", tức  Chủ nghĩa công xã,  tất nhiên còn khác xa
        với Chủ nghĩa cộng sản - "communism". Walzer cũng đóng góp nhiều trong
         thuyết về cuộc chiến chính nghĩa - "just war".

        Walzer cho rằng mỗi  thuyết chính trị cần phải khởi nguồn từ một 
        hội nhất định với truyền thống  văn hóa riêng, phản đối xu hướng trừu
        tượng hóa triết học chính trị.  hình "communitarian" theo cách hiểu
        của Walzer  một  hội với những sự bình đẳng không đồng nhất -
        "complex equality". Theo đó, thước đo của bình đẳng không chỉ đơn giản
         vật chất hay đạo đức,  nên hiểu theo nghĩa công bằng một cách công
        bình ("egalitarian justice"), tức  phân phối hàng hóa (vật chất  đạo
        đức) tùy thuộc vào giá trị  hội của   không được phép (tiền 
        quyền lực chính trị cũng  một thứ hàng hóa) chiếm ưu thế hoặc thay đổi
        sự phân phối của các loại hàng hóa khác trong các lãnh vực khác.
      - "Vua Haakon và chính phủ Na Uy tiếp tục cuộc chiến trong hoàn cảnh tị nạn tại Rotherhithe, Luân Đôn. Vào ngày cuộc xâm lược diễn ra, vị đồng lãnh đạo của Đảng Quốc gia-Xã hội nhỏ Nasjonal Samling — Vidkun Quisling — đã tìm cách lên nắm quyền lực, nhưng đã bị quân chiếm đóng Đức gạt ra rìa. Quyền lực thực sự nằm trong tay chính quyền chiếm đóng Đức, Reichskommissar Josef Terboven. Quisling, với tư cách \"bộ trưởng tổng thống\", sau này đã thành lập một chính phủ liên minh dưới sự quản lý của Đức. Các cơ sở tại Na Uy đã chế tạo nước nặng, một nguyên liệu chủ chốt chế tạo vũ khí hạt nhân, và cuối cùng đã bị người Đức bỏ lại sau nhiều nỗ lực phá huỷ cơ sở Vemork của người Na Uy, người Anh và người Mỹ. Trong những năm chiếm đóng của Phát xít, người Na Uy đã xây dựng một phong trào kháng chiến mạnh chống lại các lực lượng chiếm đóng Đức bằng cả chiến tranh vũ trang và bất tuân dân sự. Tuy nhiên, yếu tố quan trọng hơn với Đồng Minh, là vai trò của hải quân thương mại Na Uy. Ở thời điểm xảy ra cuộc xâm lược, Na Uy có hạm đội tàu biển thương mại đứng hàng thứ tư thế giới (cũng như có tốc độ nhanh nhất và hiệu quả nhất). Công ty tàu biển Na Uy Nortraship đã nằm dưới sự điều khiển của Đồng Minh trong suốt cuộc chiến và tham gia vào mọi chiến dịch từ việc sơ tán Dunkirk tới cuộc đổ bộ vào Normandy.\nSau cuộc chiến, những thành viên đảng Dân chủ Xã hội lên nắm quyền và lãnh đạo quốc gia trong hầu hết thời gian cuộc chiến tranh lạnh. Na Uy đã gia nhập NATO năm 1949, và trở thành một đồng minh thân cận của Hoa Kỳ. Hai cuộc trưng cầu dân ý nhằm gia nhập Liên minh châu Âu (được gọi là Cộng đồng châu Âu năm 1972) đã thất bại với tỷ số mong manh năm 1972 và 1994. Những nguồn dự trữ dầu mỏ và khí gas lớn đã được khám phá trong thập niên 1960, dẫn tới sự bùng nổ kinh tế sau đó.\nĐịa lý, khí hậu và môi trường.\nNa Uy gồm phần phía tây của Scandinavia ở Bắc Âu. Bờ biển lởm chởm, bị chia cắt bởi nhiều vịnh hẹp (fjord) và khoảng 50.000 hòn đảo, trải dài hơn 2.500\_km."
      - >-
        Các vị sư trong chùa tu hành theo tông phái nào cũng không quan trọng,
        miễn là các vị sư này giữ gìn được các giáo giới quan trọng nhất của
        Phật giáo (không sát sinh, không trộm cắp, không phạm sắc giới, không
        uống rượu, không ăn thịt). Họ cũng không có hiểu biết sâu sắc về giáo lý
        Phật giáo mà chỉ hiểu đơn giản là thiện nghiệp thiện báo hoặc thậm chí
        hiểu sai lạc cúng dường cho chùa nhiều thì thiện báo. Có người đến chùa
        chỉ để cầu xin cho bản thân và coi Phật như là thần linh có thể giúp họ
        toại nguyện chứ không hiểu rằng những gì họ nhận được chính là kết quả
        của những gì họ tạo ra. Còn những sinh hoạt như cúng bái, cầu siêu, cầu
        an, bói toán, thỉnh vong, đốt vàng mã... là những hoạt động được du nhập
        vào Phật giáo từ Nho giáo, Đạo giáo và Shaman giáo.

        Trung Quốc.

        "Bài chi tiết: Phật giáo Trung Quốc"

        Theo sử liệu cho thấy Phật giáo được giới thiệu đến Trung Quốc do các
        nhà buôn hay các nhà  truyền giáo người Ấn qua các ngã đường biển 
        đường bộ. Về đường biển thì xuất phát từ các hải cảng vùng Nam Ấn rồi
        qua ngã Sri Lanka, Nam Dương để vào hải cảng Quảng Đông. Về đường bộ,
        còn gọi  con đường  lụa (Silk road) nối liền Đông Tây, di chuyển
        bằng lạc đà, xuất phát từ miền Đông Bắc Ấn, rồi băng qua các sa mạc 
        Trung Á để tới Lạc Dương (kinh đô của nhà Hán).

        Theo biên niên sử thì Phật giáo truyền đến Trung Quốc vào thế kỷ thứ 2
        trước Công Nguyên từ Trung Á nhằm niên hiệu Nguyên Thọ đời vua Hán Ai Đế
        nhà Tây Hán, nhưng Phật giáo không truyền  rộng rãi cho đến năm 65
        Công nguyên, dưới triều vua Hán Minh Đế (niên hiệu Vĩnh Bình thứ 10 nhà
        Hậu Hán, 25-220 công nguyên), thì Phật giáo mới bắt đầu cắm rễ  phát
        triển  Trung Quốc.  muốn thần dân tu học Phật pháp nên vua Minh Đế đã
        cử một phái đoàn gồm 18 người đến Ấn Độ để thỉnh cầu hai Thiền  người
        Ấn  Ca Diếp Ma Đằng (Kàsyapama'tanga)  Trúc Pháp Lan (Dharmaraksa)
        đến Trung Quốc hoằng pháp.
  - source_sentence: Quận Sông  được thành lập vào thời điểm nào  dựa trên  sở nào?
    sentences:
      - 'Quang Châu có thể là:'
      - "Mạng lưới sông rạch.\nToàn huyện có 355\_km kênh mương thủy lợi chính, gồm 80\_km kênh cấp I và 275\_km kênh cấp II, bình quân 1 ha đất canh tác có 12,62m kênh mương thủy lợi.\nDo nằm ven sông Cổ Chiên và có cù lao Hoà Minh – Long Hoà chạy dài ra sát cửa Cung Hầu nên huyện Châu Thành chịu ảnh hưởng chế độ bán nhật trìêu của biển Đông, thông qua đoạn sông Cổ Chiên vào các hệ thống sông rạch lớn như: Láng Thé – Ba Si – Ô Chát, sông Trà Vinh – Kinh Thống Nhất hệ Tầm Phương, sông Bãi Vàng – Vinh Kim. Ngoài ra, do yêu cầu tiếp ngọt với hai cống ngăn mặn Đa Lộc, Hiệp Hòa vào mùa khô, nguồn nước từ Cầu Quan (sông Hậu) được đưa sang kinh Thống Nhất và Trà Vinh. Trong ngày nước lên xuống hai lần, mỗi tháng có 2 lần triều cường sau ngày 1 và ngày 15 âl và 2 lần triều kèm sau ngày 7 và 23 âl (từ 2 đến 3 ngày), biên độ triều hàng ngày rất lớn, nhất là các khu vực gần cửa sông.\nBiên độ tắt dần khi vào nội đồng, đặc biệt vào mùa triều cường (tháng 10,12 dương lịch) đối với vùng kinh Thông Nhất qua ngọn Ô Chát chịu ảnh hưởng chung của sông Cổ Chiên và sông Hậu, biên độ triều hàng ngày nhỏ và hầu như không đáng kể vào thời kỳ triều cường nhất trong năm. Một số vùng thấp (Thanh Mỹ – Đa Lộc) có thời gian nước trên đồng không rút được, dù độ ngập không lớn.\nVào mùa khô, triều cường và gió chướng đã đưa nước mặn xâm nhập vào nội đồng, độ mặn trung bình thay đổi từ 2,24‰ -9,96‰ từ cuối tháng 1 đến tháng 6, tuy nhiên tháng tư có độ mặn cao nhất trên 18‰ (Hưng Mỹ). Các cửa sông gần biển thì độ mặn càng cao. Do dự trữ nước nội đồng và nguồn bổ sung từ trên xuống, từ sông Hậu sang nên độ mặn giảm dần khi vào nội đồng.\nHành chính.\nHuyện Châu Thành có 14 đơn vị hành chính cấp xã trực thuộc, bao gồm thị trấn Châu Thành và 13 xã: Đa Lộc, Hòa Lợi, Hòa Minh, Hòa Thuận, Hưng Mỹ, Long Hòa, Lương Hòa, Lương Hòa A, Mỹ Chánh, Nguyệt Hóa, Phước Hảo, Song Lộc, Thanh Mỹ.\nLịch sử."
      - >-
        Quận Sông Bé được thành lập theo Nghị định của Toàn quyền Đông Dương
        ngày 25 tháng 10 năm 1927 trên cơ sở đổi tên quận Phú Riềng (thuộc tỉnh
        Biên Hòa) và chuyển quận lị về Bu Kroai (nay thuộc xã Đức Hạnh, huyện Bù
        Gia Mập).

        Ngày 20 tháng 5 năm 1933, cùng với việc chuyển quận lị Sông  về núi 
        Rá, quận Sông  được đổi tên thành quận Núi  Rá.

        Quận Núi   được nâng cấp thành tỉnh Phước Long theo Sắc lệnh số
        143-NV ngày 22 tháng 10 năm 1956 do Tổng thống Việt Nam Cộng hòa ký,
        chia Nam phần thành 22 tỉnh. Tỉnh lỵ tỉnh Phước Long đặt tại Phước Bình,
        về mặt hành chính thuộc  Sơn Giang, quận Phước Bình (nay  khu vực
        trung tâm thị  Phước Long). Địa bàn quận Sông  nay thuộc tỉnh Bình
        Phước.

SentenceTransformer based on BAAI/bge-m3

This is a sentence-transformers model finetuned from BAAI/bge-m3. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: BAAI/bge-m3
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 1024 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: XLMRobertaModel 
  (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("strongpear/M3-retriever-Wiki")
# Run inference
sentences = [
    'Quận Sông Bé được thành lập vào thời điểm nào và dựa trên cơ sở nào?',
    'Quận Sông Bé được thành lập theo Nghị định của Toàn quyền Đông Dương ngày 25 tháng 10 năm 1927 trên cơ sở đổi tên quận Phú Riềng (thuộc tỉnh Biên Hòa) và chuyển quận lị về Bu Kroai (nay thuộc xã Đức Hạnh, huyện Bù Gia Mập).\nNgày 20 tháng 5 năm 1933, cùng với việc chuyển quận lị Sông Bé về núi Bà Rá, quận Sông Bé được đổi tên thành quận Núi Bà Rá.\nQuận Núi Bà Rá được nâng cấp thành tỉnh Phước Long theo Sắc lệnh số 143-NV ngày 22 tháng 10 năm 1956 do Tổng thống Việt Nam Cộng hòa ký, chia Nam phần thành 22 tỉnh. Tỉnh lỵ tỉnh Phước Long đặt tại Phước Bình, về mặt hành chính thuộc xã Sơn Giang, quận Phước Bình (nay là khu vực trung tâm thị xã Phước Long). Địa bàn quận Sông Bé nay thuộc tỉnh Bình Phước.',
    'Mạng lưới sông rạch.\nToàn huyện có 355\xa0km kênh mương thủy lợi chính, gồm 80\xa0km kênh cấp I và 275\xa0km kênh cấp II, bình quân 1 ha đất canh tác có 12,62m kênh mương thủy lợi.\nDo nằm ven sông Cổ Chiên và có cù lao Hoà Minh – Long Hoà chạy dài ra sát cửa Cung Hầu nên huyện Châu Thành chịu ảnh hưởng chế độ bán nhật trìêu của biển Đông, thông qua đoạn sông Cổ Chiên vào các hệ thống sông rạch lớn như: Láng Thé – Ba Si – Ô Chát, sông Trà Vinh – Kinh Thống Nhất hệ Tầm Phương, sông Bãi Vàng – Vinh Kim. Ngoài ra, do yêu cầu tiếp ngọt với hai cống ngăn mặn Đa Lộc, Hiệp Hòa vào mùa khô, nguồn nước từ Cầu Quan (sông Hậu) được đưa sang kinh Thống Nhất và Trà Vinh. Trong ngày nước lên xuống hai lần, mỗi tháng có 2 lần triều cường sau ngày 1 và ngày 15 âl và 2 lần triều kèm sau ngày 7 và 23 âl (từ 2 đến 3 ngày), biên độ triều hàng ngày rất lớn, nhất là các khu vực gần cửa sông.\nBiên độ tắt dần khi vào nội đồng, đặc biệt vào mùa triều cường (tháng 10,12 dương lịch) đối với vùng kinh Thông Nhất qua ngọn Ô Chát chịu ảnh hưởng chung của sông Cổ Chiên và sông Hậu, biên độ triều hàng ngày nhỏ và hầu như không đáng kể vào thời kỳ triều cường nhất trong năm. Một số vùng thấp (Thanh Mỹ – Đa Lộc) có thời gian nước trên đồng không rút được, dù độ ngập không lớn.\nVào mùa khô, triều cường và gió chướng đã đưa nước mặn xâm nhập vào nội đồng, độ mặn trung bình thay đổi từ 2,24‰ -9,96‰ từ cuối tháng 1 đến tháng 6, tuy nhiên tháng tư có độ mặn cao nhất trên 18‰ (Hưng Mỹ). Các cửa sông gần biển thì độ mặn càng cao. Do dự trữ nước nội đồng và nguồn bổ sung từ trên xuống, từ sông Hậu sang nên độ mặn giảm dần khi vào nội đồng.\nHành chính.\nHuyện Châu Thành có 14 đơn vị hành chính cấp xã trực thuộc, bao gồm thị trấn Châu Thành và 13 xã: Đa Lộc, Hòa Lợi, Hòa Minh, Hòa Thuận, Hưng Mỹ, Long Hòa, Lương Hòa, Lương Hòa A, Mỹ Chánh, Nguyệt Hóa, Phước Hảo, Song Lộc, Thanh Mỹ.\nLịch sử.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 148,500 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 7 tokens
    • mean: 19.77 tokens
    • max: 40 tokens
    • min: 7 tokens
    • mean: 408.51 tokens
    • max: 699 tokens
  • Samples:
    anchor positive
    Adidas đã thực hiện những bước tiến nào trong lĩnh vực giày thể thao từ năm 2005 đến 2006? Vào ngày 25 tháng 11 năm 2005, Adidas đã phát hành phiên bản mới của Adidas 1 với phạm vi đệm tăng lên, cho phép giày trở nên mềm hơn hoặc cứng hơn và một động cơ mới có mô-men xoắn lớn hơn 153%.
    Vào ngày 11 tháng 4 năm 2006, Adidas công bố hợp đồng 11 năm để trở thành nhà cung cấp quần áo chính thức của NBA. Công ty đã và đang sản xuất áo thi đấu và các sản phẩm của NBA, NBDL và WNBA cũng như các phiên bản màu đội của giày bóng rổ "Superstar". Thỏa thuận này (trị giá hơn 400 triệu đô la) đã tiếp quản thỏa thuận Reebok trước đó đã được thực hiện vào năm 2001 trong 10 năm.
    Vào tháng 11 năm 2011, Adidas thông báo rằng họ sẽ mua lại thương hiệu biểu diễn thể thao hành động ngoài trời Five Ten thông qua một thỏa thuận mua cổ phần. Tổng giá mua là 25 triệu đô la Mỹ bằng tiền mặt khi đóng cửa.
    Những năm gần đây.
    Vào cuối năm 2012, Adidas đã báo cáo doanh thu cao nhất từ ​​trước đến nay và Giám đốc điều hành Herbert Hainer bày tỏ sự lạc quan cho năm tới. Adidas hiện có trụ sở công ty toàn cầu...
    Tại sao Hồ Nhất Đao chết và điều gì xảy ra với vợ của ông? Không may Miêu Nhân Phụng (cầm đao của Hồ Nhất Đao) làm bị thương Hồ Nhất Đao, thế là Hồ Nhất Đao chết vì bị độc, vợ của Hồ Nhất Đao mới sinh được một đứa con trai - là nhân vật chính Hồ Phỉ - cũng tự sát theo chồng. Bi kịch thù hận bốn họ tạm thời ngưng lại trong sự hối hận của Miêu Nhân Phụng, ông chôn cất vợ chồng Hồ Nhất Đao và hàng năm tế bái, coi họ là anh em, suốt đời ân hận vì đã nỡ tay hại chết tri kỷ.
    Hồ Phỉ hóa giải ân oán.
    Đoạn này lẫn lộn nội dung Tuyết Sơn Phi Hồ và Phi Hồ Ngoại Truyện
    Khi Hồ Nhất Đao chết, bọn Điền Quy Nông muốn trừ hậu họa nên lục tìm giết đứa bé, nhưng Bình A Tứ (một người hầu nghèo khổ trong quán trước đó được Hồ Nhất Đao cứu giúp, chịu ơn lớn của Hồ Nhất Đao) đã nhanh tay cứu mang đứa bé đi. Thầy lang Diêm Cơ định cướp đao phổ nhưng không thành, chỉ giật được vài trang đầu sau đó đi tu luyện thành võ công cao cường lấy hiệu là Bảo Thụ.
    Bình A Tứ nuôi lớn Hồ Phỉ, Hồ Phỉ luyện thành võ công cao cường, quay lại tìm hiểu bí mật cái chết của cha mẹ (chi t...
    Thế hệ thứ nhất của RAF đã thực hiện những hoạt động gì trong giai đoạn 1970-1972? Thế hệ thứ nhất.
    Thế hệ thứ nhất của RAF (Andreas Baader, Gudrun Ensslin, Holger Meins, Ulrike Meinhof, Jan-Carl Raspe và nhiều người khác) trong thời gian từ 1970 đến 1972 đã thực hiện nhiều vụ đánh cướp ngân hàng, đánh bom các cơ sở quân sự Mỹ, trong đó có sở tổng chỉ huy quân đội Mỹ tại Frankfurt am Main, và cơ quan nhà nước, qua đó đã có bốn người chết và trên 30 người bị thương. Trong tháng 6 năm 1972 những người nắm vai trò chủ chốt bị bắt giam: Andreas Baader, Holger Meins và Jan-Carl Raspe tại Frankfurt, Gudrun Ensslin tại Hamburg, Brigitte Mohnhaupt tại Tây Berlin và Ulrike Meinhof tại Hannover. Tháng 5 năm 1975 họ bị khởi tố và trong tháng 4 năm 1977 sau 192 ngày xử án bị tuyên án tù chung thân vì tội giết người ngoài những tội khác.
    Trong nhà giam, nhóm người này khiếu nại về điều kiện giam giữ được thắt chặt như là tra tấn bằng cách cô lập và yêu cầu hủy bỏ điều này cũng như là công nhận quy chế tù nhân chiến tranh và những điều khác. Để tăng sức ép cho yêu cầu, họ đã nhiều...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 1,500 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 7 tokens
    • mean: 19.84 tokens
    • max: 48 tokens
    • min: 7 tokens
    • mean: 410.74 tokens
    • max: 657 tokens
  • Samples:
    anchor positive
    Pennsylvania được gọi là gì và có những đặc điểm gì liên quan đến chính quyền? Ngày nay, hai thành phố lớn của tiểu bang là —Philadelphia, quê hương của chuông Liberty, sảnh Independence, là một khu đô thị sầm uất, và Pittsburgh, một cảng sông bận rộn bên trong lục địa và là một trung tâm lớn cho giáo dục và các tiến bộ kỹ thuật. Dãy núi Pocono và Delaware Water Gap cung cấp các hoạt động giải trí phổ thông.
    Pennsylvania là một "Commonwealth", mặc cho nó có State Treasury và State Police. Massachusetts, Virginia và Kentucky cũng được biết như là "Commonwealth".
    Chiến hạm USS "Pennsylvania", bị hư hỏng tại Trân Châu Cảng "(Pearl Harbor)", được đặt tên để vinh danh tiểu bang này, cũng như là một vài chiến hạm hải quân khác. Nó được sửa chữa lại Sun Ship Yard & Dry Dock trước đây ở Chester, Pennsylvania.
    Romaja là gì và nó có liên quan như thế nào đến việc ghi tiếng Hàn Quốc? Romaja hay cách ghi tiếng Hàn Quốc (Triều Tiên) bằng chữ latinh là các phương pháp ghi tiếng Triều Tiên bằng chữ cái Latinh. Romaja có nghĩa là "La Mã tự" hay "chữ La Mã". Romaja quốc ngữ là phương pháp nhiều người thường dùng nhất.
    "Romaja" không được nhầm lẫn với "romanization (La-tinh hóa)". Cách viết thứ nhất có thể được áp dụng cho bất kỳ cách sử dụng chữ cái Latinh nào trong văn bản tiếng Hàn - cho dù đối với các từ hoặc tên tiếng Hàn hoặc không phải tiếng Hàn Quốc - trong khi cách viết thứ hai đề cập đến việc viết các từ tiếng Hàn bằng hệ thống chữ Latinh: hoặc là chữ La tinh hóa các từ riêng lẻ trong văn bản tiếng Hàn, hoặc viết toàn bộ văn bản tiếng Hàn bằng hệ thống chữ Latinh.
    Hệ thống.
    Nhiều lược đồ La tinh hóa đang được sử dụng phổ biến:
    Tây Sơn có vai trò gì trong địa lý của Bắc Kinh? Địa lý.
    Địa hình.
    Thành phố Bắc Kinh nằm trên vùng đất thấp và bằng phẳng, với độ cao thường nằm trong khoảng 40-60m trên mực nước biển. Điểm cao nhất trong khu thành cổ là đỉnh của Cảnh Sơn với độ cao là 88,35 m, từ đây có thể nhìn toàn cảnh Tử Cấm thành. Đỉnh của Vạn Thọ Sơn (万寿山) thuộc Di Hòa Viên có độ cao . Vùng đồng bằng từ Bắc Kinh kéo dài xa về phía đông đến Sơn Hải quan bên bờ Bột Hải và xa về phía nam đến Nam Kinh.
    Ở phía tây Bắc Kinh có Tây Sơn, có thể nhìn thấy núi này từ nội thị vào những ngày quang đãng. Tây Sơn tạo thành sườn núi phía đông của Thái Hành Sơn- dãy núi chạy theo chiều bắc-nam và tạo thành xương sống phía tây của Hà Bắc. Tây Sơn bao trùm gần như toàn bộ các quận Phòng Sơn và Môn Đầu Câu ở phía tây thành phố. Đông Linh Sơn (东灵山, cao ), một đỉnh núi của Tây Sơn nằm trên ranh giới với Hà Bắc, là đỉnh cao nhất tại Bắc Kinh. Đỉnh này nằm cách trung tâm thành phố . Tây Sơn cũng được biết đến với các đồng cỏ núi cao và các hẻm núi sông, bao gồm Thập Độ (十渡). Vùng c...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • num_train_epochs: 1
  • warmup_ratio: 0.1
  • bf16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 32
  • per_device_eval_batch_size: 32
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 1
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss
0.0431 200 0.0372 0.0122
0.0862 400 0.0226 0.0162
0.1293 600 0.0305 0.0181
0.1724 800 0.0351 0.0205
0.2155 1000 0.0326 0.0171
0.2586 1200 0.0289 0.0156
0.3017 1400 0.028 0.0169
0.3448 1600 0.0273 0.0199
0.3878 1800 0.0216 0.0180
0.4309 2000 0.0252 0.0122
0.4740 2200 0.0213 0.0138
0.5171 2400 0.0254 0.0142
0.5602 2600 0.0202 0.0155
0.6033 2800 0.0168 0.0145
0.6464 3000 0.0176 0.0123
0.6895 3200 0.0212 0.0123
0.7326 3400 0.0166 0.0102
0.7757 3600 0.0181 0.0102
0.8188 3800 0.0158 0.0086
0.8619 4000 0.0151 0.0090
0.9050 4200 0.0134 0.0095
0.9481 4400 0.012 0.0093
0.9912 4600 0.0134 0.0090

Framework Versions

  • Python: 3.9.20
  • Sentence Transformers: 3.3.1
  • Transformers: 4.45.2
  • PyTorch: 2.4.0+cu121
  • Accelerate: 1.0.1
  • Datasets: 3.0.0
  • Tokenizers: 0.20.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}