Spaces:

yuyijiong
/

quad_match_score

Sleeping

App Files Files Community

yuyijiong commited on Apr 13, 2023

Commit

13f64cc

•

1 Parent(s): 6a9adf9

Upload 2 files

Browse files

Files changed (2) hide show

README.md +6 -6
quad_match_score.py +261 -237

README.md CHANGED Viewed

@@ -47,9 +47,9 @@ references=["food | good | food#taste | pos & service | bad | service#general |
 result=module.compute(predictions=predictions, references=references)
 print(result)
-result={'ave match score of weight (1, 1, 1, 1)': 0.375,
-'f1 score of exact match': 0.0,
-'f1 score of optimal match of weight (1, 1, 1, 1)': 0.5}
 ```
 ### Inputs
@@ -78,9 +78,9 @@ result={'ave match score of weight (1, 1, 1, 1)': 0.375,
 *最优匹配 f1值、最优匹配样本平均得分、完全匹配 f1值（传统评估） 组成的dict，f1值均在[0,1]之间*
-*例如: {'ave match score of weight (1, 1, 1, 1)': 0.375,
-'f1 score of exact match': 0.0,
-'f1 score of optimal match of weight (1, 1, 1, 1)': 0.5}*
 ## Limitations and Bias

 result=module.compute(predictions=predictions, references=references)
 print(result)
+result={'f1 of exact match': 0.6667,
+        'f1 of optimal match of weight (1, 1, 1, 1)': 0.6666666666666666,
+        'score of optimal match of weight (1, 1, 1, 1)': 0.5}
 ```
 ### Inputs
 *最优匹配 f1值、最优匹配样本平均得分、完全匹配 f1值（传统评估） 组成的dict，f1值均在[0,1]之间*
+*例如:{'f1 of exact match': 0.6667,
+        'f1 of optimal match of weight (1, 1, 1, 1)': 0.6666666666666666,
+        'score of optimal match of weight (1, 1, 1, 1)': 0.5}*
 ## Limitations and Bias

quad_match_score.py CHANGED Viewed

@@ -15,10 +15,9 @@
 import copy
 import re
-from typing import List, Dict, Union,Callable
 import numpy as np
 import datasets
 import evaluate
 from rouge_chinese import Rouge
@@ -27,7 +26,7 @@ from scipy.optimize import linear_sum_assignment
 # TODO: Add BibTeX citation
 _CITATION = """\
 @InProceedings{huggingface:module,
-title = {A great new module},
 authors={huggingface, Inc.},
 year={2020}
 }
@@ -39,7 +38,6 @@ evaluate sentiment quadruples.
 评估生成模型的情感四元组
 """
 # TODO: Add description of the arguments of the module here
 _KWARGS_DESCRIPTION = """
 Calculates how good are predictions given some references, using certain scores
@@ -55,53 +53,22 @@ Examples:
     Examples should be written in doctest format, and should illustrate how
     to use the function.
-    >>> my_new_module = evaluate.load("my_new_module")
-    >>> results = my_new_module.compute(references=[0, 1], predictions=[0, 1])
-    >>> print(results)
-    {'accuracy': 1.0}
 """
-def compute_quadruple_f1(y_pred: List[str], y_true: Union[List[str], List[List[str]]],
-                         return_rp=False, **kwargs) -> Dict[str, float]:
-    assert len(y_pred) == len(y_true)
-    correct,  pred_num, true_num = 0, 0, 0
-    for pred, true in zip(y_pred, y_true):
-        pred = CommentUnitsSim.from_str(pred, **kwargs)
-        # 如果true是list，说明有多个正确答案
-        if isinstance(true, str):
-            true = CommentUnitsSim.from_str(true, **kwargs)
-        else:
-            true = [CommentUnitsSim.from_str(t,**kwargs) for t in true]
-        # 如果true是list，说明有多个正确答案，取最高分
-        if isinstance(true, list):
-            correct_list = [pred.compare_same(t) for t in true]
-            correct += max(correct_list)  # 获取得分最高的值
-            correct_index = correct_list.index(max(correct_list))  # 获取得分最高的索引
-            pred_num += pred.num
-            true_num += true[correct_index].num
-        else:
-            correct += pred.compare_same(true)
-            pred_num += pred.num
-            true_num += true.num
-    # 以下结果保留4位小数
-    precision = round(correct / pred_num, 4) + 1e-8
-    recall = round(correct / true_num, 4) + 1e-8
-    f1 = round(2 * precision * recall / (precision + recall), 4)
-    if return_rp:
-        return {"precision": precision, "recall": recall, "f1": f1}
-    else:
-        return  f1
 # 计算rougel的f1值
 def get_rougel_f1(text_pred_list: List[str], text_true_list: List[str]) -> float:
     assert len(text_pred_list) == len(text_true_list), "文本数量不一致"
-    #如果text_pred_list[0]为空字符串或空格，则返回0
     if not text_pred_list[0].strip():
         return 0
@@ -115,12 +82,13 @@ def get_rougel_f1(text_pred_list: List[str], text_true_list: List[str]) -> float
     return rouge_l_f1
 # 记录四元组的函数
 class CommentUnitsSim:
-    def __init__(self, data: List[Dict[str, str]],data_source:any=None,abnormal=False,language=None):
-        self.data_source=data_source
-        self.abnormal=abnormal
-        data=copy.deepcopy(data)
         # 如果字典有target，则改名为target_text
         for quad_dict in data:
             if 'target' in quad_dict:
@@ -131,73 +99,79 @@ class CommentUnitsSim:
                 del quad_dict['opinion']
         self.data = data
-        self.polarity_en2zh = {'positive': '积极', 'negative': '消极', 'neutral': '中性','pos':'积极','neg':'消极','neu':'中性','积极':'积极','消极':'消极','中性':'中性'}
-        self.polarity_zh2en={'积极':'pos','消极':'neg','中性':'neu','pos':'pos','neg':'neg','neu':'neu','positive':'pos','negative':'neg','neutral':'neu'}
-        self.language=language if language is not None else 'zh' if self.check_zh() else 'en'
-        self.none_sign='null'
     @property
     def num(self):
         return len(self.data)
-    #检查四元组中是否有中文
     def check_zh(self):
         for quad_dict in self.data:
-            if re.search('[\u4e00-\u9fa5]',quad_dict['target_text']) or re.search('[\u4e00-\u9fa5]',quad_dict['opinion_text']):
                 return True
         return False
     # 检测极性是否正确
     def check_polarity(self):
-        #若有某个四元组的极性不是positive、negative、neutral，则返回False
         for quad_dict in self.data:
-            if quad_dict['polarity'] not in ['positive', 'negative', 'neutral','pos','neg','neu','积极','消极','中性']:
-                self.abnormal=True
                 return False
-    #将极性由英文转为中文
     def convert_polarity_en2zh(self):
         for quad_dict in self.data:
-            quad_dict['polarity']=self.polarity_en2zh[quad_dict['polarity']]
         return self
-    #将极性由中文转为英文
     def convert_polarity_zh2en(self):
         for quad_dict in self.data:
-            quad_dict['polarity']=self.polarity_zh2en[quad_dict['polarity']]
         return self
-    #检查是否有重复的四元组，若有则删除重复的
     def del_duplicate(self):
-        new_data=[]
         for quad_dict in self.data:
             if quad_dict not in new_data:
                 new_data.append(quad_dict)
-        self.data=new_data
         return self
-    #检查是否有target和opinion都为null的四元组，若有则返回True
     def check_target_opinion_null(self):
         for quad_dict in self.data:
-            if quad_dict['target_text']=='null' and quad_dict['opinion_text']=='null':
                 return True
         return False
-    #检查是否有target或opinion为null的四元组，若有则返回True
     def check_any_null(self):
         for quad_dict in self.data:
-            if quad_dict['target_text']=='null' or quad_dict['opinion_text']=='null':
                 return True
         return False
     @classmethod
-    def from_str(cls, quadruple_str: str, tuple_len:Union[int,list,str]=4, format_code=0, sep_token1=' & ', sep_token2=' | '):
         data = []
-        abnormal=False
-        #确保分隔符后面一定是空格
-        for i in range(len(quadruple_str)-1):
-            if (quadruple_str[i] == sep_token1.strip() or quadruple_str[i] == sep_token2.strip()) and quadruple_str[i + 1] != ' ':
                 quadruple_str = quadruple_str[:i + 1] + ' ' + quadruple_str[i + 1:]
         # 选择几元组，即创建列表索引，从四元组中抽出n元
@@ -211,27 +185,27 @@ class CommentUnitsSim:
         else:
             raise Exception('tuple_len参数错误')
         for quadruple in quadruple_str.split(sep_token1):
             if format_code == 0:
                 # quadruple可能是target|opinion|aspect|polarity，也可能是target|opinion|aspect，也可能是target|opinion,若没有则为“None”
-                quadruple_split=[unit.strip() for unit in quadruple.split(sep_token2)]
-                if len(quadruple_split)>len(tuple_index):
                     print('quadruple格式错误，过多元素', quadruple_str)
-                    abnormal=True
-                    quadruple_split=quadruple_split[0:len(tuple_index)]  #过长则截断
-                elif len(quadruple_split)<len(tuple_index):
                     print('quadruple格式错误，过少元素', quadruple_str)
-                    abnormal=True
-                    quadruple_split=["None"]*(len(tuple_index)-len(quadruple_split))+quadruple_split #过短则补'None'
-                quadruple_keys=[["target_text","opinion_text","aspect","polarity"][i] for i in tuple_index]
-                quadruple_dict=dict(zip(quadruple_keys,quadruple_split))
                 q = {"target_text": 'None', "opinion_text": 'None', "aspect": 'None', "polarity": 'None'}
                 q.update(quadruple_dict)
-                #检查极性是否合法
-                if q['polarity'] not in ['pos','neg','neu','None','积极','消极','中性']:
                     print('quadruple格式错误，极性格式不对', quadruple_str)
             else:
@@ -239,10 +213,10 @@ class CommentUnitsSim:
             data.append(q)
-        return CommentUnitsSim(data,quadruple_str,abnormal)
     @classmethod
-    def from_list(cls, quadruple_list: List[List[str]],**kwargs):
         data = []
         for quadruple in quadruple_list:
             # #format_code='013'代表list只有四元组的第0、1、3个元素，需要扩充为4元组，空缺位置补上None
@@ -253,10 +227,10 @@ class CommentUnitsSim:
                 {"target_text": quadruple[0], "opinion_text": quadruple[1], "aspect": quadruple[2],
                  "polarity": quadruple[3]})
-        return CommentUnitsSim(data,quadruple_list,**kwargs)
     @classmethod
-    def from_list_dict(cls, quadruple_list: List[dict],**kwargs):
         for quad_dict in quadruple_list:
             if 'target' in quad_dict:
                 quad_dict['target_text'] = quad_dict['target']
@@ -267,22 +241,24 @@ class CommentUnitsSim:
         data = []
         for quadruple in quadruple_list:
-            #如果quadruple缺少某个key，则补上None
-            q={"target_text":'None',"opinion_text":'None',"aspect":'None',"polarity":'None'}
             q.update(quadruple)
             data.append(q)
-        return CommentUnitsSim(data,quadruple_list,**kwargs)
-    #转化为list,即只保留字典的value
     def to_list(self):
         data = []
         for quad_dict in self.data:
-            data.append([quad_dict['target_text'],quad_dict['opinion_text'],quad_dict['aspect'],quad_dict['polarity']])
         return data
     # 将data转换为n元组字符串
-    def get_quadruple_str(self, format_code=0, tuple_len:Union[int,list,str]=4,sep_token1=' & ',sep_token2=' | '):
         new_text_list = []
         # 选择几元组，即创建列表索引，从四元组中抽出n元
         if isinstance(tuple_len, int):
@@ -296,18 +272,18 @@ class CommentUnitsSim:
             raise Exception('tuple_len参数错误')
         try:
-            #若语言为中文，则使用中文极性
-            if self.language=='zh':
                 self.convert_polarity_en2zh()
             else:
                 self.convert_polarity_zh2en()
         except:
-            print('语言参数��误',self.data)
             print(self.language)
             raise Exception('语言参数错误')
-        #若tuple_index==[3]，则返回综合情感极性
-        if tuple_index==[3]:
             return self.merge_polarity()
         for quad_dict in self.data:
@@ -320,7 +296,6 @@ class CommentUnitsSim:
             # 提取polarity
             polarity = quad_dict['polarity']
             # 拼接，‘|’分割
             if format_code == 0:
                 # 根据tuple_len拼接
@@ -330,24 +305,24 @@ class CommentUnitsSim:
             new_text_list.append(new_text)
-        #如果tuple_index为[2,3]，则需要去除new_text_list中重复的元素，不要改变顺序。因为可能有重复的方面
-        if tuple_index==[2,3]:
             res = []
             for t in new_text_list:
                 if t not in res:
                     res.append(t)
-            new_text_list=res
-        #如果tuple_index为[3]，则只保留new_text_list的第一个元素。因为只有一个情感极性
-        elif tuple_index==[3]:
-            new_text_list=new_text_list[:1]
         if format_code == 0:
             # 根据tuple_len拼接
             return sep_token1.join(new_text_list)
     # 与另一个CommentUnits对象对比，检测有几个相同的四元组
-    def compare_same(self, other)->int:
         count = 0
         for quad_dict in self.data:
             if quad_dict in other.data:
@@ -403,10 +378,10 @@ class CommentUnitsSim:
             polarity_list.append(quad_dict['polarity'])
         return polarity_list
-    #对所有polarity进行综合
     def merge_polarity(self):
         polarity_list = self.get_polarity_list()
-        #判断是英文还是中文
         if self.language == 'en':
             if 'pos' in polarity_list and 'neg' in polarity_list:
                 return 'neu'
@@ -426,44 +401,47 @@ class CommentUnitsSim:
             else:
                 return '中性'
-    #检测是否有不合法opinion
     def check_opinion_in_comment(self, comment_text):
         for quad_dict in self.data:
-            if quad_dict['opinion_text'] !='*'  and (not quad_dict['opinion_text'] in comment_text):
                 return False
         return True
-    #检测是否有不合法target
-    def check_target_in_comment(self,comment_text):
         for quad_dict in self.data:
-            if quad_dict['target_text'] !='*'  and (not quad_dict['target_text'] in comment_text):
                 return False
         return True
-    #计算两个四元组的相似度
     @staticmethod
     def get_similarity(units1, units2: 'CommentUnitsSim'):
         pass
-    #对自身数据进行操作
-    def apply(self,func:Callable,field:str):
         for quad_dict in self.data:
             quad_dict[field] = func(quad_dict[field])
         return self
-#四元组匹配函数
 class CommentUnitsMatch:
-    def __init__(self,target_weight=0.5,opinion_weight=0.5,aspect_weight=0.5,polarity_weight=0.5):
-        #归一化权重
-        weight_sum = target_weight+opinion_weight+aspect_weight+polarity_weight
-        self.target_weight = target_weight/weight_sum
-        self.opinion_weight = opinion_weight/weight_sum
-        self.aspect_weight = aspect_weight/weight_sum
-        self.polarity_weight = polarity_weight/weight_sum
-    #特定feature置零
-    def set_zero(self,feature:str='polarity'):
         if feature == 'polarity':
             self.polarity_weight = 0
         elif feature == 'aspect':
@@ -476,21 +454,20 @@ class CommentUnitsMatch:
             raise Exception('feature参数错误')
     def re_normalize(self):
-        weight_sum = self.target_weight+self.opinion_weight+self.aspect_weight+self.polarity_weight
-        self.target_weight = self.target_weight/weight_sum
-        self.opinion_weight = self.opinion_weight/weight_sum
-        self.aspect_weight = self.aspect_weight/weight_sum
-        self.polarity_weight = self.polarity_weight/weight_sum
-    #计算cost矩阵
-    def get_cost_matrix(self,units1: 'CommentUnitsSim', units2: 'CommentUnitsSim',feature:str='polarity'):
         pass
-        #检查此feature是否存在，不存在则返回全0矩阵
-        if units1.data[0].get(feature) is None or units2.data[0].get(feature) is None\
-                or units1.data[0].get(feature)=='None' or units2.data[0].get(feature)=='None':
-            cost_matrix = np.zeros((len(units1.data),len(units2.data)))
-            #对应feature的weight也为0
             self.set_zero(feature)
             # 并再次归一化
@@ -498,7 +475,7 @@ class CommentUnitsMatch:
             return cost_matrix
-        #检查两个四元组的极性是否相同，生成cost矩阵，用于匈牙利算法。不相同则cost为1，相同则cost为0
         cost_matrix = []
         for quad_dict1 in units1.data:
             cost_list = []
@@ -509,23 +486,23 @@ class CommentUnitsMatch:
                     cost_list.append(1)
             cost_matrix.append(cost_list)
-        #cost矩阵转换为numpy数组，大小为(len(units1.data),len(units2.data))
         cost_matrix = np.array(cost_matrix)
         return cost_matrix
-    #计算cost矩阵，使用rouge指标
-    def get_cost_matrix_rouge(self,units1: 'CommentUnitsSim', units2: 'CommentUnitsSim',feature:str='target_text'):
-        #检查此feature是否存在，不存在则返回全0矩阵
-        if units1.data[0].get(feature) is None or units2.data[0].get(feature) is None\
-                or units1.data[0].get(feature)=='None' or units2.data[0].get(feature)=='None':
-            cost_matrix = np.zeros((len(units1.data),len(units2.data)))
-            #对应feature的weight也为0
             self.set_zero(feature)
             # 并再次归一化
             self.re_normalize()
             return cost_matrix
-        #检查两个四元组的极性是否相同，生成cost矩阵，用于匈牙利算法。相同则cost为0，不相同则cost为1-rougel
         cost_matrix = []
         for quad_dict1 in units1.data:
             cost_list = []
@@ -533,63 +510,71 @@ class CommentUnitsMatch:
                 if quad_dict1[feature] == quad_dict2[feature]:
                     cost_list.append(0)
                 else:
-                    cost_list.append(1-get_rougel_f1([quad_dict1[feature]],[quad_dict2[feature]]))
             cost_matrix.append(cost_list)
-        #cost矩阵转换为numpy数组，大小为(len(units1.data),len(units2.data))
         cost_matrix = np.array(cost_matrix)
         return cost_matrix
-    def match_units(self,units1: 'CommentUnitsSim', units2: 'CommentUnitsSim',one_match=True)->tuple:
-        #计算极性的cost矩阵，矩阵元素在0-1之间
-        cost_matrix_polarity = self.get_cost_matrix(units1, units2,feature='polarity')
-        #计算aspect的cost矩阵
-        cost_matrix_aspect = self.get_cost_matrix(units1, units2,feature='aspect')
-        #计算target的cost矩阵
-        cost_matrix_target = self.get_cost_matrix_rouge(units1, units2,feature='target_text')
-        #计算opinion的cost矩阵
-        cost_matrix_opinion = self.get_cost_matrix_rouge(units1, units2,feature='opinion_text')
-        #计算总的cost矩阵，矩阵元素在0-1之间。矩阵的行数为units1即pred的数量，列数为units2即true的数量
-        cost_matrix = self.target_weight*cost_matrix_target + self.opinion_weight*cost_matrix_opinion + \
-                      self.aspect_weight*cost_matrix_aspect + self.polarity_weight*cost_matrix_polarity
-        score_matrix = 1-cost_matrix
-        #使用匈牙利算法进行匹配
-        if one_match:
             row_ind, col_ind = linear_sum_assignment(cost_matrix)
         else:
-            #允许一对多的匹配
-            row_ind = np.argmin(cost_matrix, axis=0)
-            col_ind = np.arange(len(units2.data))
-        max_units_num=max(units1.num,units2.num)
-        #计算这种匹配的cost
-        cost = 0
         for i in range(len(row_ind)):
             cost += cost_matrix[row_ind[i]][col_ind[i]]
-        #计算这种匹配下的TP\FP\FN
         TP = 0
         for i in range(len(row_ind)):
             TP += score_matrix[row_ind[i]][col_ind[i]]
-        #len(row_ind)为pred的数量，TP为匹配上的数量
-        FP = units1.num-TP
-        FN = units2.num-TP
-        #匹配不上的四元组，cost为1
-        cost += (max_units_num-len(row_ind))
-        cost_per_quadruple=cost/max_units_num
-        if cost_per_quadruple>1 or cost_per_quadruple <0:
-            print('cost错误',cost_per_quadruple,'pred:',units1.data,'true:',units2.data)
-            print(self.target_weight,self.opinion_weight,self.aspect_weight,self.polarity_weight)
-        #返回的cost在0-1之间
-        return cost_per_quadruple,TP,FP,FN
 @evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
@@ -632,9 +617,9 @@ class QuadMatch(evaluate.Metric):
         pass
     def _compute(self,
-                 predictions:List[str],
-                 references: Union[List[str],List[List[str]]],
-                 quad_weights:tuple=(1,1,1,1),
                  **kwargs) -> dict:
         '''
@@ -673,55 +658,94 @@ class QuadMatch(evaluate.Metric):
                       '13':'二元组(观点 | 极性)',
                         '3':'单元素(极性)'}
         '''
-        assert len(predictions) == len(references)
-        if isinstance(predictions,str):
-            predictions=[predictions]
-            references=[references]
-        cost=0
-        TP,FP,FN=0,0,0
-        matcher = CommentUnitsMatch(*quad_weights)
-        for pred, true in zip(predictions, references):
-            pred = CommentUnitsSim.from_str(pred,**kwargs)
             # 如果true是list，说明有多个正确答案
             if isinstance(true, str):
                 true = CommentUnitsSim.from_str(true, **kwargs)
-            elif isinstance(true, list):
-                true=[CommentUnitsSim.from_str(t, **kwargs) for t in true]
             else:
-                print("true的类型不对",true)
-                continue
-            #如果true是list，说明有多个正确答案，取最高分
             if isinstance(true, list):
-                cost_list=[matcher.match_units(pred,t,one_match=True) for t in true]
-                # 获取得分最高的值的索引，按元组中第一个元素大小排序
-                cost_,TP_,FP_,FN_ = cost_list[np.argmax([c[0] for c in cost_list])]
-                cost += cost_
-                TP+=TP_
-                FP+=FP_
-                FN+=FN_
             else:
-                cost_,TP_,FP_,FN_ = matcher.match_units(pred,true,one_match=True)
-                cost += cost_
-                TP+=TP_
-                FP+=FP_
-                FN+=FN_
-        #平均cost
-        cost=cost/len(predictions)
-        #由TP\FP\FN计算最优匹配F1
-        precision_match=TP/(TP+FP)
-        recall_match=TP/(TP+FN)
-        f1_match=2*precision_match*recall_match/(precision_match+recall_match)
-        f1=compute_quadruple_f1(y_pred=predictions,y_true=references, **kwargs)
-        #取1-cost为得分
-        return {'ave match score of weight '+str(quad_weights):1-cost,
-                'f1 score of optimal match of weight '+str(quad_weights): f1_match,
-                'f1 score of exact match':f1}

 import copy
 import re
+from typing import List, Dict, Union, Callable
 import numpy as np
 import datasets
 import evaluate
 from rouge_chinese import Rouge
 # TODO: Add BibTeX citation
 _CITATION = """\
 @InProceedings{huggingface:module,
+title = {quad match score},
 authors={huggingface, Inc.},
 year={2020}
 }
 评估生成模型的情感四元组
 """
 # TODO: Add description of the arguments of the module here
 _KWARGS_DESCRIPTION = """
 Calculates how good are predictions given some references, using certain scores
     Examples should be written in doctest format, and should illustrate how
     to use the function.
+    >>> import evaluate
+    >>> module = evaluate.load("yuyijiong/quad_match_score")
+    >>> predictions=["food | good | food#taste | pos"]
+    >>> references=["food | good | food#taste | pos & service | bad | service#general | neg"]
+    >>> result=module.compute(predictions=predictions, references=references)
+    >>> print(result)
+    result={'ave match score of weight (1, 1, 1, 1)': 0.375,
+    'f1 score of exact match': 0.0,
+    'f1 score of optimal match of weight (1, 1, 1, 1)': 0.5}
 """
 # 计算rougel的f1值
 def get_rougel_f1(text_pred_list: List[str], text_true_list: List[str]) -> float:
     assert len(text_pred_list) == len(text_true_list), "文本数量不一致"
+    # 如果text_pred_list[0]为空字符串或空格，则返回0
     if not text_pred_list[0].strip():
         return 0
     return rouge_l_f1
 # 记录四元组的函数
 class CommentUnitsSim:
+    def __init__(self, data: List[Dict[str, str]], data_source: any = None, abnormal=False, language=None):
+        self.data_source = data_source
+        self.abnormal = abnormal
+        data = copy.deepcopy(data)
         # 如果字典有target，则改名为target_text
         for quad_dict in data:
             if 'target' in quad_dict:
                 del quad_dict['opinion']
         self.data = data
+        self.polarity_en2zh = {'positive': '积极', 'negative': '消极', 'neutral': '中性', 'pos': '积极', 'neg': '消极',
+                               'neu': '中性', '积极': '积极', '消极': '消极', '中性': '中性'}
+        self.polarity_zh2en = {'积极': 'pos', '消极': 'neg', '中性': 'neu', 'pos': 'pos', 'neg': 'neg', 'neu': 'neu',
+                               'positive': 'pos', 'negative': 'neg', 'neutral': 'neu'}
+        self.language = language if language is not None else 'zh' if self.check_zh() else 'en'
+        self.none_sign = 'null'
     @property
     def num(self):
         return len(self.data)
+    # 检查四元组中是否有中文
     def check_zh(self):
         for quad_dict in self.data:
+            if re.search('[\u4e00-\u9fa5]', quad_dict['target_text']) or re.search('[\u4e00-\u9fa5]',
+                                                                                   quad_dict['opinion_text']):
                 return True
         return False
     # 检测极性是否正确
     def check_polarity(self):
+        # 若有某个四元组的极性不是positive、negative、neutral，则返回False
         for quad_dict in self.data:
+            if quad_dict['polarity'] not in ['positive', 'negative', 'neutral', 'pos', 'neg', 'neu', '积极', '消极',
+                                             '中性']:
+                self.abnormal = True
                 return False
+    # 将极性由英文转为中文
     def convert_polarity_en2zh(self):
         for quad_dict in self.data:
+            quad_dict['polarity'] = self.polarity_en2zh[quad_dict['polarity']]
         return self
+    # 将极性由中文转为英文
     def convert_polarity_zh2en(self):
         for quad_dict in self.data:
+            quad_dict['polarity'] = self.polarity_zh2en[quad_dict['polarity']]
         return self
+    # 检查是否有重复的四元组，若有则删除重复的
     def del_duplicate(self):
+        new_data = []
         for quad_dict in self.data:
             if quad_dict not in new_data:
                 new_data.append(quad_dict)
+        self.data = new_data
         return self
+    # 检查是否有target和opinion都为null的四元组，若有则返回True
     def check_target_opinion_null(self):
         for quad_dict in self.data:
+            if quad_dict['target_text'] == 'null' and quad_dict['opinion_text'] == 'null':
                 return True
         return False
+    # 检查是否有target或opinion为null的四元组，若有则返回True
     def check_any_null(self):
         for quad_dict in self.data:
+            if quad_dict['target_text'] == 'null' or quad_dict['opinion_text'] == 'null':
                 return True
         return False
     @classmethod
+    def from_str(cls, quadruple_str: str, tuple_len: Union[int, list, str] = 4, format_code=0, sep_token1=' & ',
+                 sep_token2=' | '):
         data = []
+        abnormal = False
+        # 确保分隔符后面一定是空格
+        for i in range(len(quadruple_str) - 1):
+            if (quadruple_str[i] == sep_token1.strip() or quadruple_str[i] == sep_token2.strip()) and quadruple_str[
+                i + 1] != ' ':
                 quadruple_str = quadruple_str[:i + 1] + ' ' + quadruple_str[i + 1:]
         # 选择几元组，即创建列表索引，从四元组中抽出n元
         else:
             raise Exception('tuple_len参数错误')
         for quadruple in quadruple_str.split(sep_token1):
             if format_code == 0:
                 # quadruple可能是target|opinion|aspect|polarity，也可能是target|opinion|aspect，也可能是target|opinion,若没有则为“None”
+                quadruple_split = [unit.strip() for unit in quadruple.split(sep_token2)]
+                if len(quadruple_split) > len(tuple_index):
                     print('quadruple格式错误，过多元素', quadruple_str)
+                    abnormal = True
+                    quadruple_split = quadruple_split[0:len(tuple_index)]  # 过长则截断
+                elif len(quadruple_split) < len(tuple_index):
                     print('quadruple格式错误，过少元素', quadruple_str)
+                    abnormal = True
+                    quadruple_split = ["None"] * (
+                                len(tuple_index) - len(quadruple_split)) + quadruple_split  # 过短则补'None'
+                quadruple_keys = [["target_text", "opinion_text", "aspect", "polarity"][i] for i in tuple_index]
+                quadruple_dict = dict(zip(quadruple_keys, quadruple_split))
                 q = {"target_text": 'None', "opinion_text": 'None', "aspect": 'None', "polarity": 'None'}
                 q.update(quadruple_dict)
+                # 检查极性是否合法
+                if q['polarity'] not in ['pos', 'neg', 'neu', 'None', '积极', '消极', '中性']:
                     print('quadruple格式错误，极性格式不对', quadruple_str)
             else:
             data.append(q)
+        return CommentUnitsSim(data, quadruple_str, abnormal)
     @classmethod
+    def from_list(cls, quadruple_list: List[List[str]], **kwargs):
         data = []
         for quadruple in quadruple_list:
             # #format_code='013'代表list只有四元组的第0、1、3个元素，需要扩充为4元组，空缺位置补上None
                 {"target_text": quadruple[0], "opinion_text": quadruple[1], "aspect": quadruple[2],
                  "polarity": quadruple[3]})
+        return CommentUnitsSim(data, quadruple_list, **kwargs)
     @classmethod
+    def from_list_dict(cls, quadruple_list: List[dict], **kwargs):
         for quad_dict in quadruple_list:
             if 'target' in quad_dict:
                 quad_dict['target_text'] = quad_dict['target']
         data = []
         for quadruple in quadruple_list:
+            # 如果quadruple缺少某个key，则补上None
+            q = {"target_text": 'None', "opinion_text": 'None', "aspect": 'None', "polarity": 'None'}
             q.update(quadruple)
             data.append(q)
+        return CommentUnitsSim(data, quadruple_list, **kwargs)
+    # 转化为list,即只保留字典的value
     def to_list(self):
         data = []
         for quad_dict in self.data:
+            data.append(
+                [quad_dict['target_text'], quad_dict['opinion_text'], quad_dict['aspect'], quad_dict['polarity']])
         return data
     # 将data转换为n元组字符串
+    def get_quadruple_str(self, format_code=0, tuple_len: Union[int, list, str] = 4, sep_token1=' & ',
+                          sep_token2=' | '):
         new_text_list = []
         # 选择几元组，即创建列表索引，从四元组中抽出n元
         if isinstance(tuple_len, int):
             raise Exception('tuple_len参数错误')
         try:
+            # 若语言为中文，则使用中文极性
+            if self.language == 'zh':
                 self.convert_polarity_en2zh()
             else:
                 self.convert_polarity_zh2en()
         except:
+            print('语言参数错误', self.data)
             print(self.language)
             raise Exception('语言参数错误')
+        # 若tuple_index==[3]，则返回综合情感极性
+        if tuple_index == [3]:
             return self.merge_polarity()
         for quad_dict in self.data:
             # 提取polarity
             polarity = quad_dict['polarity']
             # 拼接，‘|’分割
             if format_code == 0:
                 # 根据tuple_len拼接
             new_text_list.append(new_text)
+        # 如果tuple_index为[2,3]，则需要去除new_text_list中重复的元素，不要改变顺序。因为可能有重复的方面
+        if tuple_index == [2, 3]:
             res = []
             for t in new_text_list:
                 if t not in res:
                     res.append(t)
+            new_text_list = res
+        # 如果tuple_index为[3]，则只保留new_text_list的第一个元素。因为只有一个情感极性
+        elif tuple_index == [3]:
+            new_text_list = new_text_list[:1]
         if format_code == 0:
             # 根据tuple_len拼接
             return sep_token1.join(new_text_list)
     # 与另一个CommentUnits对象对比，检测有几个相同的四元组
+    def compare_same(self, other) -> int:
         count = 0
         for quad_dict in self.data:
             if quad_dict in other.data:
             polarity_list.append(quad_dict['polarity'])
         return polarity_list
+    # 对所有polarity进行综合
     def merge_polarity(self):
         polarity_list = self.get_polarity_list()
+        # 判断是英文还是中文
         if self.language == 'en':
             if 'pos' in polarity_list and 'neg' in polarity_list:
                 return 'neu'
             else:
                 return '中性'
+    # 检测是否有不合法opinion
     def check_opinion_in_comment(self, comment_text):
         for quad_dict in self.data:
+            if quad_dict['opinion_text'] != '*' and (not quad_dict['opinion_text'] in comment_text):
                 return False
         return True
+    # 检测是否有不合法target
+    def check_target_in_comment(self, comment_text):
         for quad_dict in self.data:
+            if quad_dict['target_text'] != '*' and (not quad_dict['target_text'] in comment_text):
                 return False
         return True
+    # 计算两个四元组的相似度
     @staticmethod
     def get_similarity(units1, units2: 'CommentUnitsSim'):
         pass
+    # 对自身数据进行操作
+    def apply(self, func: Callable, field: str):
         for quad_dict in self.data:
             quad_dict[field] = func(quad_dict[field])
         return self
+# 四元组匹配函数
 class CommentUnitsMatch:
+    def __init__(self, target_weight=0.5, opinion_weight=0.5, aspect_weight=0.5, polarity_weight=0.5, one_match=True):
+        # 归一化权重
+        weight_sum = target_weight + opinion_weight + aspect_weight + polarity_weight
+        self.target_weight = target_weight / weight_sum
+        self.opinion_weight = opinion_weight / weight_sum
+        self.aspect_weight = aspect_weight / weight_sum
+        self.polarity_weight = polarity_weight / weight_sum
+        # 是否一对一匹配
+        self.one_match = one_match
+    # 特定feature置零
+    def set_zero(self, feature: str = 'polarity'):
         if feature == 'polarity':
             self.polarity_weight = 0
         elif feature == 'aspect':
             raise Exception('feature参数错误')
     def re_normalize(self):
+        weight_sum = self.target_weight + self.opinion_weight + self.aspect_weight + self.polarity_weight
+        self.target_weight = self.target_weight / weight_sum
+        self.opinion_weight = self.opinion_weight / weight_sum
+        self.aspect_weight = self.aspect_weight / weight_sum
+        self.polarity_weight = self.polarity_weight / weight_sum
+    # 计算cost矩阵，完全匹配为0，不匹配为1
+    def get_cost_matrix(self, units1: 'CommentUnitsSim', units2: 'CommentUnitsSim', feature: str = 'polarity'):
         pass
+        # 检查此feature是否存在，不存在则返回全0矩阵
+        if units1.data[0].get(feature) is None or units2.data[0].get(feature) is None \
+                or units1.data[0].get(feature) == 'None' or units2.data[0].get(feature) == 'None':
+            cost_matrix = np.zeros((len(units1.data), len(units2.data)))
+            # 对应feature的weight也为0
             self.set_zero(feature)
             # 并再次归一化
             return cost_matrix
+        # 检查两个四元组的极性是否相同，生成cost矩阵，用于匈牙利算法。不相同则cost为1，相同则cost为0
         cost_matrix = []
         for quad_dict1 in units1.data:
             cost_list = []
                     cost_list.append(1)
             cost_matrix.append(cost_list)
+        # cost矩阵转换为numpy数组，大小为(len(units1.data),len(units2.data))
         cost_matrix = np.array(cost_matrix)
         return cost_matrix
+    # 计算cost矩阵，使用rougel指标
+    def get_cost_matrix_rouge(self, units1: 'CommentUnitsSim', units2: 'CommentUnitsSim', feature: str = 'target_text'):
+        # 检查此feature是否存在，不存在则返回全0矩阵
+        if units1.data[0].get(feature) is None or units2.data[0].get(feature) is None \
+                or units1.data[0].get(feature) == 'None' or units2.data[0].get(feature) == 'None':
+            cost_matrix = np.zeros((len(units1.data), len(units2.data)))
+            # 对应feature的weight也为0
             self.set_zero(feature)
             # 并再次归一化
             self.re_normalize()
             return cost_matrix
+        # 检查两个四元组的极性是否相同，生成cost矩阵，用于匈牙利算法。相同则cost为0，不相同则cost为1-rougel
         cost_matrix = []
         for quad_dict1 in units1.data:
             cost_list = []
                 if quad_dict1[feature] == quad_dict2[feature]:
                     cost_list.append(0)
                 else:
+                    cost_list.append(1 - get_rougel_f1([quad_dict1[feature]], [quad_dict2[feature]]))
             cost_matrix.append(cost_list)
+        # cost矩阵转换为numpy数组，大小为(len(units1.data),len(units2.data))
         cost_matrix = np.array(cost_matrix)
         return cost_matrix
+    # 匹配四元组并计算cost
+    def match_units(self, units1: 'CommentUnitsSim', units2: 'CommentUnitsSim') -> tuple:
+        # 计算极性的cost矩阵，矩阵元素在0-1之间
+        cost_matrix_polarity = self.get_cost_matrix(units1, units2, feature='polarity')
+        # 计算aspect的cost矩阵
+        cost_matrix_aspect = self.get_cost_matrix(units1, units2, feature='aspect')
+        # 计算target的cost矩阵
+        cost_matrix_target = self.get_cost_matrix_rouge(units1, units2, feature='target_text')
+        # 计算opinion的cost矩阵
+        cost_matrix_opinion = self.get_cost_matrix_rouge(units1, units2, feature='opinion_text')
+        # 计算总的cost矩阵，矩阵元素在0-1之间。矩阵的行数为units1即pred的数量，列数为units2即true的数量
+        cost_matrix = self.target_weight * cost_matrix_target + self.opinion_weight * cost_matrix_opinion + \
+                      self.aspect_weight * cost_matrix_aspect + self.polarity_weight * cost_matrix_polarity
+        score_matrix = 1 - cost_matrix
+        cost = 0
+        # 使用匈牙利算法进行匹配
+        if self.one_match:
+            # 只允许一对一的匹配，这种情况下row_ind和col_ind的长度一定相等且等于units1和units2的数量中的较小值
             row_ind, col_ind = linear_sum_assignment(cost_matrix)
         else:
+            # 允许一对多的匹配。这种情况下每个四元组都一定匹配上,这种情况下row_ind和col_ind的长度一定相等且等于units1和units2的数量中的较大值
+            if units1.num > units2.num:
+                row_ind = np.arange(units1.num)
+                col_ind = np.argmin(cost_matrix, axis=1)
+            else:
+                row_ind = np.argmin(cost_matrix, axis=0)
+                col_ind = np.arange(units2.num)
+        # 计算这种匹配的cost
         for i in range(len(row_ind)):
             cost += cost_matrix[row_ind[i]][col_ind[i]]
+        # 计算这种匹配下的TP\FP\FN
         TP = 0
         for i in range(len(row_ind)):
             TP += score_matrix[row_ind[i]][col_ind[i]]
+        # len(row_ind)为pred的数量，TP为匹配上的数量
+        FP = units1.num - TP
+        FN = units2.num - TP
+        # 如果一对一匹配，会有匹配不上的四元组，这些四元组cost为1
+        max_units_num = max(units1.num, units2.num)
+        if self.one_match:
+            cost += (max_units_num - len(row_ind))
+        # 对cost进行归一化，使其在0-1之间
+        cost_per_quadruple = cost / max_units_num
+        if cost_per_quadruple > 1 or cost_per_quadruple < 0:
+            print('cost错误', cost_per_quadruple, 'pred:', units1.data, 'true:', units2.data)
+            print(self.target_weight, self.opinion_weight, self.aspect_weight, self.polarity_weight)
+        # 返回的cost在0-1之间
+        return cost_per_quadruple, TP, FP, FN
 @evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
         pass
     def _compute(self,
+                 predictions: List[str],
+                 references: Union[List[str], List[List[str]]],
+                 quad_weights: tuple = (1, 1, 1, 1),
                  **kwargs) -> dict:
         '''
                       '13':'二元组(观点 | 极性)',
                         '3':'单元素(极性)'}
         '''
+        f1_of_optimal_match, score_of_optimal_match = self.quad_f1_of_optimal_match(predictions, references,
+                                                                                    quad_weights, **kwargs)
+        f1 = self.quad_f1_of_exact_match(y_pred=predictions, y_true=references, **kwargs)
+        # 取1-cost为得分
+        return {'score of optimal match of weight ' + str(quad_weights): score_of_optimal_match,
+                'f1 of optimal match of weight ' + str(quad_weights): f1_of_optimal_match,
+                'f1 of exact match': f1}
+    @staticmethod
+    def quad_f1_of_exact_match(y_pred: List[str], y_true: Union[List[str], List[List[str]]],
+                               return_dict=False, **kwargs) -> Union[Dict[str, float], float]:
+        assert len(y_pred) == len(y_true), "文本数量不一致"
+        correct, pred_num, true_num = 0, 0, 0
+        for pred, true in zip(y_pred, y_true):
+            pred = CommentUnitsSim.from_str(pred, **kwargs)
             # 如果true是list，说明有多个正确答案
             if isinstance(true, str):
                 true = CommentUnitsSim.from_str(true, **kwargs)
             else:
+                true = [CommentUnitsSim.from_str(t, **kwargs) for t in true]
+            # 如果true是list，说明有多个正确答案，取最高分
             if isinstance(true, list):
+                correct_list = [pred.compare_same(t) for t in true]
+                correct += max(correct_list)  # 获取得分最高的值
+                correct_index = correct_list.index(max(correct_list))  # 获取得分最高的索引
+                pred_num += pred.num
+                true_num += true[correct_index].num
             else:
+                correct += pred.compare_same(true)
+                pred_num += pred.num
+                true_num += true.num
+        # 以下结果保留4位小数
+        precision = round(correct / pred_num, 4) + 1e-8
+        recall = round(correct / true_num, 4) + 1e-8
+        f1 = round(2 * precision * recall / (precision + recall), 4)
+        if return_dict:
+            return {"precision": precision, "recall": recall, "f1": f1}
+        else:
+            return f1
+    # 计算最优匹配f1
+    @staticmethod
+    def quad_f1_of_optimal_match(
+            predictions: List[str],
+            references: Union[List[str], List[List[str]]],
+            quad_weights: tuple = (1, 1, 1, 1),
+            one_match=True,
+            **kwargs):
+        assert len(predictions) == len(references)
+        if isinstance(predictions, str):
+            predictions = [predictions]
+            references = [references]
+        cost = 0
+        TP, FP, FN = 0, 0, 0
+        matcher = CommentUnitsMatch(*quad_weights, one_match=one_match)
+        for pred, refer in zip(predictions, references):
+            pred = CommentUnitsSim.from_str(pred, **kwargs)
+            # 将refer转换为list形式
+            if isinstance(refer, str):
+                refer = [refer]
+            # 将refer中的每个元素转换为CommentUnitsSim
+            refer = [CommentUnitsSim.from_str(t, **kwargs) for t in refer]
+            # 如果true是多个正确答案，取最高分
+            cost_list = [matcher.match_units(pred, t) for t in refer]
+            # 获取得分最高的值的索引，按元组中第一个元素大小排序
+            # 计算每一对样本的cost，TP，FP，FN
+            cost_, TP_, FP_, FN_ = cost_list[np.argmax([c[0] for c in cost_list])]
+            cost += cost_
+            TP += TP_
+            FP += FP_
+            FN += FN_
+        # 平均cost
+        cost = cost / len(predictions)
+        # 由TP\FP\FN计算最优匹配F1
+        precision_match = TP / (TP + FP)
+        recall_match = TP / (TP + FN)
+        f1_match = 2 * precision_match * recall_match / (precision_match + recall_match)
+        return f1_match, 1 - cost