File size: 17,551 Bytes
ea0ff68
 
2df01b6
 
ea0ff68
 
3b0fd59
 
ea0ff68
 
f12ec22
ea0ff68
 
 
0eb13cb
91dff47
52409a4
 
ea0ff68
 
 
 
 
 
 
 
 
 
 
 
 
 
 
9ec462e
ea0ff68
 
 
9ec462e
ea0ff68
 
 
9ec462e
229ff83
95fa8f2
ea0ff68
9ec462e
ea0ff68
 
 
b3d0e95
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ea0ff68
 
 
 
 
 
 
 
 
 
5b10892
ea0ff68
 
 
 
23fe7cf
 
 
 
 
 
 
887e1fe
23fe7cf
 
 
 
 
 
9c598cb
887e1fe
d93f5ca
 
a85c743
d93f5ca
ea0ff68
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
{
  "title": {
    "bg": "Инструмент за разпознаване на невярна информация, дезинформация и текстови дийпфейкове",
    "en": "Tool for recognizing untrue information, disinformation and deepfake texts"
  },
  "disclaimer_title": {
    "bg": "Моля, запознайте се с условията за ползване:",
    "en": "Please read the terms of use:"
  },
  "disclaimer_agree_text": {
    "bg": "Запознах се",
    "en": "I agree"
  },
  "disclaimer": {
    "bg": "Моля, прочетете целия текст. Достъпът до уеб инструмента ще бъде предоставен само ако сте съгласни с условията за използване, посочени по-долу: \n \n За какво може да се използва този уеб инструмент: \n \n Инструментът използва резултатите от проекта TRACES (https://traces.gate-ai.eu/), който е получил непряко финансиране по Програмата на Европейския съюз за действие в областта на научните изследвания и иновациите “Хоризонт 2020” чрез Открита покана № 1, публикувана и изпълнена в рамките на проекта AI4Media (Договор № 951911). \n \n Целта на този прототип е да дава индикация, дали даден текст на български език потенциално съдържа невярна информация, целенасочена дезинформация или представлява автоматично генериран текст (с цел да се разпознават текстови “дийпфейкове”). За разработването на прототипа са използвани текстове от социалните медии с дължина до 250 символа. \n \n Значението на понятието “дезинформация” е взето от *Съобщението на Европейската комисия до Европейския парламент, Съвета, Европейския икономически и социален комитет и Комитета на регионите* относно Плана за действие за европейска демокрация (https://eur-lex.europa.eu/legal-content/BG/TXT/HTML/?uri=CELEX:52020DC0790&from=EN) и означава “невярно или подвеждащо съдържание, което се разпространява с цел да заблуди или да се осигури икономическа или политическа изгода и което може да причини обществена вреда”. \n \n Инструментът дава и вероятност (увереността на използвания алгоритъм за машинно обучение), с която може да се твърди, че въведеният текст съдържа невярна информация, дезинформация или представлява автоматично генериран текст (с модела GPT-2 или ChatGPT). \n \n Моля, имайте предвид следните предупреждения: \n \n 1.Този инструмент е от равнище на технологична готовност 4 (прототип, тестван в лабораторна среда). Като такъв, той не е изпитан в реална среда и не можете да го използвате в такава. \n \n 2.С цел спазване на законите на България и Европейския съюз, включително тези за правата на човека, уронване на доброто име и клевета, моля, обърнете внимание на следното: \n \n - Инструментът използва методите на изкуствения интелект, и по-специално машинното обучение. Поради тази причина: \n \n - Анализът, извършен от уеб инструмента върху анализираните текстове, **може да покаже само потенциалното наличие** на невярна информация, дезинформация или на автоматично генерирани текстове. Настоящата версия на инструмента (1.1) засича текстове, автоматично генерирани с моделите GPT-2 и ChatGPT. \n \n - **Това указание следва да се приема с по-ниска степен на доверие** (“известна вероятност”, но не и “сигурност”). \n \n - **Не следва да се предприемат правни действия срещу авторите**, чиито текстове са идентифицирани от инструмента като съдържащи невярна информация, умишлена дезинформация или представляващи автоматично генерирани текстове, единствено въз основа на резултатите от този инструмент. \n \n - **Използваните методи и резултати не са подходящи за използване за целите на правителствени или публични органи**, включително за разследвания, разузнавателна дейност, наказателно разследване, съдебни или административни производства. \n \n - **Прогнозите за потенциална фалшивост/невярност/дезинформация** на текстове, които онлайн инструментът предоставя, **не са вярвания/твърдения на авторите, изследователите или участниците в проекта**. \n \n - Спонсорите (Европейската комисия и проект AI4media), изследователите, участващи в Проекта, потребителите или субектите на Проекта **не носят отговорност и не са обвързани по какъвто и да е било начин с каквито и да било щети** (включително имуществени или морални), произтичащи от или във връзка с анализа на уеб инструмента, използвания метод и/или постигнатите резултати/изводи. \n \n - Моля, имайте предвид, че създателите на този инструмент не използват бисквитки (cookies) и не запазват и не обработват IP адреса Ви. Обаче, платформата Hugging Face, на която е качен инструмента използва бисквитки и обработва IP адреса Ви и други данни свързани с използването на самата платформа за техни цели. Можете да се запознаете с тяхна политика за поверителност (на английски език - https://huggingface.co/privacy). Също така инструментът не запазва текстовете, които сте въвели в него. \n \n Като натискам бутона “Запознах се”, декларирам, че съм запознат/а с условията за ползване и обещавам да ги спазвам.",
    "en": "Please read the whole text. You will be given access to the tool only when you agree with the usage conditions below: \n \n What does this tool do: \n \n The tool uses the findings of the TRACES project (https://traces.gate-ai.eu/), which has indirectly received funding from the European Union’s Horizon 2020 research and innovation action programme, via the AI4Media Open Call #1 issued and executed under the AI4Media project (Grant Agreement no. 951911). \n \n The purpose of this prototype tool is to provide an indication of whether a given text in Bulgarian potentially contains untrue information, intentional disinformation and whether it has been automatically generated (with the aim to recognize textual \"deepfakes\"). Social media texts (up to 250 characters) were used to develop the prototype. \n \n The meaning of \"disinformation\" is taken from *European Commission's Communication to the European Parliament, the Council, the European Economic and Social Committee, and the Committee of the Regions* on the European Democracy Action Plan (https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=COM:2020:790:FIN), and it designs \"false or misleading content that is spread with an intention to deceive or secure economic or political gain and which may cause public harm\". \n \n The tool outputs a probability (the confidence of the machine learning algorithm) with which it could be claimed that an input text contains untrue information, disinformation or that it is an automatically generated text (by a GPT-2 or ChatGPT model). \n \n Please note the following warnings: \n \n 1.This tool is at Technology Readiness Level 4 - Technology validated in lab. It has not been tested in a real environment and thus it should not be used in such. \n \n 2.In order to comply with Bulgarian and European Union laws, including those on human rights, damage to the reputation, and defamation, please note that: \n \n - The tool uses Machine Learning (Artificial Intelligence) methods. Because of this reason: \n \n - The analysis run by the web tool on the analyzed texts **shows only the potential presence** of untrue information, disinformation or of automatically generated texts. The current version of the tool (1.1) detects Bulgarian texts, generated with the GPT-2 and ChatGPT models. \n \n - **This indication should be taken with a lower degree of confidence** (certain likelihood, but not certainty). \n \n - **No legal action should be taken against the authors of texts**, whose texts are identified by the tool as potentially containing untrue information, intentional disinformation or as potentially representing automatically generated texts, solely based on the results of this tool. \n \n - **The methods used and the results obtained are not suitable to be used for governmental or public authority purposes**, including for investigations, intelligence work, criminal investigation, court or administrative proceedings. \n \n - **The predictions for potential fakeness/wrongness/disinformation of the texts**, which the online tool provides **are not statements/beliefs/affirmations of the Project's authors, researchers or participants**. \n \n - The Project Sponsors (European Commission and the AI4Media project), Researchers, users or subjects **shall not be liable or otherwise responsible for any damages** (including pecuniary or moral damages) arising out or in relation to the web tool analysis, the method used and/or the results/outcomes. \n \n - Please note that the creators of this tool are not using cookies, nor anyhow storing and processing your IP address or your data. However, the hosting website (Hugging Face) uses cookies and processing your IP address for their internal purposes. You can consult their Privacy Policy before using this tool (https://huggingface.co/privacy). We are also not storing the texts, which you input into the tool. \n \n By clicking on the button “I agree”, I declare that I have read the Terms of Use and I promise to abide by them."
  },
    "text_placeholder": {
    "bg": "Това е примерно изречение.",
    "en": "Това е примерно изречение."
  },
  "textbox_title": {
    "bg": "Въведете текст за анализ",
    "en": "Enter text to analyze"
  },
  "analyze_button": {
    "bg": "Анализирай текста",
    "en": "Analyze text"
  },
  "full_result_title": {
    "bg": "Покажи пълен резултат",
    "en": "Show full result"
  },
  "bert_human": {
    "bg": "Според анализа този текст е написан от човек с вероятност: ",
    "en": "Our tool has determined that the input text was generated by a human with "
  },
  "bert_human_prob": {
    "bg": " %. Препоръчително е да проверите внимателно твърденията в него, преди да им се доверите.",
    "en": "% probability. However, we recommend that you carefully verify its claims."
  },
  "bert_gpt": {
    "bg": "Според анализа този текст е автоматично генериран от модела GPT-2 или ChatGPT с вероятност: ",
    "en": "Our tool has determined that this text was automatically generated by the language model GPT-2 or ChatGPT with "
  },
  "bert_gpt_prob": {
    "bg": " %. Имайте предвид, че този резултат е базиран на методите на изкуствения интелект и може да бъде грешен. За момента не можем да проверим, дали е верен. Внимателно проверете твърденията в него!",
    "en": "% probability. Note, that this is an AI-based tool and it can make mistakes. Read and check carefully its claims!"
  },
  "untrue_getect_no": {
    "bg": "Според анализа този текст не съдържа невярна информация с вероятност: ",
    "en": "Our tool has determined that the input does not contain untrue information with "
  },
  "untrue_no_proba": {
    "bg": " %.",
    "en": "% probability."
  },
  "untrue_getect_yes": {
    "bg": "Според анализа този текст съдържа невярна информация с вероятност: ",
    "en": "Our tool has determined that this text contains untrue information with "
  },
  "untrue_yes_proba": {
    "bg": " %.",
    "en": "% probability."
  },
  "bert_yes_1": {
    "bg": "Според анализа, този текст съдържа дезинформация с вероятност: ",
    "en": "According to the analysis, this text contains disinformation with "
  },
  "bert_yes_2": {
    "bg": " %. Имайте предвид, че това са резултати от машинно обучение, и както е написано в условията за ползване, не можете да се доверите напълно на този резултат.",
    "en": " % probability. Keep in mind that these are machine learning results, and as it is written in the Terms of Use, you cannot fully trust this result."
  },
  "bert_no_1": {
    "bg": "Според анализа, този текст не съдържа дезинформация с вероятност: ",
    "en": "According to the analysis, this text does not contain disinformation with "
  },
  "bert_no_2": {
    "bg": " %. Въпреки това е препоръчително да проверите внимателно твърденията в него, преди да им се доверите.",
    "en": " % probability. However, it is advisable to carefully check the claims before you trust them."
  },
   "emotions_label_1": {
    "bg": "Според анализа, емоцията на текста е ",
    "en": "According to the analysis, the emotion of the text is  "
  },
  "emotions_label_2": {
    "bg": ", а вероятността е: ",
    "en": " and the probability is: "
  },
    "emotions_label_3": {
    "bg": " %.",
    "en": " %."
  },
    "emotions_label_4": {
    "bg": "\n Имайте предвид, че резултатът може да е неправилен, ако вероятността е под 97%.",
    "en": "\n Note that the result may be incorrect if the probability is below 97%."
  },
   "emotions_label_5": {
    "bg": "\n Моля имайте предвид, че моделът е в процес на разработка и въпреки високата вероятност може да допуска грешки!",
    "en": "\n Please note that the model is a work in progress and despite the high probability it may make mistakes!"
  },
  "disinformation_definition": {
    "bg": "Дезинформация наричаме целенасочено разпространявана невярна информация.",
    "en": "Disinformation is false information deliberately spread to deceive people."
  },
    "tab_tool": {
    "bg": "Инструмент",
    "en": "Tool"
  },
    "tab_terms": {
    "bg": "Условия за ползване",
    "en": "Terms and conditions"
  }
}