BLEU
Aspetto
BLEU (Bilingual Evaluation Understudy, in italiano Valutazione bilingue) è un algoritmo di valutazione della qualità del testo che viene tradotto da una macchina da una lingua naturale ad un'altra. La qualità è considerata con la corrispondenza tra quanto prodotto dalla "macchina" e quello che comunicherebbe un essere umano: quanto il prodotto della macchina è più vicino a una traduzione umana professionale[1]. BLEU è stata una delle prime metriche a dichiarare una grande correlazione con i giudizi umani di qualità[2] e rimane una delle metriche più famose e poco costose.
Note
[modifica | modifica wikitesto]- ^ https://aclweb.org/anthology/N12-1017
- ^ Papineni, K., et al. (2002)