BLEU (Bilingual Evaluation Understudy), 其意思是双语评估替补。该指标首次提出是用于对机器翻译结果的评估,但是后来越来越多地用于对各种自然语言处理任务的评估。在某些任务中,虽然bleu值不是一个很完美的评估指标,但是由于其计算简单且快速,不需要人工评估,所以对于这些任务还是能够提供一定指导意义的。本文只介绍bleu定义及nltk的使用。
BLEU (Bilingual Evaluation Understudy), 其意思是双语评估替补。该指标首次提出是用于对机器翻译结果的评估,但是后来越来越多地用于对各种自然语言处理任务的评估。在某些任务中,虽然bleu值不是一个很完美的评估指标,但是由于其计算简单且快速,不需要人工评估,所以对于这些任务还是能够提供一定指导意义的。本文只介绍bleu定义及nltk的使用。