https://blog.wongcw.com/2020/05/27/%e8%b0%b7%e6%ad%8c%e6%8f%90%e5%87%ba%e5%8f%af%e9%87%8f%e5%8c%96%e8%a9%95%e4%bc%b0nlg%e6%a8%a1%e5%9e%8b%e6%80%a7%e8%83%bd%e7%9a%84bleurt%e6%8c%87%e6%a8%99/
谷歌提出可量化評估NLG模型性能的BLEURT指標