Evaluating Large Language Models: Principles, Approaches, and Applications (Avaliação de modelos de linguagem grandes: princípios, abordagens e aplicações)
Este artigo (do tutorial do Neurips 2024) oferece uma visão geral abrangente dos desafios e métodos para avaliar modelos de linguagem grandes (LLMs).