Quão bem LLMs podem avaliar redações em árabe?

Ultra-realista, adolescentes árabes em uma escola informal sentados à mesa escrevendo redações em papéis e usando laptops, vestindo camisas t-shirt leves, ambiente descontraído de sala de aula, luz natural suave

A pesquisa avaliou a eficácia de grandes modelos de linguagem como ChatGPT, Llama, Aya, Jais e ACEGPT na avaliação automática de redações em árabe usando um conjunto de dados real de estudantes. 📌 ACEGPT se destacou entre esses modelos, atingindo um Quadratic Weighted Kappa de 0,67, mas um modelo menor baseado em BERT superou todos com QWK de 0,88.

👉 Entre as demais descobertas estão as dificuldades com tokenização do árabe e a alta demanda computacional para processar os textos. A variação de desempenho em diferentes disciplinas reforça a necessidade de modelos adaptativos. E a engenharia de prompt eficiente provou melhorar muito os resultados. #InteligenciaArtificial #AvaliaçãoAutomática #InovaçãoNaEscola

Leia o artigo completo

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts Recentes