Avaliação da capacidade de modelos de linguagem em caracterizar feedback relacional: análise comparativa de estratégias de prompt

Pesquisa mostra que o GPT-4o alcança acurácia >0,8 em 9 de 10 características de #feedbackrelacional e F1 >0,7 em 6. Zero-shot, one-shot e few-shot performam de forma similar. Definir bem as características no prompt supera exemplos. https://www.sciencedirect.com/science/article/pii/S2666920X25000670?dgcid=rss_sd_all