Desempenho de grandes modelos de linguagem em questões de múltipla escolha: comparação entre ChatGPT, Gemini e Copilot

Imagem ultrarrealista de uma sala de aula universitária informal. Adultos jovens (idade universitária) usando camisetas leves, sentados em mesas e com laptops abertos. Um pequeno grupo discute uma questão de múltipla escolha exibida na tela de um computador. Ambiente escolar descontraído, paredes com quadros brancos e post-its, luz natural suave vindo de janelas grandes. Pessoas diversas etnicamente, expressões concentradas, postura colaborativa. Estilo fotográfico: alta resolução, profundidade de campo rasa, luz natural, cores realistas, composição dinâmica, lente 35mm, ar profissional e contemporâneo. Sem logotipos visíveis. Foco em tecnologia e interação humana.

O estudo compara ChatGPT, Gemini e Copilot em 100 questões de múltipla escolha de um curso de ensino superior em Inteligência de Negócios e Análise de Dados. O achado principal é claro: os modelos acertam mais em #HabilidadesDeBaixaOrdem (LOTS) do que em #HabilidadesDeAltaOrdem (HOTS). 🔎 📊

Outras descobertas mostram que a #EngenhariaDePrompts, especialmente o método FS-CD, melhora o desempenho em tarefas complexas. O ganho é mais forte em itens do nível “Aplicar” e varia conforme o modelo. Para diretores, a lição é orientar o uso crítico da #InteligênciaArtificial na escola e capacitar equipes e professores. 🧭 👩‍🏫 👨‍🏫

https://www.sciencedirect.com/science/article/pii/S2666920X25001158?dgcid=rss_sd_all

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Posts Recentes