A Microsoft está a reforçar o lado mais “académico” do Copilot: o assistente de pesquisa Researcher, integrado no Microsoft 365 Copilot, passa a conseguir trabalhar com mais do que um modelo de IA no mesmo fluxo. A novidade chama-se Critique e combina respostas geradas por GPT, que depois são revistas e refinadas por Claude, num processo pensado para elevar a qualidade final em precisão factual, amplitude de análise e apresentação.

O anúncio surge num contexto em que as ferramentas de “deep research” se tornaram um campo de batalha entre empresas de IA e plataformas de produtividade. A diferença aqui é a forma como a Microsoft está a tentar resolver um problema real: quando pedes uma pesquisa complexa, com vários passos, um único modelo pode ser rápido, mas nem sempre é consistente na verificação, na estrutura e na neutralidade.
Neste artigo vão encontrar:
O que mudou no Researcher do Microsoft 365 Copilot
Ao contrário do Copilot “normal”, o Researcher foi desenhado para tarefas mais longas e com múltiplas etapas, típicas de investigação e trabalho profissional: compilar informação, organizar argumentos, comparar fontes e apresentar um resultado final que faça sentido como relatório.
Com o Critique, o Researcher passa a seguir uma arquitectura em duas fases: primeiro, obtém respostas via GPT; depois, Claude entra como camada de revisão e melhoria. A Microsoft descreve este método como um “ciclo de feedback” semelhante ao que acontece em contextos académicos e profissionais, onde uma primeira versão é criticada e iterada até ficar mais sólida.
Na prática, isto deve traduzir-se em menos contradições internas, melhor estrutura do texto e, idealmente, menos erros factuais. Não é uma promessa de infalibilidade, mas é uma abordagem interessante: em vez de pedir ao mesmo modelo para “se corrigir”, a Microsoft coloca um segundo modelo a fazer o papel de revisor, o que pode reduzir pontos cegos e vícios do primeiro.

Porque é que usar dois modelos pode fazer diferença
Quando falamos de pesquisa assistida por IA, há três fragilidades recorrentes: alucinações (informação inventada), conclusões apressadas (análise curta ou pouco fundamentada) e apresentação fraca (texto confuso, sem hierarquia ou sem separar factos de interpretação). Um sistema “em cadeia”, com um modelo a produzir e outro a criticar, tenta atacar estas três áreas de uma só vez.
Também há um ganho menos óbvio: diversidade de perspectivas. Mesmo quando dois modelos são competentes, tendem a ter estilos e prioridades diferentes. Se um é mais directo e abrangente, o outro pode ser mais cauteloso e mais rigoroso na forma como formula afirmações. Para ti, enquanto utilizador, o resultado pode ser um relatório mais equilibrado e mais fácil de validar.
Comparações e métricas: o que a Microsoft diz ter melhorado
Segundo o site Engadget, a Microsoft afirma que esta actualização obtém uma pontuação “um pouco mais alta” do que os modelos mais recentes do Perplexity Deep Research no benchmark Deep Research Accuracy, Completeness e Objectivity. A empresa não partilhou números concretos no texto citado, mas a referência é relevante porque aponta para o tipo de métricas que a Microsoft quer optimizar: exactidão, completude e objectividade, em vez de apenas fluidez.
É um detalhe importante para quem usa estas ferramentas para trabalho sério. Um relatório bonito mas incompleto, ou com conclusões enviesadas, pode custar tempo e credibilidade. Ao colocar a objectividade como critério, a Microsoft está a reconhecer uma das críticas mais comuns às IAs generativas em contexto de pesquisa.
Model Council: duas respostas lado a lado, com acordo e desacordo
Além do Critique, a Microsoft introduziu outra opção para quem prefere mais autonomia na avaliação do resultado: o Model Council. Aqui, o Researcher apresenta respostas lado a lado de Anthropic e OpenAI e, no fim, entrega um relatório que mostra onde os modelos concordam e onde discordam.

Este formato tem um valor prático claro: em vez de receberes uma resposta “final” e confiares que está correcta, consegues ver divergências e perceber rapidamente quais os pontos que exigem validação adicional. Para tarefas como análise de mercado, comparação de políticas, síntese de literatura ou até preparação de documentação interna, é um método que pode reduzir a probabilidade de assumires como certo algo que afinal é controverso ou mal suportado.
Ao mesmo tempo, convém notar que duas IAs a discordar não significa automaticamente que uma esteja certa e outra errada. Muitas vezes, a divergência nasce de interpretações diferentes, de lacunas no contexto do pedido ou de limitações no acesso a informação actualizada. Ainda assim, como ferramenta de trabalho, a transparência do desacordo pode ser mais útil do que uma resposta única e demasiado confiante.
Disponibilidade: já podes experimentar, mas com acesso antecipado
As duas funcionalidades, Critique e Model Council, estão disponíveis no programa Frontier do Microsoft 365 Copilot, que funciona como um espaço de acesso antecipado às inovações de IA da empresa. Ou seja, não é uma disponibilização geral para todos os utilizadores já hoje, mas sim uma fase controlada, típica quando a Microsoft quer recolher feedback e ajustar comportamento antes de alargar a escala.
Para ti, isto significa que a experiência pode variar: funcionalidades em Frontier tendem a mudar rapidamente, e nem sempre chegam ao público exactamente com o mesmo comportamento com que estrearam. Ainda assim, o sinal é claro: a Microsoft quer que o Copilot seja visto não apenas como um assistente de escrita, mas como uma ferramenta de investigação com processos mais próximos de uma equipa de trabalho.
O que isto diz sobre o futuro da pesquisa com IA
Há uma tendência a consolidar: em vez de apostar tudo num único “modelo milagroso”, as plataformas estão a construir sistemas compostos, com múltiplos agentes e camadas de validação. A própria Anthropic já tem uma funcionalidade de Research que pode usar vários agentes Claude para responder a pedidos complexos, o que mostra que o caminho do “multi-agente” e “multi-modelo” está a ganhar tracção.
Se a Microsoft conseguir manter este processo rápido e previsível, o Researcher pode tornar-se mais útil para quem precisa de resultados consistentes e auditáveis, mesmo que isso implique um pouco mais de tempo de processamento. No fim, é esse o trade-off que faz sentido em pesquisa: menos pressa, mais rigor.
O passo seguinte, e aqui sem especulação excessiva, é perceber como estas melhorias vão impactar o dia-a-dia no Microsoft 365: relatórios mais fiáveis no Word, sínteses mais sólidas para apresentações, ou até apoio mais estruturado a decisões em contexto empresarial. Para já, a mensagem é simples: o Researcher está a tornar-se mais “crítico” e isso, em investigação, costuma ser uma boa notícia.
Leiam as últimas notícias do mundo da tecnologia no Google News , Facebook e X (ex Twitter) .
Todos os dias vos trazemos dezenas de notícias sobre o mundo Android em Português. Sigam-nos no Google Notícias. Cliquem aqui e depois em Seguir. Obrigado! |



