Skip to content
Nota de Pesquisa: Explorando o Lançamento GPT-4.5 da OpenAI

Nota de Pesquisa: Explorando o Lançamento GPT-4.5 da OpenAI

Updated on

Uma nota de pesquisa explorando o lançamento GPT-4.5 da OpenAI, codinome Orion, abordando especificações técnicas, desempenho em benchmarks, comparações e muito mais.

Introdução

A OpenAI, líder em pesquisa e implementação de inteligência artificial, lançou o GPT-4.5 em fevereiro de 2025, com o codinome Orion, como parte de seus esforços contínuos para aprimorar modelos de linguagem de grande escala (LLMs). Este lançamento, anunciado em 27 de fevereiro de 2025, é apresentado como o modelo mais amplo e de maior conhecimento até o momento, com o objetivo de melhorar a interação com os usuários e reduzir imprecisões. Esta nota de pesquisa explora as especificações técnicas, desempenho em benchmarks e comparações com modelos anteriores e concorrentes, trazendo um panorama abrangente para entusiastas tecnológicos e profissionais.

Contexto e Antecedentes do Lançamento

O lançamento do GPT-4.5 ocorre em um momento de rápido avanço na IA, com concorrentes como Anthropic e DeepSeek impulsionando novas fronteiras em raciocínio e eficiência. O anúncio da OpenAI, divulgado inicialmente por diversos veículos de notícias tecnológicas como TechCrunch (opens in a new tab) e WIRED (opens in a new tab), destacou sua disponibilidade como uma prévia de pesquisa para assinantes do ChatGPT Pro por uma taxa mensal de US$200, com planos de expandir para outras categorias pagas posteriormente. Essa estratégia reflete o objetivo da OpenAI em coletar feedback de usuários antes de uma implantação mais ampla, conforme destacado em postagem no X por josuenunez_ai (opens in a new tab).

Especificações Técnicas

O GPT-4.5 é descrito como o maior modelo da OpenAI até agora, embora detalhes específicos como número de parâmetros e tamanho do conjunto de dados para treinamento não sejam divulgados publicamente, mantendo a prática da OpenAI de proteger informações proprietárias, como visto em lançamentos anteriores, como o GPT-4 (Wikipedia (opens in a new tab)). Aspectos técnicos principais incluem:

  • Janela de Contexto: Atualização relevante para 128.000 tokens, mencionada em uma postagem no X por josuenunez_ai (opens in a new tab), permitindo o gerenciamento de conversas e documentos muito mais extensos, muito acima das capacidades do GPT-4.
  • Eficiência Computacional: Relatos indicam uma melhoria superior a 10x sobre o GPT-4, conforme publicação no X por Iamtoxix (opens in a new tab), tornando-o mais eficiente em termos de recursos, apesar do seu tamanho.
  • Modelo Não-Fronteira: A OpenAI esclareceu que o GPT-4.5 não é um modelo de fronteira, não avançando as potencialidades e riscos associados à fronteira tecnológica da IA, como mencionado pela TechCrunch (opens in a new tab).

Essa ausência de divulgação técnica detalhada é habitual, embora gere especulações, como publicações anteriores do X como daniel_nguyenx (opens in a new tab) de 2023 mencionem capacidades multi-modais, ainda especulativas e não confirmadas para o lançamento de 2025.

Desempenho em Benchmarks

Resultados de benchmarks oferecem insights sobre as capacidades do GPT-4.5:

  • Precisão e Alucinação no SimpleQA: O GPT-4.5 apresenta uma taxa de alucinação de 37,1%, comparado aos 59,8% do GPT-4o e 80,3% do o3-mini, conforme relatado pela MIT Technology Review (opens in a new tab). Isso demonstra maior precisão factual, algo crucial para confiabilidade.
  • Matemática e Ciência: Apresenta melhorias de 27,4% em matemática e 17,8% em ciência sobre GPT-4o, de acordo com a Vellum (opens in a new tab), tornando-o mais confiável em tarefas de raciocínio factual.
  • Codificação e Tarefas Multilíngues: No SWE-Lancer Diamond, ultrapassa o o3-mini (32,6% vs. 23,3%), sugerindo bom desempenho em codificação ágil, conforme a mesma publicação da Vellum (opens in a new tab). O desempenho multilíngue apresenta ganho moderado de 3,6%.
  • Preferência Humana: Testadores humanos expressaram preferência pelo GPT-4.5 em tarefas cotidianas, profissionais e criativas, incluindo poesia e arte ASCII, segundo a ZDNET (opens in a new tab), indicando força em conversação.

Entretanto, mostra limitações em tarefas especializadas de raciocínio se comparado com o o3-mini, especialmente em benchmarks técnicos, conforme reportado na WIRED (opens in a new tab).

Comparações com Modelos Anteriores

Considerando modelos passados da OpenAI:

  • GPT-4: GPT-4.5 oferece conhecimento de mundo e inteligência emocional superiores, janela de contexto maior (128k vs. até 32k do GPT-4), e reduz alucinações, conforme observado na TechTarget (opens in a new tab).
  • GPT-4o: Embora o GPT-4o seja multimodal, GPT-4.5 parece ter prioridade em interações baseadas em texto mais aprofundadas. Benchmarks destacam melhor desempenho do GPT-4.5 em ciências e matemática (Vellum (opens in a new tab)).
  • Modelos de Raciocínio (o1, o3-mini): Esses modelos especializados superam o GPT-4.5 em algumas áreas técnicas, embora o GPT-4.5 seja mais versátil em aplicações gerais.

Comparações com Concorrentes

Analisando modelos concorrentes, como Claude da Anthropic e Gemini do Google, GPT-4.5 mostra ser competitivo especialmente em interações textuais longas, embora análises comparativas detalhadas sejam escassas em benchmarks técnicos específicos.

Preços e Acessibilidade

Destaca-se o elevado custo da API do GPT-4.5, gerando dúvidas quanto à eficácia de custos para desenvolvedores.

Conclusão

GPT-4.5 é uma robusta adição à OpenAI, fortalecendo o conhecimento amplo, interações conversacionais e eficiência computacional. Entretanto, os altos custos podem limitar sua adoção.

Referências Principais

📚