Threat Intelligence
Revisão de Ameaças a IA do 3º Trimestre de 2025: A Ascensão do Ataque Híbrido
O terceiro trimestre de 2025 foi caracterizado pela ascensão do 'ataque híbrido' contra LLMs, onde os adversários estão cada vez mais combinando múltiplas técnicas em uma única campanha para aumentar suas taxas de sucesso. A tendência mostra um afastamento de ataques monolíticos simples em direção a estratégias de jailbreak multicamadas, que são mais difíceis de detectar e mitigar. Esta sofisticação crescente representa um desafio significativo para as arquiteturas de defesa que dependem de uma única camada de proteção.
Uma pesquisa notável do período detalhou o método GRAF (Global Refinement and Active Fabrication), um ataque multi-turno que se adapta dinamicamente às respostas do modelo alvo. A técnica não apenas refina o caminho do ataque a cada passo, mas também edita ativamente o histórico da conversa para remover recusas de segurança anteriores, impedindo que o modelo reforce seu próprio alinhamento. Isso demonstra uma mudança para ataques que não apenas exploram o estado do modelo, mas o manipulam ativamente ao longo do tempo.
Ataques multimodais também ganharam destaque. O 'FC-Attack' (Flowchart Attack) demonstrou como um fluxograma visual com informações parciais pode induzir um MLLM a preencher os detalhes maliciosos que faltam, explorando a tendência do modelo de ser útil na interpretação de diagramas. Da mesma forma, o 'SI-Attack' (Shuffle Inconsistency) explorou a fraqueza das defesas multimodais em detectar a intenção maliciosa quando as palavras em um prompt e os patches em uma imagem são embaralhados.
Em resposta, a comunidade de defesa começou a focar em defesas mais robustas e de múltiplos estágios. Artigos sobre 'SemanticSmooth', que usa paráfrases para criar perturbações semânticas, e 'Backtranslation', que infere a intenção original do prompt a partir da resposta, mostraram promessa contra ataques ofuscados. O trimestre deixou claro que a segurança de IA eficaz exige uma defesa em profundidade, capaz de compreender o contexto, a intenção e a história de uma interação, em vez de apenas analisar um único prompt isoladamente.