Tag
Notícias sobre "Bypass de Filtros"
Ataques de Manipulação de Atenção em Transformers
Técnicas de Ataque
Uma técnica de ataque que explora como o mecanismo de 'atenção' dos LLMs funciona para fazer o modelo focar em informações maliciosas e ignorar as diretrizes de segurança.
21 de Dezembro, 2025
Ataques de Colisão de Tokenização: Enganando a Percepção do LLM
Técnicas de Ataque
Uma técnica de ataque onde um atacante cria uma string de texto que é interpretada de maneira diferente pelo tokenizador do LLM e por um humano.
09 de Dezembro, 2025