Tag

Notícias sobre "Bypass de Filtros"

Uma técnica de ataque que explora como o mecanismo de 'atenção' dos LLMs funciona para fazer o modelo focar em informações maliciosas e ignorar as diretrizes de segurança.

Uma técnica de ataque onde um atacante cria uma string de texto que é interpretada de maneira diferente pelo tokenizador do LLM e por um humano.