Farei jailbreak de modelo de IA, testes de injeção de prompt e análise de segurança de LLM

N
neonxploit
N
neonxploit
Manjeet
Algumas informações foram traduzidas automaticamente.

Sobre este Serviço

Tradução automática

Vou realizar uma avaliação completa de segurança de modelos de IA, incluindo testes de jailbreak, análise de injeção de prompt, tentativas de bypass de filtros de segurança e detecção de vulnerabilidades para LLMs e chatbots.

Sou especialista em identificar fraquezas em sistemas de IA e em expor como atacantes podem manipular seu modelo para gerar respostas inseguras, prejudiciais, tendenciosas ou não autorizadas.


O QUE EU VOU TESTAR

1. Ataques de Jailbreak

  • Jailbreak estilo DAN
  • Sobrescrita de prompt do sistema
  • Ataques de troca de personalidade
  • Fuga de papel e ativação forçada do modo interno

2. Ataques de Injeção de Prompt

  • Manipulação direta de prompt
  • Injeção indireta de prompt (instruções ocultas)
  • Injeção de prompt HTML/Markdown
  • Ataques de envenenamento de contexto

3. Bypass do Filtro de Segurança

  • Contornar barreiras de segurança
  • Fazer o modelo gerar conteúdo restrito
  • Contornar limites éticos
  • Conflitos de política ocultos

4. Ataques adversariais de múltiplas etapas

  • Manipulação de cadeia de pensamento
  • Ataques contextuais em várias camadas
  • Brechas recursivas de instruções

5. Testes de alucinação e viés

  • Condições que acionam alucinação
  • Verificações de amplificação de viés
  • Respostas contraditórias
  • Armadilhas de raciocínio incorreto

Conheça mais sobre Manjeet

Manjeet
  • A partir deÍndia
  • Membro desdeabr. de 2025
  • Responde em aprox.:4 dias
  • Idiomas

    Inglês
I am an AI Safety Tester and Cybersecurity Researcher with expertise in identifying vulnerabilities in AI models, LLMs, and web systems. I specialize in: AI jailbreak detection Prompt injection testing LLM safety evaluation Security auditing for chatbots Penetration testing basics Python-based security automation I have submitted 36+ AI vulnerability reports and received 20+ acknowledgments from OpenAI for ethical research. If you need someone to test your AI model, secure your chatbot, or evaluate your system for vulnerabilities — I can help with professional reporting and fast

Tradução automática