10 LLM'ye Sahte Sistem Komutları Yedirdim — Üçü Sırlarını Döktü
Sohbete beş satır XML yapıştırdım. Yedi LLM omuz silkti. Üçü? JSON olarak içini dışına çıkardı. Prompt enjeksiyonu teori değil — gerçek ve tam bir çılgınlık.
⚡ Key Takeaways
- Basit XML prompt enjeksiyonu 10 LLM'den 3'ünü kandırdı, ayrıştırılabilir JSON'la sırları sızdırdı. 𝕏
- Savunmasız modeller saldırganın istediği şemaları tamamlamak için hatta veri halüsinasyonu yaptı. 𝕏
- Girdi temizliği gibi düzeltmeler bugün mevcut — Parapet gibi koruma mekanizmaları bunu gereksiz kılıyor. 𝕏
Worth sharing?
Get the best Developer Tools stories of the week in your inbox — no noise, no spam.
Originally reported by dev.to