🤖 AI Dev Tools

Bir Geliştirici, Yapay Zekanın Acımasız Hafıza Benchmark'ında Nasıl %92 Başarıya İmza Attı

Yapay zeka ajanları steroidli balık hafızası gibi unutuyor. Bir geliştiricinin 'hacky' bilgi grafiği, en zorlu hafıza benchmark'ında %92 puan alarak vektör deposu imparatoruna 'yalan söylüyorsun' dedi.

Yapay zeka ajanları için zamansal bilgi grafiğini gösteren Memento mimari diyagramı

⚡ Key Takeaways

  • Memento, vektör depoları yerine zamansal bilgi grafikleriyle LongMemEval'i %92 ile ezdi geçti. 𝕏
  • Temel kusurları gideriyor: varlık çözünürlüğü, çelişkiler, ikili zamansal izleme. 𝕏
  • Pragmatik SQLite yapısı, yapay zeka ajanları için vektör coşkusundan grafik gerçekliğine geçişi işaret ediyor. 𝕏
Sarah Chen
Written by

Sarah Chen

AI research editor covering LLMs, benchmarks, and the race between frontier labs. Previously at MIT CSAIL.

Worth sharing?

Get the best Developer Tools stories of the week in your inbox — no noise, no spam.

Originally reported by dev.to

Stay in the loop

The week's most important stories from Dev Digest, delivered once a week.