🤖 AI Dev Tools

ある開発者、AIの過酷な記憶ベンチマークで「うっかり」92%を叩き出す

AIエージェントの記憶力は、ステロイドを打った金魚のよう。ある開発者のハックな知識グラフが、最も過酷な記憶ベンチマークで92%を叩き出し、ベクトルストアの絶対王者に「嘘つけ!」と一喝だ。

AIエージェントのための時系列知識グラフを示すMementoアーキテクチャ図

⚡ Key Takeaways

  • Memento、時系列知識グラフでLongMemEvalを92%で粉砕、ベクトルストアに勝利。 𝕏
  • 主要な欠陥を修正:エンティティ解決、矛盾、二重時間追跡。 𝕏
  • 実用的なSQLiteビルドは、AIエージェントにおけるベクトル至上主義からグラフ現実への移行を示唆。 𝕏
Sarah Chen
Written by

Sarah Chen

AI research editor covering LLMs, benchmarks, and the race between frontier labs. Previously at MIT CSAIL.

Worth sharing?

Get the best Developer Tools stories of the week in your inbox — no noise, no spam.

Originally reported by dev.to

Stay in the loop

The week's most important stories from Dev Digest, delivered once a week.