Database | grantmaking.ai

Showing 1901-1950 of 3952 results

MTCP: Post Correction Persistence by Benchmark for Frontier LLMs

Team?

ProjectFundraisingManifund

181,448 evaluations proving no production AI model reliably maintains corrections. Expanding coverage and pursuing multi pass validation.

Led by

Page 39 of 80

Showing 1901-1950 of 3952 results

Active filters: Type: Individual, Project

Loading results...