סטארט-אפ ישראלי מאפשר למודלי בינה מלאכותית לדרג זה את זה באופן אוטונומי
סטארט-אפ ישראלי בתחום הבינה המלאכותית, Caura.ai, משיק את PeerRank, מסגרת חדשה שבה מודלי AI מדרגים זה את זה באופן אוטונומי, תוך עקיפת הערכה עצמית וזיהוי.
ירושלים, 5 בפברואר 2026 (TPS-IL) – הסטארט-אפ הישראלי Caura.ai חשף את PeerRank, מסגרת אוטונומית חדשה שבה מודלי בינה מלאכותית מעריכים זה את זה ללא פיקוח אנושי. המערכת מייצרת משימות, עונה עליהן באמצעות גישה לאינטרנט בזמן אמת, ומפיקה דירוגים מודעי-הטיה.
PeerRank נבדק על פני 12 מודלי AI מסחריים, כולל GPT-5.2 ו-Claude Opus 4.5, ויצר למעלה מ-253,000 שיפוטים של עמית לעמית. מחקרים מראים שהערכת עמיתים עולה על הערכה עצמית, ומזהה באופן אמין דיוק תוך חשיפת הטיות שיטתיות בשיפוט AI. Claude Opus 4.5 הוביל במעט את הדירוג בהערכה עיוורת.
Caura.ai פיתחה את המסגרת בשיתוף עם אוניברסיטת בן-גוריון בנגב, במטרה לשפר את השקיפות וההערכה בעולם האמיתי של ביצועי AI.