Claude Code Outcomes: איך לכתוב רשימת דרישות שגורמת לסוכן לדרג את עצמו

הסוכן שלי פרסם מאמר עם עובדה לא מדויקת. ב-3 בלילה. ל-18,000 מנויים.

מאז אותו לילה, שום סוכן AI בעסק שלי לא מפרסם כלום בלי שסוכן אחר בודק אותו קודם. לא בן אדם. סוכן. עם רשימת דרישות ברורה שהוא חייב לעבור לפני שהפלט יוצא לעולם.

המנגנון הזה נקרא Outcomes. הוא שינה את הדרך שבה אני מפעיל אוטומציות ב-Claude Code. ואני רוצה להראות לך איך לבנות אותו גם בעסק שלך.

עסק שרץ לבד צריך מדדים ברורים

פעם שאלו אותי: "איך בונים עסק שעובד בלעדיך?"

התשובה שלי: צעד צעד. בנה KPI לכל מחלקה. מכירות? מתוך 10 לידים, כמה סולקים. שיווק? כמה שווה לי כל ליד. שירות לקוחות? כמה אחוז החזר. ובנוסף, נוהל עבודה לכל תרחיש. "מה לעשות אם…"

בדיוק אותו עיקרון עובד עם סוכני AI. אתה לא צריך לפקח על כל שורה. אתה צריך להגדיר מה "הצלחה" נראית, ולתת למערכת לבדוק את עצמה.

מה זה Outcomes ואיך זה עובד

Claude Code הוא כלי AI של Anthropic שמאפשר לתת הוראות בעברית פשוטה ולקבל אוטומציות, קוד, ומערכות מוכנות. בלי לדעת לתכנת.

Outcomes הוא יכולת חדשה שהושקה במאי 2026 שמוסיפה שכבה קריטית: סוכן בודק נפרד. הסוכן שעושה את העבודה לא בודק את עצמו. סוכן שני, עם הקשר נקי לחלוטין, מקבל את התוצאה ואת רשימת הדרישות שלך… ומדרג.

למה דווקא סוכן נפרד?

אדם שבודק את העבודה של עצמו תמיד מושפע מההנחות שלו. הוא "יודע" מה התכוון, אז הוא מפספס טעויות. סוכן בודק נפרד רואה רק את התוצאה מול הדרישות, בלי ההקשר של הסוכן הראשון. לפי MindStudio (מאי 2026), ההפרדה הזו לבדה שיפרה תוצאות ב-8.4% על מסמכי Word וב-10.1% על מצגות.

הזרימה בפועל:

  1. אתה כותב רשימת דרישות (Anthropic קוראים לזה rubric) שמגדירה מה "מעולה" נראה. כללים חדים וברורים, לא "תעשה עבודה טובה".
  2. הסוכן עובד על המשימה ומגיש את התוצאה.
  3. סוכן בודק מדרג את התוצאה מול הדרישות. הוא מחזיר: "עובר" או "צריך תיקון", עם הסבר מדויק מה חסר.
  4. אם צריך תיקון, הסוכן הראשון מקבל את הפידבק ומתקן. אפשר עד 20 סבבי תיקון. ברירת מחדל: 3.

וכל זה קורה אוטומטית. בלי שתיגע.

איך כותבים רשימת דרישות שבאמת עובדת

פה רוב האנשים נופלים. כי הם כותבים משהו כמו "התוכן צריך להיות איכותי ומקצועי". זה כמו לכתוב KPI של "העסק צריך להצליח". חסר ערך.

רשימת דרישות טובה נראית כמו CLAUDE.md מדויק. תנאים שאפשר לענות עליהם כן או לא. בלי אפור.

הטעות שכולם עושים

"תכתוב תוכן מצוין" זה לא דרישה. "הכותרת מכילה מילת מפתח + מספר + תועלת" זה דרישה. אם אתה לא יכול לענות "כן" או "לא", הניסוח לא מספיק חד.

אני אתן לך דוגמה אמיתית. הסוכן שלי כותב מיילים שיווקיים ל-18,000 מנויים ברב מסר. הנה רשימת הדרישות שהוא חייב לעבור:

רשימת הדרישות שאני משתמש בה לניוזלטר

  • שורת נושא: עד 50 תווים, מכילה סקרנות או תועלת ישירה. לא כוללת סימן קריאה.
  • פסקה ראשונה: עד 3 משפטים. מתחילה בסיפור, שאלה, או עובדה מפתיעה. לא "שלום חברים".
  • גוף: 150-300 מילים. מכיל לפחות דוגמה אחת קונקרטית עם מספרים.
  • קריאה לפעולה: משפט אחד בלבד. פועל בציווי. קישור אחד בלבד.
  • טון: פנייה ב"אתה/את", משפטים קצרים (עד 12 מילים), בלי מילות מילוי כמו "בהחלט" או "ללא ספק".

שים לב: כל סעיף אפשר לבדוק. הסוכן הבודק עובר שורה שורה ואומר "שורת הנושא 43 תווים, עובר" או "הגוף 380 מילים, צריך לקצר". בלי מקום לפרשנות.

ומה שלמדתי מהרצת הדרישות האלה: הסוכן הבודק תופס דברים שאני מפספס. הוא לא מתעייף. הוא לא אומר "קרוב מספיק". אם כתוב "עד 300 מילים" והגוף הוא 305, הוא מחזיר לתיקון. בן אדם היה מאשר. הסוכן לא.

הסוד של Outcomes לא בטכנולוגיה. הוא מכריח אותך להגדיר מה "טוב" אומר. ורוב בעלי העסקים מעולם לא עשו את זה.

טיפ מתקדם: תן ל-Claude לבנות את רשימת הדרישות בשבילך

לא יודע מאיפה להתחיל? יש שיטה חכמה: קח דוגמה של תוצאה שאתה מרוצה ממנה. מייל שעבד. מאמר שהמיר. דף נחיתה שהביא לידים.

תן אותה ל-Claude Code עם הפרומפט:

"תנתח את הטקסט הזה ותגיד לי מה הופך אותו לטוב. תפרק למרכיבים שאפשר לבדוק ולהשתמש בהם כרשימת דרישות."

אתה לוקח תוצאה מוצלחת ומפרק אותה לחוקים. מה שתקבל בחזרה הוא טיוטה ראשונה של רשימת דרישות. לא מושלמת, אבל הרבה יותר טובה ממה שרוב האנשים כותבים מאפס. בדוקומנטציה הרשמית של Anthropic ממליצים בדיוק על הגישה הזו.

לפי MindStudio (2026), הגישה הזו הניבה שיפור של עד 10.1% באיכות מסמכים שנוצרו אוטומטית. ולפי The New Stack (מאי 2026), זו הפעם הראשונה ש-Anthropic מיישמת בדיקת איכות חיצונית על עבודת ידע בקנה מידה. לא רק קוד. מה שפעם דרש עובד שבודק כל מסמך, עכשיו קורה אוטומטית.

מתי להשתמש ב-Outcomes ומתי לא

Outcomes לא מתאים לכל משימה. הוא מתאים כשהתוצאה חייבת לעמוד בסטנדרט, וכשהיא חוזרת על עצמה.

  • כן: מיילים שיווקיים, דוחות חודשיים, תוכן בלוג, מסמכי הצעות מחיר, ניתוח מתחרים.
  • לא: שאלה שנשאלת פעם אחת, סיעור מוחות חופשי, שיחה יצירתית שאין לה "תשובה נכונה".

הכלל שלי: אם אתה שולח את התוצאה ללקוח, לצוות, או מפרסם אותה… צריך רשימת דרישות. אם זה רק לך, לחקירה פנימית, כנראה שלא.

הצעד הבא שלך

קח סוג תוכן אחד שאתה מייצר שוב ושוב. מייל, פוסט, דוח. כתוב 5-10 דרישות שמגדירות מתי הוא "מוכן". ספציפיות, שאפשר לבדוק, בלי "צריך להיות טוב".

בנקסט לבל ליוויתי יותר מ-300 יזמים שיצרו ביחד מעל 150 מיליון שקל באונליין. אחד הדברים הראשונים שאנחנו בונים ביחד הוא מערכת מדדים: KPI לכל מחלקה, רשימת דרישות לכל סוכן. כי עסק שרץ לבד צריך הגדרה ברורה של מה "מצוין" נראה. בין אם מי שמבצע הוא עובד, ובין אם הוא סוכן AI.

Claude Code יודע לעבוד קשה. אבל הוא צריך שמישהו יגדיר את מדד ההצלחה. וזה התפקיד שלך.

באהבה ענקית,
יהב.

רוצה סוכנים שבודקים את עצמם לפני שהפלט יוצא?

בליווי אנחנו בונים איתך את רשימות הדרישות הספציפיות לעסק שלך. מיילים, דוחות, תוכן. כדי שהסוכנים שלך ידעו מה מצוין, בלי שתגיד להם כל פעם מחדש.

לבדיקת התאמה ›

הזמנה אישית להצטרפות לרשימת התפוצה של יהב

תכניס את המייל שלך בטופס כאן למטה,
וקבל כרטיס מתנה פנימה

אולי יעניין אותך גם...

קייסטאדי חצי מליון שקל בחודש

קייסטאדי במתנה!

איך גרמנו לג׳ני קפלן להפסיק למכור פגישות והקפצנו אותה מ-2,000 שקל בחודש עם יומן מלא ולשון בחוץ…

למעל ל-500,000 שקל בחודש בזמן שהיא סוגרת חופשות מפנקות מסביב לעולם עם כל המשפחה, על ידי שימוש ב- AI וקורסים דיגיטליים.

תנו לי 37 דקות ואני אגלה לכם את הדרך להפסיק למכור זמן - ולהתחיל למכור ידע!