כדי לחשב סטיית תקן, מוצאים את ממוצע הנתונים, מחשבים את הפרש כל ערך מהממוצע, מעלים כל הפרש בריבוע, מחשבים את ממוצע הריבועים (שונות), ולבסוף מוציאים שורש ריבועי מהתוצאה. זהו המדד הסטטיסטי הנפוץ ביותר לבחינת פיזור נתונים סביב הממוצע.
סטיית תקן מספרת לכם עד כמה הנתונים שלכם "מפוזרים" או "מרוכזים". ערך נמוך מעיד על כך שרוב הנתונים קרובים לממוצע, בעוד ערך גבוה מצביע על תנודתיות רבה.
במאמר זה תלמדו את הנוסחה המדויקת, תעברו על דוגמה מספרית שלב אחר שלב, ותבינו את ההבדל בין סטיית תקן של אוכלוסייה לבין סטיית תקן של מדגם. בנוסף, נסקור שימושים מעשיים בעולם הפיננסי, המדעי והעסקי.
לא צריך רקע מתמטי מתקדם כדי להבין את החישוב. כל מה שנדרש הוא פעולות חשבון בסיסיות וקצת סבלנות.
מהי סטיית תקן ולמה היא חשובה?
סטיית תקן (Standard Deviation) היא מדד סטטיסטי שמתאר את מידת הפיזור של קבוצת נתונים סביב הממוצע שלהם. היא נמדדת באותן יחידות כמו הנתונים עצמם, מה שהופך אותה לאינטואיטיבית יותר מהשונות (Variance).
נניח ששני כיתות קיבלו ציון ממוצע של 80 במבחן. בכיתה א' הציונים נעים בין 75 ל-85, ובכיתה ב' בין 50 ל-100. הממוצע זהה, אבל הפיזור שונה לחלוטין. סטיית התקן תהיה נמוכה בכיתה א' וגבוהה בכיתה ב'.
למה לא מספיק להסתכל על הממוצע?
הממוצע לבדו מספק תמונה חלקית. שני סטים של נתונים עם ממוצע זהה יכולים להיראות שונים לחלוטין.
דמיינו שני מסלולי השקעה: אחד מניב 5% בכל שנה, והשני מניב 15% בשנה אחת ומפסיד 5% בשנה שאחריה. הממוצע דומה, אבל הסיכון שונה. סטיית תקן מכמתת את הסיכון הזה במספר אחד.
סימון מתמטי
סטיית תקן של אוכלוסייה מסומנת באות היוונית σ (סיגמא). סטיית תקן של מדגם מסומנת באות s.
ההבדל בין השתיים אינו רק סימבולי. הוא משפיע על נוסחת החישוב עצמה, כפי שנראה בהמשך.
על פי ערך ויקיפדיה בעברית, סטיית תקן היא אחד ממדדי הפיזור הבסיסיים ביותר בסטטיסטיקה התיאורית והיא מהווה אבן יסוד בתחומי מחקר רבים.

הנוסחה המלאה לחישוב סטיית תקן
קיימות שתי נוסחאות מרכזיות, אחת לאוכלוסייה ואחת למדגם. ההבדל ביניהן נעוץ במכנה של השבר.
נוסחה לאוכלוסייה (σ)
כאשר הנתונים מייצגים את כלל האוכלוסייה, הנוסחה היא: שורש ריבועי של סכום ריבועי ההפרשים מהממוצע חלקי N, כאשר N הוא מספר הנתונים הכולל.
בצורה מפורטת: σ = √[Σ(xi – μ)² / N], כאשר μ הוא ממוצע האוכלוסייה ו-xi הוא כל ערך בנפרד.
נוסחה למדגם (s)
כאשר הנתונים מייצגים מדגם מתוך אוכלוסייה גדולה יותר, מחלקים ב-(N-1) במקום ב-N. זוהי תיקון שנקרא "תיקון בסל" (Bessel's correction).
הנוסחה: s = √[Σ(xi – x̄)² / (N-1)], כאשר x̄ הוא ממוצע המדגם.
החלוקה ב-(N-1) מפצה על כך שמדגם נוטה לא להציג את מלוא השונות שקיימת באוכלוסייה. ברוב המקרים המעשיים, כשעובדים עם נתונים שנאספו ממדגם, תשתמשו בנוסחה זו.
חמשת השלבים בחישוב
- חשבו את הממוצע של כל הנתונים.
- חסרו את הממוצע מכל ערך בנפרד.
- העלו כל הפרש בריבוע.
- חשבו את ממוצע הריבועים (חלקו ב-N לאוכלוסייה או ב-N-1 למדגם). התוצאה היא השונות.
- הוציאו שורש ריבועי מהשונות. התוצאה היא סטיית תקן.
דוגמה מספרית מפורטת לחישוב סטיית תקן
נעבוד עם סדרת הנתונים הבאה, שמייצגת ציוני מבחן של 5 תלמידים: 70, 80, 85, 90, 75.
שלב 1: חישוב הממוצע. נסכום את כל הערכים: 70+80+85+90+75 = 400. נחלק במספר הנתונים: 400/5 = 80. הממוצע הוא 80.
שלב 2: חישוב ההפרשים מהממוצע. 70-80 = -10, 80-80 = 0, 85-80 = 5, 90-80 = 10, 75-80 = -5.
שלב 3: העלאה בריבוע. (-10)² = 100, 0² = 0, 5² = 25, 10² = 100, (-5)² = 25.
שלב 4: חישוב השונות. נסכום את הריבועים: 100+0+25+100+25 = 250. אם אלו כלל האוכלוסייה, נחלק ב-5: 250/5 = 50. אם זהו מדגם, נחלק ב-4: 250/4 = 62.5.
שלב 5: שורש ריבועי. סטיית תקן אוכלוסייה: √50 ≈ 7.07. סטיית תקן מדגם: √62.5 ≈ 7.91.
המשמעות: ציוני התלמידים סוטים בממוצע כ-7 עד 8 נקודות מהממוצע. מספר קטן יחסית, שמעיד על התפלגות צפופה למדי.
כדי לחשב עלייה באחוזים על בסיס נתונים סטטיסטיים, צריך קודם כל להבין את הערכים המספריים שמאחורי הנתונים, בדיוק כפי שעשינו כאן.
שימושים מעשיים של סטיית תקן
סטיית תקן אינה רק תרגיל אקדמי. היא כלי עבודה יומיומי בתחומים מגוונים.
פיננסים והשקעות
בעולם ההשקעות, סטיית תקן משמשת כמדד לתנודתיות (Volatility). מנהלי תיקים משתמשים בה כדי להעריך את רמת הסיכון של נכס או תיק השקעות.
מניה עם סטיית תקן שנתית של 40% היא תנודתית בהרבה ממניה עם סטיית תקן של 12%. משקיעים שמרניים יעדיפו לרוב נכסים עם סטייה נמוכה יותר.
בקרת איכות בתעשייה
מפעלי ייצור עוקבים אחרי סטיית תקן של מידות מוצרים כדי לזהות חריגות. שיטת Six Sigma, למשל, שואפת לצמצם את סטיית התקן כך שטווח של 6 סטיות תקן מהממוצע ייכנס בתוך גבולות המפרט.
אם מפעל מייצר ברגים שאמורים להיות באורך 50 מ"מ וסטיית התקן היא 0.01 מ"מ, רוב הברגים יהיו קרובים מאוד למידה הנדרשת.
מחקר מדעי וניסויים
חוקרים מדווחים על תוצאות ניסויים כממוצע ± סטיית תקן. זה מאפשר לקוראי המחקר להבין עד כמה התוצאות עקביות.
סטיית תקן גבוהה בניסוי מרמזת על כך שיש גורם שלא נשלט כראוי, או שהתופעה הנמדדת מגוונת מטבעה.
חינוך והערכה
מורים ומוסדות חינוך משתמשים בסטיית תקן כדי להבין עד כמה הציונים בכיתה מפוזרים. כיתה עם סטייה גבוהה מעידה על פערים גדולים בין התלמידים.
ניתוח סטטיסטי כזה עוזר לזהות תלמידים שזקוקים לתמיכה נוספת, או לבדוק אם מבחן מסוים היה קשה מדי או קל מדי.
אם אתם מתעניינים בהעמקת הידע המתמטי שלכם, שווה לבדוק גם נוסחאות גיאומטריות שמרחיבות את ארגז הכלים החישובי.
שאלות נפוצות
מה ההבדל בין סטיית תקן לשונות?
השונות (Variance) היא ממוצע ריבועי ההפרשים מהממוצע, וסטיית תקן היא השורש הריבועי של השונות. בפועל, סטיית תקן נוחה יותר לשימוש כי היא מבוטאת באותן יחידות כמו הנתונים המקוריים. למשל, אם הנתונים הם בשקלים, סטיית התקן תהיה בשקלים ולא ב"שקלים בריבוע". לכן בדוחות ובניתוחים מעשיים, סטיית תקן מועדפת על פני שונות.
מתי משתמשים בנוסחה של אוכלוסייה ומתי בנוסחה של מדגם?
אם הנתונים שלכם כוללים את כל הפריטים באוכלוסייה הנחקרת, השתמשו בנוסחת האוכלוסייה (חלוקה ב-N). אם הנתונים מייצגים מדגם מתוך אוכלוסייה גדולה יותר, השתמשו בנוסחת המדגם (חלוקה ב-N-1). ברוב המקרים המעשיים, למשל סקרים, ניסויים ומחקרי שוק, עובדים עם מדגם. כלל האצבע: אם יש לכם ספק, השתמשו בנוסחת המדגם.
האם אפשר לחשב סטיית תקן באקסל?
כן, אקסל מציע שתי פונקציות ייעודיות. הפונקציה STDEV.P מחשבת סטיית תקן של אוכלוסייה, והפונקציה STDEV.S מחשבת סטיית תקן של מדגם. פשוט הזינו את טווח התאים בתוך הסוגריים, למשל: STDEV.S(A1:A10). גוגל שיטס תומך באותן פונקציות בדיוק.
מה נחשב סטיית תקן "גבוהה" או "נמוכה"?
אין ערך מוחלט שמגדיר סטיית תקן כגבוהה או נמוכה. הכול תלוי בהקשר ובסדר הגודל של הנתונים. דרך שימושית להעריך זאת היא מקדם השונות (CV), שהוא סטיית התקן חלקי הממוצע כפול 100%. מקדם שונות מעל 30% נחשב לרוב לפיזור גבוה יחסית.
למה מעלים בריבוע את ההפרשים ולא משתמשים בערך מוחלט?
העלאה בריבוע נותנת משקל גדול יותר לערכים חריגים, מה שהופך את סטיית התקן לרגישה לנקודות קיצון. בנוסף, לריבוע יש תכונות מתמטיות נוחות שמקלות על גזירה ועל חישובים אלגבריים מורכבים. קיים גם מדד שמבוסס על ערך מוחלט, שנקרא סטייה ממוצעת מוחלטת (MAD), אך הוא פחות נפוץ בסטטיסטיקה הקלאסית.
איך סטיית תקן קשורה להתפלגות נורמלית?
בהתפלגות נורמלית (עקומת הפעמון), כ-68% מהנתונים נמצאים בטווח של סטיית תקן אחת מהממוצע, כ-95% בטווח של שתי סטיות תקן, וכ-99.7% בטווח של שלוש סטיות תקן. כלל זה ידוע בשם "כלל 68-95-99.7" או "הכלל האמפירי". הוא שימושי במיוחד לזיהוי ערכים חריגים (Outliers) בסט נתונים.
סיכום
חישוב סטיית תקן הוא תהליך בן חמישה שלבים פשוטים: ממוצע, הפרשים, ריבועים, שונות, ושורש ריבועי. גם אם הנוסחה נראית מרתיעה במבט ראשון, ברגע שמבצעים אותה פעם אחת עם מספרים אמיתיים, ההיגיון מאחוריה מתבהר.
זכרו להבחין בין נוסחת אוכלוסייה לנוסחת מדגם. ברוב המקרים המעשיים תשתמשו בנוסחת המדגם עם חלוקה ב-(N-1).
סטיית תקן היא הרבה יותר ממספר בודד. היא מספקת הקשר שהממוצע לבדו אינו יכול לתת, ומאפשרת קבלת החלטות מושכלת בהשקעות, בייצור, במחקר ובחינוך.
הצעד הבא שלכם: קחו סט נתונים אמיתי מהעבודה או מהלימודים, חשבו את סטיית התקן באופן ידני, ואז בדקו את התוצאה באקסל. התרגול הזה ייתן לכם ביטחון מלא בכלי הסטטיסטי הזה.