איך מחשבים טווח בין רבעוני: הבסיס לניתוח פיזור נתונים
כדי לחשב טווח בין רבעוני (IQR), מסדרים את הנתונים מהקטן לגדול, מוצאים את הרבעון הראשון (Q1) ואת הרבעון השלישי (Q3), ואז מחסרים: IQR = Q3 − Q1.
זה הכלי הסטטיסטי שאומר לכם כמה "מרוחים" 50% מהנתונים המרכזיים שלכם.
בשיעור סטטיסטיקה בשנה הראשונה באוניברסיטה, סטודנט מקבל מערך נתונים של ציוני מבחן ומתבקש "לאפיין את הפיזור".
הממוצע לבדו לא מספיק.
סטיית התקן נשמעת מורכבת.
הטווח הבין רבעוני, לעומת זאת, מציע תמונה ברורה ופשוטה של האזור שבו רוב הנתונים נמצאים, בלי להיות רגיש לערכים קיצוניים שמעוותים את התמונה.
במאמר הזה תלמדו בדיוק איך לחשב אותו צעד אחר צעד, מתי להשתמש בו, ואיך הוא משתלב בתמונה הרחבה יותר של ניתוח נתונים.
מה זה טווח בין רבעוני ולמה הוא חשוב
הטווח הבין רבעוני מודד את המרחק בין הרבעון התחתון (Q1) לרבעון העליון (Q3) של מערך נתונים.
במילים אחרות, הוא מתאר את הטווח שבו נמצאים 50% מהתצפיות המרכזיות.
Q1 הוא הערך שמתחתיו נמצאים 25% מהנתונים.
Q3 הוא הערך שמתחתיו נמצאים 75% מהנתונים.
ההפרש ביניהם, כלומר Q3 פחות Q1, הוא הטווח הבין רבעוני.
למה לא להסתפק בטווח הרגיל?
הטווח הרגיל (Range) מחושב כהפרש בין הערך הגבוה ביותר לנמוך ביותר.
הבעיה: ערך קיצוני אחד יכול לנפח אותו באופן דרמטי.
דמיינו קבוצה של 10 עובדים שמרוויחים בין 8,000 ל-15,000 שקל בחודש, ועובד אחד נוסף שמרוויח 120,000 שקל.
הטווח הרגיל יהיה 112,000 שקל, מספר שלא מייצג אף אחד מהעובדים.
הטווח הבין רבעוני, לעומת זאת, יתעלם מהקצוות ויציג תמונה מדויקת של הפיזור האמיתי.
לפי ויקיפדיה, הטווח הבין רבעוני נחשב למדד פיזור עמיד (robust), כלומר הוא עמיד בפני ערכים חריגים.
זו בדיוק הסיבה שמדענים, כלכלנים ואנליסטים מעדיפים אותו במקרים רבים על פני מדדי פיזור אחרים.

חישוב טווח בין רבעוני צעד אחר צעד
בואו ניקח דוגמה מספרית קונקרטית ונעבור עליה יחד.
נניח שיש לנו את הנתונים הבאים: 3, 7, 8, 12, 14, 18, 21, 25, 28, 30, 35.
שלב 1: סידור הנתונים
הנתונים כבר מסודרים מהקטן לגדול.
אם הם לא היו מסודרים, זה הדבר הראשון שהייתם צריכים לעשות.
שלב 2: מציאת החציון
יש לנו 11 ערכים, אז החציון הוא הערך השישי: 18.
החציון מחלק את הנתונים לשתי קבוצות שוות.
שלב 3: מציאת Q1
החצי התחתון כולל את הערכים: 3, 7, 8, 12, 14.
החציון של קבוצה זו הוא הערך האמצעי: 8.
זהו Q1.
שלב 4: מציאת Q3
החצי העליון כולל את הערכים: 21, 25, 28, 30, 35.
החציון של קבוצה זו הוא: 28.
זהו Q3.
שלב 5: חישוב הטווח הבין רבעוני
IQR = Q3 − Q1 = 28 − 8 = 20.
המשמעות: 50% מהנתונים המרכזיים פרוסים על טווח של 20 יחידות.
מי שרוצה להעמיק גם במדד פיזור נוסף, יכול לקרוא על חישוב סטיית תקן, שמשלים את התמונה הסטטיסטית.
דוגמאות מעשיות לשימוש בטווח בין רבעוני
תיאוריה זה יפה, אבל בואו נראה איפה הטווח הבין רבעוני באמת עובד בשטח.
ניתוח שכר בארגון
מנהל משאבי אנוש רוצה להבין את פיזור השכר בחברה.
הממוצע הוא 18,000 שקל, אבל זה כולל את מנכ"ל החברה שמרוויח 85,000 שקל.
חישוב הטווח הבין רבעוני חושף שרוב העובדים מרוויחים בין 12,000 ל-22,000 שקל.
עכשיו אפשר לקבל החלטות שכר מבוססות על המציאות ולא על עיוות סטטיסטי.
זיהוי ערכים חריגים
אחד השימושים הנפוצים ביותר של הטווח הבין רבעוני הוא זיהוי outliers.
הכלל המקובל: כל ערך שנמצא מתחת ל-Q1 − 1.5×IQR או מעל Q3 + 1.5×IQR נחשב חריג.
בדוגמה שלנו: הגבול התחתון הוא 8 − 30 = מינוס 22, והגבול העליון הוא 28 + 30 = 58.
כל ערך מעל 58 או מתחת למינוס 22 היה מסומן כחריג.
השוואה בין קבוצות
מורה רוצה להשוות בין שתי כיתות.
כיתה א' עם IQR של 15 וכיתה ב' עם IQR של 35.
גם אם הממוצע זהה, הפיזור בכיתה ב' גדול בהרבה, מה שאומר שיש פערים רחבים יותר בין התלמידים.
כשמנתחים נתונים כאלה, לפעמים שווה גם להבין איך לחשב עלייה באחוזים כדי לראות את השינוי בפרספקטיבה נוספת.
טעויות נפוצות וטיפים מתקדמים בחישוב טווח בין רבעוני
גם מי שמבין את העיקרון עלול להיתקל במלכודות.
הנה הטעויות הנפוצות ביותר ואיך להימנע מהן.
טעות 1: שכחה לסדר את הנתונים
זה נשמע בנאלי, אבל זו הטעות מספר אחת.
בלי סידור מהקטן לגדול, כל החישוב מתפרק.
טעות 2: בלבול בחלוקה למחציות
כשמספר הנתונים זוגי, החציון הוא הממוצע של שני הערכים האמצעיים.
במקרה כזה, Q1 מחושב מהמחצית התחתונה ו-Q3 מהמחצית העליונה, כולל או לא כולל החציון, בהתאם לשיטה.
שיטות שונות (כמו שיטת "כולל" ושיטת "לא כולל") עלולות לתת תוצאות מעט שונות.
עקביות היא המפתח: בחרו שיטה אחת והיצמדו אליה.
טעות 3: התעלמות מהקשר
IQR של 5 בציוני מבחן מ-0 עד 100 זה קטן מאוד.
IQR של 5 בטמפרטורת גוף (35 עד 42 מעלות) זה עצום.
תמיד פרשו את התוצאה בהקשר של הנתונים.
טיפ מתקדם: שילוב עם תרשים קופסה
תרשים קופסה (Box Plot) הוא הייצוג הגרפי המושלם של הטווח הבין רבעוני.
הקופסה מייצגת את IQR, הקו באמצע הוא החציון, והשפמים (whiskers) מראים את הטווח עד לגבולות הערכים החריגים.
זהו כלי ויזואלי עוצמתי שהופך מספרים יבשים לתובנות מיידיות.
אם אתם עובדים עם כלי AI לניתוח נתונים, כדאי לדעת איך להשתמש ב-ChatGPT לעבודה בעברית, כולל חישובים סטטיסטיים.
בנוסף, הבנת נוסחאות מתמטיות בסיסיות, כמו נפח פירמידה ישרה, יכולה לחזק את הבסיס המתמטי שלכם.
שאלות נפוצות
מה ההבדל בין טווח לטווח בין רבעוני?
הטווח הרגיל הוא ההפרש בין הערך הגבוה ביותר לנמוך ביותר בכל מערך הנתונים.
הטווח הבין רבעוני מתמקד רק ב-50% המרכזיים של הנתונים, ולכן הוא עמיד בפני ערכים קיצוניים.
בפועל, IQR מספק תמונה אמינה יותר של הפיזור האמיתי כשיש נתונים חריגים.
האם אפשר לחשב טווח בין רבעוני באקסל?
כן, באקסל משתמשים בפונקציה QUARTILE.INC או QUARTILE.EXC.
מחשבים Q1 באמצעות QUARTILE.INC(טווח, 1) ו-Q3 באמצעות QUARTILE.INC(טווח, 3).
אחר כך פשוט מחסרים את Q1 מ-Q3 בתא נפרד.
הפונקציה INC כוללת את נקודות הקצה בחישוב, בעוד EXC לא כוללת אותן.
מתי עדיף להשתמש בטווח בין רבעוני ולא בסטיית תקן?
כשהנתונים לא מתפלגים נורמלית או כשיש ערכים חריגים בולטים, הטווח הבין רבעוני עדיף.
סטיית תקן מושפעת מאוד מערכים קיצוניים כי היא מבוססת על ריבוע ההפרשים מהממוצע.
לעומתה, IQR מתעלם לחלוטין מהרבעון העליון והתחתון ולכן יציב יותר.
מה המשמעות של טווח בין רבעוני גדול לעומת קטן?
IQR גדול מצביע על כך שהנתונים המרכזיים פזורים על טווח רחב, כלומר יש שונות גבוהה.
IQR קטן אומר שרוב הנתונים מרוכזים סביב החציון ויש אחידות גבוהה.
בהשוואה בין קבוצות, הקבוצה עם IQR קטן יותר היא ההומוגנית יותר.
האם טווח בין רבעוני יכול להיות שלילי?
לא, הטווח הבין רבעוני תמיד חיובי או שווה לאפס.
מכיוון ש-Q3 תמיד גדול מ-Q1 או שווה לו (הרי הנתונים מסודרים), ההפרש לעולם לא יהיה שלילי.
IQR של אפס אפשרי רק כאשר לפחות חצי מהנתונים זהים.
איך משתמשים בטווח בין רבעוני לזיהוי ערכים חריגים?
מכפילים את ה-IQR ב-1.5 ומחשבים שני גבולות: Q1 − 1.5×IQR (גבול תחתון) ו-Q3 + 1.5×IQR (גבול עליון).
כל ערך שחורג מגבולות אלה נחשב ערך חריג.
שיטה זו נקראת "כלל הגדר" (Fence Rule) והיא אחת השיטות הנפוצות ביותר לזיהוי outliers בסטטיסטיקה תיאורית.
סיכום
הטווח הבין רבעוני הוא אחד הכלים השימושיים ביותר בסטטיסטיקה בסיסית.
הוא פשוט לחישוב: סדרו את הנתונים, מצאו את Q1 ו-Q3, וחסרו.
הוא עמיד בפני ערכים קיצוניים, בניגוד לטווח הרגיל ולסטיית תקן.
הוא מספק תמונה אמינה של האזור שבו נמצאים רוב הנתונים שלכם.
בפעם הבאה שתקבלו מערך נתונים ותרצו להבין את הפיזור, התחילו מחישוב הטווח הבין רבעוני.
שלבו אותו עם תרשים קופסה לוויזואליזציה, והשתמשו בכלל 1.5×IQR לזיהוי חריגים.
ככל שתתרגלו, תגלו שמדד פשוט זה חוסך לכם שעות של ניתוח מיותר ומוביל להחלטות מבוססות נתונים טובות יותר.
אם אתם רוצים לחזק את הכישורים המתמטיים שלכם באופן כללי, שווה לשקול גם לימודי מדעי המחשב כבסיס רחב לעבודה עם נתונים.