מה זה גרף פיזור?
גרף פיזור (Scatter Plot) הוא סוג של גרף המציג נקודות בודדות במערכת צירים, כשכל נקודה מייצגת תצפית אחת עם שני ערכים: אחד לערך הציר האופקי (X) ואחד לערך הציר האנכי (Y). בדרך זו ניתן לראות קשר אפשרי בין שני משתנים – האם יש ביניהם מגמה משותפת, קוֹרֵלַצְיָה, קשר כלשהו - או שהם בלתי תלויים.
הנקודות מפוזרות במישור בהתאם לערכיהן. אם למשל הערכים נוטים לעלות יחד (כש-X גדול גם Y גדול), נראה שהנקודות מתגבשות בקו אלכסוני עולה. לעומת זאת, אם אין קשר, הן תהיינה מפוזרות בצורה עננית וללא כיוון ברור.
לדוגמה, נוכל לצייר גרף פיזור שבו כל נקודה היא תלמיד: המיקום האופקי הוא מספר שעות הלמידה שלו למבחן, והמיקום האנכי הוא הציון שקיבל. אם נראה שהנקודות יוצרות נטייה אלכסונית (ככל שלמדו יותר שעות הציונים שלהם עולים), נסיק מכך שיש קשר חיובי בין זמן הלימוד לציון.
לחילופין, אם המצב הוא שהנקודות פזורות ללא סדר, כשחלק שלמדו מעט קיבלו ציון גבוה ואחרים שלמדו הרבה קיבלו ציון נמוך, נבין מכך שאין קשר ברור.
יתרון נוסף של גרף הפיזור הוא באפשרות לזהות בקלות ערכים חריגים (outliers), כנקודות שרחוקות מכל השאר.
דוגמאות? - מה הקשר בין משקל לגובה של אנשים? או בין כמות שעות צפייה בטלוויזיה לציונים בבית הספר?
כלומר גרף פיזור יהיה הבחירה הטבעית לכל זוג של נתונים מספריים שחשוב לנו לדעת אם יש ביניהם קשר. לעיתים גם מוסיפים קו מגמה או מחשבים מִתאם, קורלציה (correlation) כדי לכמת את הקשר, אבל ויזואלית הגרף כבר נותן תחושה טובה של זה.
דוגמה נוספת: גרף פיזור של גודל דירה (במ"ר) מול גובה שכר הדירה. אם אכן קיים קשר כזה בשוק הדיור, הרי שנקודות ערוכות בעלייה יראו שדירות גדולות יותר נוטות גם לעלות יותר.
גרף פיזור (Scatter Plot) הוא סוג של גרף המציג נקודות בודדות במערכת צירים, כשכל נקודה מייצגת תצפית אחת עם שני ערכים: אחד לערך הציר האופקי (X) ואחד לערך הציר האנכי (Y). בדרך זו ניתן לראות קשר אפשרי בין שני משתנים – האם יש ביניהם מגמה משותפת, קוֹרֵלַצְיָה, קשר כלשהו - או שהם בלתי תלויים.
הנקודות מפוזרות במישור בהתאם לערכיהן. אם למשל הערכים נוטים לעלות יחד (כש-X גדול גם Y גדול), נראה שהנקודות מתגבשות בקו אלכסוני עולה. לעומת זאת, אם אין קשר, הן תהיינה מפוזרות בצורה עננית וללא כיוון ברור.
לדוגמה, נוכל לצייר גרף פיזור שבו כל נקודה היא תלמיד: המיקום האופקי הוא מספר שעות הלמידה שלו למבחן, והמיקום האנכי הוא הציון שקיבל. אם נראה שהנקודות יוצרות נטייה אלכסונית (ככל שלמדו יותר שעות הציונים שלהם עולים), נסיק מכך שיש קשר חיובי בין זמן הלימוד לציון.
לחילופין, אם המצב הוא שהנקודות פזורות ללא סדר, כשחלק שלמדו מעט קיבלו ציון גבוה ואחרים שלמדו הרבה קיבלו ציון נמוך, נבין מכך שאין קשר ברור.
יתרונות
גרף פיזור מצטיין בהמחשת קשרים ותבניות בין שני משתנים כמותיים. בשונה מגרפים כמו עמודות או קו, כאן כל פרט מופיע בנפרד כנקודה, וכך רואים גם את הפיזור וגם את צברי נקודות, ריכוזים של נקודות.
יתרון נוסף של גרף הפיזור הוא באפשרות לזהות בקלות ערכים חריגים (outliers), כנקודות שרחוקות מכל השאר.
התאמה
גרף פיזור מתאים במיוחד עבור בדיקת קוֹרֵלַצְיָה (בעברית מִתְאָם), קשר או תלות בין שני דברים שנמדדים באופן מספרי.
דוגמאות? - מה הקשר בין משקל לגובה של אנשים? או בין כמות שעות צפייה בטלוויזיה לציונים בבית הספר?
כלומר גרף פיזור יהיה הבחירה הטבעית לכל זוג של נתונים מספריים שחשוב לנו לדעת אם יש ביניהם קשר. לעיתים גם מוסיפים קו מגמה או מחשבים מִתאם, קורלציה (correlation) כדי לכמת את הקשר, אבל ויזואלית הגרף כבר נותן תחושה טובה של זה.
דוגמאות
קבלו דוגמה מהחיים - חוקרת עשויה להשתמש בגרף פיזור כדי לבדוק את הקשר בין כמות הפעילות הגופנית השבועית של אנשים לבין לחץ הדם שלהם. כל אדם מיוצג בנקודה אית, כשציר ה-X הוא שעות הספורט בשבוע, בעוד ציר Y הוא רמת לחץ הדם. אם מתגלה שיותר ספורט נוטה להתאים ללחץ דם נמוך יותר (נקודות לכיוון אלכסון יורד), זה רמז לקשר שלילי בין המשתתנים (יותר פעילות, פחות לחץ דם).
דוגמה נוספת: גרף פיזור של גודל דירה (במ"ר) מול גובה שכר הדירה. אם אכן קיים קשר כזה בשוק הדיור, הרי שנקודות ערוכות בעלייה יראו שדירות גדולות יותר נוטות גם לעלות יותר.