דגימה

(חלקים משיעורים 2,3)

(דגימה זהו נושא פחות חשוב בקורס)

ההבחנה שאנחנו עושים זה בין דגימה הסתברותית לבין דגימה לא הסתברותית.

דגימה לא הסתברותית:

בדגימה לא הסתברותית המדגם לא מייצג את כלל האוכלוסייה, ולכן יש בעיות (עלולות להיווצר בעיות) בתקפות הממצאים.

דוגמא לדגימה לא הסתברותית זה מדגם כדור השלג

א. מדגם כדור השלג

דוגמא למדגם כדור השלג זה חבר מביא חבר: חבר מזמין את החברים שלו למדגם שמביאים חברים שלהם.

יש פה בעיה ייצוגית מכיוון שיכול להיות שבגלל שכולם חברים הם לא מייצגים את כלל האוכלוסייה ולכן יש לי בעיה להסיק מסקנות תקפות.

ב. שיטת המכסה

במצב שבו צריך לראיין למשל 30 אנשים מעיר מסוימת, ואז המראיין, שאין עליו הגבלות, הולך לקניון בשעת בוקר. הבעיה היא שהמדגם לא מייצג. היתרון שזה חיסכון של כסף וזמן.

דגימה הסתברותית

דגימה הסתברותית זוהי דגימה שהמדגם מייצג את האוכלוסייה ולצורך דגימה הסתברותית יש צורך במסגרת דגימה.

הכוונה שקיים סיכוי ידוע מראש לכל פריט מהאוכלוסייה להיבחר למדגם, כשהסיכוי נע בין אפס לאחת (לא כולל את הקצוות אפס, ואחת)

כאשר כדי לדעת את הסיכוי חייבת להיות לי מסגרת דגימה.

מסגרת דגימה:

זה רשימה של כל הפריטים באוכלוסייה.

יש 4 סוגי דגימה הסתברותית

כולם מייצגים את האוכלוסייה

דגימה מקרית (=מקרית פשוטה)
דגימה שיטתית
דגימת שכבות
דגימה אשכולות (פחות חשוב)

1. דגימה מקרית פשוטה

פירושה שקיים סיכוי שווה (גם ידוע) לכל פריט מהאוכלוסייה להיבחר למדגם

* (אפשר להשלים מהספר)

2. דגימה שיטתית

בדגימה שיטתית יש לבדוק את יחס הדגימה

יחס הדגימה

זהו היחס בין גודל המדגם לגודל האוכלוסייה.

למשל: אם מדגם אוכלוסייה שווה 10000 , ודוגמים 100 אנשים. אז יחס הדגימה הוא 100/10000 שווה ל 1/100

אחרי שיודעים את יחס הדגימה אז מתוך יחס הדגימה הראשון (בדוגמה שלנו 1/100) דוגמים באופן מקרי פריט אחד שהוא הפריט הראשון במדגם, בהמשך מתקדמים לפי יחס הדגימה (בדוגמא שלנו קופצים במאה)

דוגמא

נניח שיחס הדגימה הוא 1/100

נדגום באופן מקרי פריט אחד למשל פריט 17

הפריט השני שנדגום הוא פריט: 117

הפריט השלישי שנדגום הוא פריט 217

317

וכד'..

כלומר מוסיפים בכל פעם את יחס הדגימה

לסיכום ההסבר: דוגמים מקרית את הפריט הראשון ואז באופן שיטתי מתקדמים לפי יחס הדגימה.

הבעיה בדגימה השיטתית

המדגם יכול להיות מוטה בשני מקרים (כלומר לא מייצג את האוכלוסייה):

1. הרשימה מסודרת בסדר כלשהו, כשהסדר הזה רלוונטי למשתנה הנחקר

למשל, אם רוצים לבדוק 1000 איש מתעשיית ההיטק ורוצים לדעת מה גובה השכר, אבל הרשימה שלהם היא עם פי ותק.

מספר פריט ותק

בהנחה שיש קשר בין ותק לבין שכר הממוצע, אז זה יהיה מדגם שלא מייצג את כלל האוכלוסייה. והוא יהיה תלוי במספר הראשון שנחקר

כלומר התוצאה היא לא מקרית כי הותק הוא כן רלוונטי לשכר.

ולכן, במקרה זה אם הרשימה ממוינת בסדר מסוים לא נבצע דגימה שיטתית.

2. הרשימה היא רשימה מחזורית

למשל:

ראשון

שני

שבת

ראשון

שבת

או חודשים, ימים, שעות וכד'

הבעיה תתרחש אם יש יחס חפיפה בין יחס הדגימה למחזוריות, במקרה זה נדגום כל פעם את אותו יום בשבוע (שעה, חודש) ואז יש בעיה כי זה לא מייצג את שאר הפריטים באוכלוסייה.

אם אין חפיפה אז אין בעיה כי אז יש ייצוג של כל הימים

למשל עבור סידור בחודשים

מספר פריט חודש בשנה

24 12

אם היחס לא מחזורי, למשל 11 אז יהיה ייצוג לכל החודשים בשנה

3. דגימת שכבות

(משתנה רקע= מצב סוציו אקונומי, גיל, השכלה, מוצא, מין..)

כאשר ידוע שיש משתנה שהוא משתנה רקע (לא הכרחי שיהיה משתנה רקע, אך בדרך כלל), ואני יודע שהמשתנה הזה הוא רלוונטי למשתנה הנחקר, וכמו כן יש מידע לגבי האחוזים שקיימים באוכלוסייה מכל שכבה אז כדאי:

לחלק את האוכלוסייה לשכבות

דוגמא:

נתון שבאוכלוסייה לגבי מצב כלכלי

מצב כלכלי דגימת שכבות פרופורציונית (נניח שניקח 100)

נמוך: 40% 40

בינוני: 50% 50

גבוה: 10% 10

ואז נבצע דגימת שכבות פרופורציונלית.

כלומר נדגום את כל האנשים במדגם על פי הייצוג היחסי שלהם (כמו בדוגמא)

וכך אנחנו מוודאות שיש התאמה בין היצוג במדגם לבין היצוג באוכלוסייה, וכך מקטינים את טענות הדגימה.

ככל שמשתנה הרקע של השכבות הוא במתאם יותר גבוהה עם המשתנה הנחקר כך יש פחות טעות דגימה. (כלומר ככל שמשתנה הרקע יותר רלוונטי כך עושים פחות טעות דגימה)

4. דגימת אשכולות

נחלק את האשכולות למספר אשכולות באופן מקרי (החלוקה היא מקרית)

כאשר כל אשכול מכיל קבוצה של פריטים ואז, אחרי החלוקה לאשכולות, אני דוגם באופן מקרי אחד מבין האשכולות,

ואז, כל הפריטים שמופיעים תחת האשכול שנבחר- נדגמים

דגימת אשכולות יכולה, למשל, להיות לפי חלוקה גאוגרפית

השוואה בין דגימת אשכולות לדגימת שכבות

בדגימת אשכולות

שאיפת החוקר היא שלא יהיה הבדל בין אשכול לאשכול,
בתוך כל אשכול יהיה ייצוג לכלל האוכלוסייה

כלומר בין האשכולות צריך להיות שונות קטנה כלל האפשר, אבל השונות בתוך האשכול צריכה להיות גדולה (בהתאם לאוכלוסייה)

בדגימת שכבות

המדגם בתוך כל שכבה הוא הומוגוני (פחות או יותר)
יש הבדל בין השכבות

ההנחה היא שקיים הבדל בין שיכבה לשכבה אך בתוך כל שיכבה השונות קטנה.

שאלה 5 עמוד 2

א)

יש להשתמש בדגימת שכבות.

צריך 200 אנשים למדגם

גברים (= משתנה מין=) נשים

120 80

20% קצינים 80% חוגרים 20% קצינים 80% חוגרים

=24 קצינים 96 חוגרים 16 קצינות 64 חוגרים

אם היינו מתחילים בדרגה בהתחלה, ובמין בסוף אז היינו מקבלים את אותם מספרים

* כתוב שאין קשר בין המין לדרגה, כלומר אין הבדלים בין הקבוצות (גברים נשים לבין דרגה). כלומר עבור ערך במין יש בדיוק את אותו ייצוג הדרגות (= אין קשר)

ב)

יש להשתמש בדגימת שכבות

200

20% קצינים 80% חוגרים

40 קצינים וקצינות 160 חוגרים וחוגרות

עשינו חלוקה רק לפי דרגה, כי אין קשר למין. כי זה לא משתנה. אם יפלו רק גברים או רק נשים, במדגם אין הבדל, כי נתון שאין הבדל בין גברים לשנים. ובכל מקרה יהיה עדיין ייצוג לאוכלוסייה.

עושים דגימת שכבות, משתנים רלוונטיים

שאלה 6 עמוד 3

א

בשני המיקרים: דגימה שיטתית, יחס הדגימה הוא 1:10 (כל אישה עשירית, כל יום עשירי)

ב

רופא א': כל אישה עשירית

יהיה לפי סדר הלידה. סדר הלידה לא רלוונטי לרמת הדיכאון
(אין סיבה להניח שהרשימה היתה מסודרת כך שהיא רלוונטית לשני המשתנים שנחקרו, ולכןן אין סיבה להניחה שתיווצר הטיה ברשימה זו)

רופא ב: כל יום עשירי

אצל רופא ב' הרשימה היא רשימה מחזורית והיה עלול להיווצר הטיה אם יחס הדגימה היה חושף ליחס המחזוריות (1:10 , 1:7), אבל במקרה שלנו לא קיימת חפיפה
ולכן גם במקרה זה לא תיווצר הטיה, וזאת כיוון שידגמו כל ימות השבוע ולכן יהיה ייצוג לכלל הימים.

ג

החוקר מדד את שני המשתנים במחקר ולכן מערץ המחקר הוא מתאמי

ד

זוהי דגימה לא הסתברותית0 מדגם כדור השלג, וכך יכולה להיווצר הטיה
כן, יש בעיה כיוון שהעונים באים מאותה שיכבה של האוכלוסייה ויכול להיות שתהיה בעיה של ייצוגיות

סיכום:

סיכומים של קורסים במדעי החברה (פסיכולוגיה) אוניברסיטה הפתוחה

יום ראשון, 29 במרץ 2009

שיטות מחקר א: דגימה - חלקים משיעורים 2-3