נוסחת שונות מותנית. וריאציות מוחלטות

האינדיקטורים ההכללים העיקריים לשונות בסטטיסטיקה הם פיזור וסטיות תקן.

פְּזִירָה זה ממוצע אריתמטי בריבוע סטיות של כל ערך מאפיין מהממוצע הכולל. השונות נקראת בדרך כלל ריבוע הסטיות הממוצע והיא מסומנת ב-  2. בהתאם לנתוני המקור, ניתן לחשב את השונות באמצעות הממוצע האריתמטי הפשוט או המשוקלל:

 שונות לא משוקללת (פשוטה);

 השונות משוקללת.

סטיית תקן זהו מאפיין הכללה של גדלים מוחלטים וריאציות סימנים במצטבר. הוא מתבטא באותן יחידות מדידה כמו התכונה (במטרים, טונות, אחוזים, הקטרים ​​וכו').

סטיית התקן היא השורש הריבועי של השונות ומסומנת ב- :

 סטיית תקן ללא משקל;

 סטיית תקן משוקללת.

סטיית התקן היא מדד לאמינות הממוצע. ככל שסטיית התקן קטנה יותר, כך הממוצע האריתמטי משקף טוב יותר את כל האוכלוסייה המיוצגת.

לחישוב סטיית התקן קודם חישוב השונות.

ההליך לחישוב השונות המשוקלל הוא כדלקמן:

1) קבע את הממוצע האריתמטי המשוקלל:

2) חשב את הסטיות של האופציות מהממוצע:

3) בריבוע הסטייה של כל אפשרות מהממוצע:

4) הכפל את ריבועי הסטיות במשקלים (תדרים):

5) סכם את המוצרים שהתקבלו:

6) הכמות המתקבלת מחולקת בסכום המשקולות:

דוגמה 2.1

בוא נחשב את הממוצע האריתמטי המשוקלל:

ערכי הסטיות מהממוצע והריבועים שלהם מוצגים בטבלה. בוא נגדיר את השונות:

סטיית התקן תהיה שווה ל:

אם נתוני המקור מוצגים בצורה של מרווח סדרת הפצה , אז תחילה עליך לקבוע את הערך הבדיד של התכונה, ולאחר מכן ליישם את השיטה המתוארת.

דוגמה 2.2

הבה נראה את חישוב השונות לסדרת מרווחים תוך שימוש בנתונים על התפלגות השטח הנזרע של משק קיבוצי לפי יבול החיטה.

הממוצע האריתמטי הוא:

בוא נחשב את השונות:

6.3. חישוב השונות באמצעות נוסחה המבוססת על נתונים בודדים

טכניקת חישוב שונות מורכב, ועם ערכים גדולים של אפשרויות ותדרים זה יכול להיות מסורבל. ניתן לפשט את החישובים באמצעות תכונות הפיזור.

לפיזור יש את המאפיינים הבאים.

1. הפחתה או הגדלת משקלים (תדרים) של מאפיין משתנה במספר מסוים של פעמים אינה משנה את הפיזור.

2. הקטן או הגדל כל ערך של מאפיין באותה כמות קבועה אלא משנה את הפיזור.

3. הקטן או הגדל כל ערך תכונה במספר מסוים של פעמים קבהתאמה מפחית או מגדיל את השונות ב ק 2 פעמים סטיית תקן  פנימה קפַּעַם.

4. הפיזור של מאפיין ביחס לערך שרירותי תמיד גדול מהפיזור ביחס לממוצע האריתמטי לריבוע של ההפרש בין הערך הממוצע והשרירותי:

אם א 0, אז נגיע לשוויון הבא:

כלומר השונות של המאפיין שווה להפרש בין הריבוע הממוצע של הערכים האופייניים לריבוע הממוצע.

ניתן להשתמש בכל מאפיין באופן עצמאי או בשילוב עם אחרים בעת חישוב השונות.

ההליך לחישוב השונות הוא פשוט:

1) לקבוע ממוצע אריתמטי :

2) בריבוע הממוצע האריתמטי:

3) בריבוע הסטייה של כל וריאנט של הסדרה:

איקס אני 2 .

4) מצא את סכום הריבועים של האפשרויות:

5) חלקו את סכום הריבועים של האפשרויות במספרם, כלומר קבעו את הריבוע הממוצע:

6) קבע את ההבדל בין הריבוע הממוצע של המאפיין לריבוע הממוצע:

דוגמה 3.1הנתונים הבאים זמינים על פרודוקטיביות עובדים:

בואו נעשה את החישובים הבאים:

פיזור בסטטיסטיקה מוגדר כסטיית התקן של ערכים בודדים של מאפיין בריבוע מהממוצע האריתמטי. שיטה נפוצה לחישוב הסטיות בריבוע של אופציות מהממוצע עם הממוצע שלהן לאחר מכן.

בניתוח סטטיסטי כלכלי, נהוג להעריך את השונות של מאפיין לרוב באמצעות סטיית התקן היא השורש הריבועי של השונות.

(3)

מאפיין את התנודה המוחלטת של הערכים של מאפיין משתנה ומתבטא באותן יחידות מדידה כמו האפשרויות. בסטטיסטיקה, לעתים קרובות יש צורך להשוות את השונות של מאפיינים שונים. עבור השוואות כאלה, נעשה שימוש במדד יחסי של שונות, מקדם השונות.

תכונות פיזור:

1) אם תפחית מספר כלשהו מכל האפשרויות, השונות לא תשתנה;

2) אם כל ערכי האופציה מחולקים במספר b כלשהו, ​​השונות תקטן פי b^2, כלומר.

3) אם תחשב את הריבוע הממוצע של סטיות ממספר כלשהו עם ממוצע אריתמטי לא שווה, אז הוא יהיה גדול מהשונות. יחד עם זאת, לפי ערך מוגדר היטב לריבוע של ההפרש בין הערך הממוצע ג.

ניתן להגדיר פיזור כהבדל בין הממוצע בריבוע לממוצע בריבוע.

17. וריאציות קבוצתיות ובין קבוצות. כלל הוספת שונות

אם אוכלוסייה סטטיסטית מחולקת לקבוצות או לחלקים לפי המאפיין הנחקר, אזי ניתן לחשב את סוגי הפיזור הבאים עבור אוכלוסייה כזו: קבוצה (פרטית), ממוצע קבוצתי (פרטי) ובינקבוצתי.

שונות מוחלטת– משקף את השונות של מאפיין עקב כל התנאים והגורמים הפועלים באוכלוסייה סטטיסטית נתונה.

שונות קבוצתית- שווה לריבוע הממוצע של סטיות של ערכים בודדים של מאפיין בתוך קבוצה מהממוצע האריתמטי של קבוצה זו, הנקרא ממוצע הקבוצה. עם זאת, ממוצע הקבוצה אינו עולה בקנה אחד עם הממוצע הכולל של כלל האוכלוסייה.

שונות קבוצתית משקפת את השונות של תכונה רק עקב תנאים וגורמים הפועלים בתוך הקבוצה.

ממוצע של שונות קבוצתית- מוגדר כממוצע האריתמטי המשוקלל של שונות הקבוצה, כאשר המשקולות הן נפחי הקבוצה.

שונות בין קבוצות- שווה לריבוע הממוצע של סטיות של ממוצעי הקבוצה מהממוצע הכולל.

פיזור בין קבוצות מאפיין את השונות של המאפיין המתקבל עקב מאפיין הקיבוץ.

קיים קשר מסוים בין סוגי הפיזור הנחשבים: סך הפיזור שווה לסכום הממוצע של הקבוצה והפיזור הבין-קבוצתי.

קשר זה נקרא כלל הוספת השונות.

18. סדרה דינמית ומרכיביה. סוגי סדרות זמן.

שורה בסטטיסטיקה- מדובר בנתונים דיגיטליים המציגים את השינוי של תופעה בזמן או במרחב ומאפשרים לבצע השוואה סטטיסטית של תופעות הן בתהליך התפתחותן בזמן והן בצורות וסוגים שונים של תהליכים. הודות לכך, ניתן לזהות את התלות ההדדית של תופעות.

בסטטיסטיקה, תהליך התפתחות התנועה של תופעות חברתיות לאורך זמן נקרא בדרך כלל דינמיקה. כדי להציג דינמיקה, נבנות סדרות דינמיות (כרונולוגיות, זמן), שהן סדרות של ערכים משתנים בזמן של אינדיקטור סטטיסטי (לדוגמה, מספר המורשעים מעל 10 שנים), מסודרים בסדר כרונולוגי. המרכיבים המרכיבים שלהם הם הערכים הדיגיטליים של אינדיקטור נתון והתקופות או נקודות הזמן שאליהן הם מתייחסים.

המאפיין החשוב ביותר של סדרות דינמיקה- גודלם (נפח, גודל) של תופעה מסוימת שהושגה בתקופה מסוימת או ברגע מסוים. בהתאם, גודל המונחים של סדרת הדינמיקה הוא רמתה. לְהַבחִיןהרמות הראשוניות, האמצעיות והאחרונות של הסדרה הדינמית. שלב ראשוןמציג את הערך של הראשון, הסופי - הערך של האיבר האחרון של הסדרה. רמה ממוצעתמייצג את טווח השונות הכרונולוגי הממוצע ומחושב בהתאם אם הסדרה הדינמית היא מרווח או רגעי.

מאפיין חשוב נוסף של הסדרה הדינמית- הזמן שחלף מהתצפית הראשונית ועד התצפית האחרונה, או מספר התצפיות הללו.

ישנם סוגים שונים של סדרות זמן שניתן לסווג אותם לפי הקריטריונים הבאים.

1) בהתאם לשיטת הביטוי של הרמות, סדרות הדינמיקה מחולקות לסדרות של אינדיקטורים מוחלטים ונגזרת (ערכים יחסיים וממוצעים).

2) בהתאם לאופן שבו רמות הסדרה מבטאות את מצב התופעה בנקודות זמן מסוימות (בתחילת חודש, רבעון, שנה וכו') או ערכה על פני מרווחי זמן מסוימים (לדוגמה, ליום, חודש, שנה וכו') וכו'), להבחין בין סדרות דינמיקה של רגע ואינטרוול, בהתאמה. סדרות רגעים משמשות לעתים רחוקות יחסית בעבודה האנליטית של רשויות אכיפת החוק.

בתיאוריה הסטטיסטית דינמיקה מובחנת על פי מספר קריטריונים לסיווג נוספים: בהתאם למרחק בין רמות - עם רמות שוות ורמות לא שוות בזמן; בהתאם לנוכחות הנטייה העיקרית של התהליך הנלמד - נייח ולא נייח. כאשר מנתחים סדרות זמן, הם יוצאים מהשלבים הבאים הרמות של הסדרה מוצגות בצורה של רכיבים:

Y t = TP + E (t)

כאשר TP הוא מרכיב דטרמיניסטי שקובע את הנטייה הכללית לשינוי לאורך זמן או מגמה.

E (t) הוא מרכיב אקראי הגורם לתנודות ברמות.

סוגי פיזור:

שונות מוחלטתמאפיין את השונות של מאפיין של כלל האוכלוסייה בהשפעת כל אותם גורמים שגרמו לשונות זו. ערך זה נקבע על ידי הנוסחה

היכן הממוצע האריתמטי הכולל של כל האוכלוסייה הנבדקת.

שונות ממוצעת בתוך הקבוצהמצביע על וריאציה אקראית שעלולה להיווצר בהשפעת גורמים שאינם מטופלים ואינה תלויה בתכונת הגורם המהווה את הבסיס לקיבוץ. השונות הזו מחושבת באופן הבא: ראשית, השונות עבור קבוצות בודדות מחושבות (), לאחר מכן מחושבת השונות הממוצעת בתוך הקבוצה:

כאשר n i הוא מספר היחידות בקבוצה

שונות בין קבוצות(שונות של אמצעים קבוצתיים) מאפיין שונות שיטתית, כלומר. הבדלים בערך המאפיין הנחקר המתעוררים בהשפעת סימן הגורם, המהווה את הבסיס לקיבוץ.

איפה הערך הממוצע לקבוצה נפרדת.

כל שלושת סוגי השונות קשורים זה לזה: השונות הכוללת שווה לסכום השונות הממוצעת בתוך הקבוצה והשונות בין הקבוצות:

נכסים:

25 מדדים יחסיים של שונות

מקדם תנודה

סטייה ליניארית יחסית

מקדם השונות

Coef. Osc. Oמשקף את התנודה היחסית של ערכים קיצוניים של מאפיין סביב הממוצע. Rel. לין. כבוי. מאפיין את הפרופורציה של הערך הממוצע של סימן הסטיות המוחלטות מהערך הממוצע. Coef. וריאציה היא המדד הנפוץ ביותר לשונות המשמש להערכת האופייניות של ממוצעים.

בסטטיסטיקה, אוכלוסיות בעלות מקדם שונות גדול מ-30-35% נחשבות להטרוגניות.

    סדירות סדרות הפצה. רגעי הפצה. מחווני צורת התפלגות

בסדרות וריאציות יש קשר בין התדרים לערכי המאפיין המשתנה: עם עלייה במאפיין, ערך התדר עולה תחילה לגבול מסוים ולאחר מכן יורד. שינויים כאלה נקראים דפוסי הפצה.

צורת ההתפלגות נחקרת באמצעות אינדיקטורים של עקמת וקורטוזיס. בעת חישוב אינדיקטורים אלה, נעשה שימוש ברגעי התפלגות.

מומנט הסדר ה-k הוא הממוצע של דרגות ה-kth של סטייה של ערכי וריאציה של מאפיין מערך קבוע כלשהו. סדר הרגע נקבע לפי הערך של k. כאשר מנתחים סדרות וריאציות, מוגבלים לחישוב הרגעים של ארבעת הסדרים הראשונים. בעת חישוב מומנטים, ניתן להשתמש בתדרים או בתדרים כשקולות. בהתאם לבחירת הערך הקבוע, מובחנים רגעים ראשוניים, מותנים ומרכזיים.

אינדיקטורים של טופס הפצה:

אָסִימֵטְרִיָה(As) מחוון המאפיין את מידת אסימטריית ההתפלגות .

לכן, עם אסימטריה שלילית (צד שמאל). . עם אסימטריה חיובית (בצד ימין). .

ניתן להשתמש ברגעים מרכזיים לחישוב אסימטריה. לאחר מכן:

,

איפה μ 3 - רגע מרכזי מסדר שלישי.

- קורטוזיס (E ל ) מאפיין את התלולות של גרף הפונקציות בהשוואה להתפלגות הנורמלית באותה חוזק וריאציה:

,

כאשר μ 4 הוא הרגע המרכזי של הסדר הרביעי.

    חוק הפצה רגילה

עבור התפלגות נורמלית (התפלגות גאוסית), לפונקציית ההתפלגות יש את הצורה הבאה:

תוחלת - סטיית תקן

ההתפלגות הנורמלית היא סימטרית ומאופיינת בקשר הבא: Xav=Me=Mo

הקורטוזיס של התפלגות נורמלית הוא 3, ומקדם ההטיה הוא 0.

עקומת ההתפלגות הנורמלית היא מצולע (קו ישר סימטרי בצורת פעמון)

    סוגי פיזור. הכלל להוספת שונות. מהות מקדם הקביעה האמפירי.

אם האוכלוסייה המקורית מחולקת לקבוצות לפי מאפיין משמעותי כלשהו, ​​אזי מחושבים סוגי השונות הבאים:

    השונות הכוללת של האוכלוסייה המקורית:

היכן הערך הממוצע הכולל של האוכלוסייה המקורית f הוא התדירות של האוכלוסייה המקורית. פיזור מוחלט מאפיין את הסטייה של ערכים בודדים של מאפיין מהערך הממוצע הכולל של האוכלוסייה המקורית.

    שונות בתוך הקבוצה:

כאשר j הוא המספר של הקבוצה הוא הערך הממוצע בכל קבוצה j-ה; שונות בתוך הקבוצה מאפיינת את הסטייה של הערך האישי של תכונה בכל קבוצה מהערך הממוצע של הקבוצה. מכל השונות בתוך הקבוצה, הממוצע מחושב באמצעות הנוסחה:, היכן הוא מספר היחידות בכל קבוצה j-th.

    שונות בין קבוצות:

פיזור בין קבוצות מאפיין את הסטייה של ממוצעי הקבוצה מהממוצע הכולל של האוכלוסייה המקורית.

כלל הוספת שונותהוא שהשונות הכוללת של האוכלוסייה המקורית צריכה להיות שווה לסכום השונות בין הקבוצה והממוצע של השונות בתוך הקבוצה:

מקדם קביעה אמפירימראה את שיעור השונות במאפיין הנחקר עקב שונות במאפיין הקיבוץ ומחושב באמצעות הנוסחה:

    שיטת ספירה מאפס מותנה (שיטת הרגעים) לחישוב הערך הממוצע והשונות

חישוב הפיזור בשיטת המומנטים מבוסס על השימוש בנוסחה ובמאפיינים 3 ו-4 של פיזור.

(3. אם כל הערכים של התכונה (אפשרויות) יוגדלו (יפחתו) במספר קבוע כלשהו A, אז השונות של האוכלוסייה החדשה לא תשתנה.

4. אם כל הערכים של התכונה (אפשרויות) מוגדלים (מכפילים) פי K, כאשר K הוא מספר קבוע, השונות של האוכלוסייה החדשה תגדל (תפחת) פי K פי 2.)

אנו מקבלים נוסחה לחישוב פיזור בסדרות וריאציות עם מרווחים שווים בשיטת המומנטים:

A - אפס מותנה, שווה לאופציה עם התדר המקסימלי (אמצע המרווח עם התדר המקסימלי)

חישוב הערך הממוצע בשיטת המומנטים מבוסס גם הוא על השימוש במאפייני הממוצע.

    הרעיון של התבוננות סלקטיבית. שלבי לימוד תופעות כלכליות בשיטת דגימה

תצפית מדגם היא תצפית שבה לא נבדקות ונחקרות כל יחידות האוכלוסייה המקורית, אלא רק חלק מהיחידות, ותוצאת הבדיקה של חלק מהאוכלוסייה חלה על כלל האוכלוסייה המקורית. האוכלוסייה שממנה נבחרות יחידות להמשך בחינה ולימוד נקראת כלליוכל האינדיקטורים המאפיינים את המכלול הזה נקראים כללי.

גבולות אפשריים של סטיות של ממוצע המדגם מהממוצע הכללי נקראים שגיאת דגימה.

קבוצת היחידות שנבחרו נקראת סֶלֶקטִיבִיוכל האינדיקטורים המאפיינים את המכלול הזה נקראים סֶלֶקטִיבִי.

מחקר לדוגמה כולל את השלבים הבאים:

מאפייני מושא המחקר (תופעות כלכליות המוניות). אם האוכלוסייה קטנה, אזי הדגימה אינה מומלצת;

חישוב גודל לדוגמה. חשוב לקבוע את הנפח האופטימלי שיאפשר לשגיאת הדגימה להיות בטווח המקובל בעלות הנמוכה ביותר;

בחירת יחידות תצפית תוך התחשבות בדרישות האקראיות והמידתיות.

עדות לייצוגיות המבוססת על אומדן של טעות דגימה. עבור מדגם אקראי, השגיאה מחושבת באמצעות נוסחאות. עבור מדגם היעד, ייצוגיות מוערכת באמצעות שיטות איכותניות (השוואה, ניסוי);

ניתוח אוכלוסיית המדגם. אם המדגם שנוצר עומד בדרישות הייצוגיות, הוא מנותח באמצעות אינדיקטורים אנליטיים (ממוצע, יחסי וכו')

שונות היא מדד לפיזור המתאר את הסטייה ההשוואתית בין ערכי הנתונים והממוצע. זהו המדד הנפוץ ביותר לפיזור בסטטיסטיקה, המחושב על ידי סיכום וריבוע של הסטייה של כל ערך נתונים מהממוצע. הנוסחה לחישוב השונות ניתנת להלן:

s 2 - שונות מדגם;

x av—ממוצע מדגם;

נגודל מדגם (מספר ערכי נתונים),

(x i – x avg) היא הסטייה מהערך הממוצע עבור כל ערך של מערך הנתונים.

כדי להבין טוב יותר את הנוסחה, בואו נסתכל על דוגמה. אני לא ממש אוהב לבשל, ​​אז אני עושה את זה לעתים רחוקות. עם זאת, כדי לא לגווע ברעב, מדי פעם אני צריך ללכת לכיריים כדי ליישם את תוכנית הרוויה של הגוף שלי בחלבונים, שומנים ופחמימות. מערך הנתונים שלהלן מראה כמה פעמים רנט מבשלת מדי חודש:

השלב הראשון בחישוב השונות הוא קביעת ממוצע המדגם, שבדוגמה שלנו הוא 7.8 פעמים בחודש. ניתן להקל על שאר החישובים באמצעות הטבלה הבאה.

השלב האחרון של חישוב השונות נראה כך:

למי שאוהב לעשות את כל החישובים במכה אחת, המשוואה תיראה כך:

שימוש בשיטת הספירה הגולמית (דוגמה לבישול)

יש דרך יעילה יותר לחישוב שונות, המכונה שיטת הספירה הגולמית. למרות שהמשוואה עשויה להיראות די מסורבלת במבט ראשון, היא למעשה לא כל כך מפחידה. אתה יכול לוודא זאת, ולאחר מכן להחליט איזו שיטה אתה הכי אוהב.

הוא הסכום של כל ערך נתונים לאחר ריבוע,

הוא הריבוע של סכום כל ערכי הנתונים.

אל תאבד את דעתך עכשיו. בוא נשים את כל זה לטבלה ותראה שיש כאן פחות חישובים מאשר בדוגמה הקודמת.

כפי שאתה יכול לראות, התוצאה הייתה זהה לשיטה הקודמת. היתרונות של שיטה זו מתגלים ככל שגודל המדגם (n) גדל.

חישוב שונות באקסל

כפי שבטח כבר ניחשתם, לאקסל יש נוסחה המאפשרת לכם לחשב שונות. יתרה מכך, החל מ-Excel 2010, אתה יכול למצוא 4 סוגים של נוסחת שונות:

1) VARIANCE.V - מחזירה את השונות של המדגם. מתעלמים מערכים בוליאניים ומטקסט.

2) DISP.G - מחזירה את השונות של האוכלוסייה. מתעלמים מערכים בוליאניים ומטקסט.

3) VARIANCE - מחזירה את השונות של המדגם, תוך התחשבות בערכי בוליאניים וטקסט.

4) VARIANCE - מחזירה את השונות של האוכלוסייה, תוך התחשבות בערכים לוגיים וטקסטים.

ראשית, בואו נבין את ההבדל בין מדגם לאוכלוסייה. מטרת הסטטיסטיקה התיאורית היא לסכם או להציג נתונים כך שתקבל במהירות את התמונה הגדולה, סקירה כללית כביכול. הסקה סטטיסטית מאפשרת להסיק מסקנות לגבי אוכלוסייה על סמך מדגם של נתונים מאותה אוכלוסייה. האוכלוסייה מייצגת את כל התוצאות או המדידות האפשריות שמעניינים אותנו. מדגם הוא תת-קבוצה של אוכלוסייה.

לדוגמה, אנו מעוניינים בקבוצת סטודנטים מאחת האוניברסיטאות הרוסיות ועלינו לקבוע את הציון הממוצע של הקבוצה. נוכל לחשב את הביצועים הממוצעים של התלמידים, ואז הנתון שיתקבל יהיה פרמטר, שכן כל האוכלוסייה תהיה מעורבת בחישובים שלנו. עם זאת, אם ברצוננו לחשב את ה-GPA של כל התלמידים בארצנו, אז קבוצה זו תהיה המדגם שלנו.

ההבדל בנוסחה לחישוב השונות בין מדגם לאוכלוסייה הוא המכנה. איפה עבור המדגם הוא יהיה שווה ל-(n-1), ולאוכלוסיה הכללית רק n.

כעת נסתכל על הפונקציות לחישוב שונות עם סיומות א,התיאור שלו קובע כי טקסט וערכים לוגיים נלקחים בחשבון בחישוב. במקרה זה, בעת חישוב השונות של מערך נתונים מסוים שבו מתרחשים ערכים לא מספריים, Excel יפרש טקסט וערכים בוליאניים כוזבים כשווים ל-0, וערכים בוליאניים אמיתיים כשווים ל-1.

לכן, אם יש לך מערך נתונים, חישוב השונות שלו לא יהיה קשה באמצעות אחת מהפונקציות של Excel המפורטות לעיל.

טווח וריאציות (או טווח וריאציות) -זה ההבדל בין ערכי המקסימום והמינימום של המאפיין:

בדוגמה שלנו, טווח השונות בתפוקת המשמרות של עובדים הוא: בחטיבה הראשונה R = 105-95 = 10 ילדים, בחטיבה השנייה R = 125-75 = 50 ילדים. (פי 5 יותר). זה מצביע על כך שהתפוקה של חטיבה 1 יותר "יציבה", אבל לחטיבה השנייה יש יותר עתודות להגדלת התפוקה, מכיוון אם כל העובדים מגיעים לתפוקה המקסימלית עבור חטיבה זו, היא יכולה לייצר 3 * 125 = 375 חלקים, ובחטיבה 1 רק 105 * 3 = 315 חלקים.
אם הערכים הקיצוניים של מאפיין אינם אופייניים לאוכלוסייה, אז נעשה שימוש בטווחי רבעונים או עשירונים. טווח הרבעונים RQ= Q3-Q1 מכסה 50% מנפח האוכלוסייה, טווח העשירון הראשון RD1 = D9-D1 מכסה 80% מהנתונים, טווח העשירון השני RD2= D8-D2 – 60%.
החיסרון של מחוון טווח השונות הוא שערכו אינו משקף את כל התנודות של התכונה.
האינדיקטור הכללי הפשוט ביותר המשקף את כל התנודות של מאפיין הוא סטייה ליניארית ממוצעת, שהוא הממוצע האריתמטי של הסטיות המוחלטות של אופציות בודדות מערכן הממוצע:

,
עבור נתונים מקובצים
,
כאשר xi הוא הערך של התכונה בסדרה בדידה או אמצע המרווח בהתפלגות המרווחים.
בנוסחאות לעיל, ההבדלים במונה נלקחים מודולו, אחרת, לפי המאפיין של הממוצע האריתמטי, המונה תמיד יהיה שווה לאפס. לכן, הסטייה הליניארית הממוצעת משמשת רק לעתים נדירות בפרקטיקה הסטטיסטית, רק במקרים שבהם אינדיקטורים לסיכום מבלי לקחת בחשבון את הסימן הגיוני כלכלי. בעזרתו, למשל, מנתחים את הרכב כוח העבודה, רווחיות הייצור ומחזור סחר החוץ.
שונות של תכונההוא הריבוע הממוצע של סטיות מערכם הממוצע:
שונות פשוטה
,
השונות משוקללת
.
ניתן לפשט את הנוסחה לחישוב השונות:

לפיכך, השונות שווה להפרש בין ממוצע הריבועים של האופציה לריבוע הממוצע של אפשרות האוכלוסייה:
.
עם זאת, בשל סיכום הסטיות בריבוע, השונות נותנת מושג מעוות על הסטיות, ולכן הממוצע מחושב על פיה סטיית תקן, המראה עד כמה בממוצע גרסאות ספציפיות של תכונה חורגות מהערך הממוצע שלהן. מחושב על ידי נטילת השורש הריבועי של השונות:
עבור נתונים לא מקובצים
,
לסדרות וריאציות

ככל שערך השונות וסטיית התקן קטן יותר, ככל שהאוכלוסייה הומוגנית יותר, כך הערך הממוצע יהיה אמין יותר (אופייני).
סטיית תקן לינארית ממוצעת נקראים מספרים, כלומר הם מבוטאים ביחידות מדידה של מאפיין, זהים בתוכן וקרובים במשמעותם.
מומלץ לחשב וריאציות מוחלטות באמצעות טבלאות.
טבלה 3 - חישוב מאפייני וריאציה (באמצעות דוגמה של תקופת הנתונים על תפוקת המשמרות של עובדי הצוות)


מספר עובדים

אמצע המרווח

ערכים מחושבים

סה"כ:

תפוקת משמרות ממוצעת של עובדים:

סטייה ליניארית ממוצעת:

שונות ייצור:

סטיית התקן של התפוקה של עובדים בודדים מהתפוקה הממוצעת:
.

1 חישוב פיזור בשיטת המומנטים

חישוב שונות כרוך בחישובים מסורבלים (במיוחד אם הממוצע מבוטא כמספר גדול עם מספר מקומות עשרוניים). ניתן לפשט את החישובים על ידי שימוש בנוסחה פשוטה ותכונות פיזור.
לפיזור יש את המאפיינים הבאים:

  1. אם כל הערכים של מאפיין מופחתים או מוגדלים באותו ערך A, אז הפיזור לא יקטן:

,

, אז או
באמצעות תכונות הפיזור ותחילה צמצום כל הווריאציות של האוכלוסייה בערך A, ולאחר מכן מחלקים בערך של המרווח h, נקבל נוסחה לחישוב פיזור בסדרות וריאציות עם מרווחים שווים דרך של רגעים:
,
היכן מחושב הפיזור בשיטת המומנטים;
h - ערך המרווח של סדרת הווריאציות;
- אפשרות ערכים חדשה (משונה);
A הוא ערך קבוע, המשמש כאמצע המרווח עם התדר הגבוה ביותר; או האפשרות עם התדירות הגבוהה ביותר;
- ריבוע של רגע הסדר הראשון;
- רגע מהסדר השני.
הבה נחשב את הפיזור בשיטת הרגעים על סמך נתונים על תפוקת המשמרות של עובדי הצוות.
טבלה 4 - חישוב השונות בשיטת המומנטים


קבוצות של עובדי ייצור, יח'.

מספר עובדים

אמצע המרווח

ערכים מחושבים

הליך חישוב:


  1. אנו מחשבים את השונות:

2 חישוב השונות של מאפיין חלופי

בין המאפיינים הנלמדים על ידי הסטטיסטיקה, יש גם כאלה שיש להם רק שתי משמעויות סותרות זו את זו. אלו סימנים חלופיים. הם ניתנים, בהתאמה, שני ערכים כמותיים: אפשרויות 1 ו-0. התדירות של אפשרות 1, המסומנת ב-p, היא שיעור היחידות בעלות מאפיין זה. ההפרש 1-р=q הוא תדירות האפשרויות 0. לפיכך,


xi

ממוצע אריתמטי של הסימן החלופי
, כי p+q=1.

שונות תכונה חלופית
, כי 1-р=q
לפיכך, השונות של מאפיין חלופי שווה למכפלת שיעור היחידות בעלות מאפיין זה ושיעור היחידות שאינן בעלות מאפיין זה.
אם הערכים 1 ו-0 מתרחשים בתדירות שווה, כלומר p=q, השונות מגיעה ל-pq=0.25 המקסימלית.
השונות של תכונה חלופית משמשת בסקרים לדוגמה, למשל, לגבי איכות המוצר.

3 שונות בין קבוצות. כלל הוספת שונות

פיזור, בניגוד למאפיינים אחרים של וריאציה, הוא כמות תוסף. כלומר, במצטבר, שמחולק לקבוצות לפי מאפייני גורם איקס , שונות של המאפיין המתקבל yניתן לפרק לשונות בתוך כל קבוצה (בתוך קבוצות) ולשונות בין קבוצות (בין קבוצות). לאחר מכן, יחד עם לימוד השונות של תכונה בכל האוכלוסייה כולה, ניתן ללמוד את השונות בכל קבוצה, כמו גם בין קבוצות אלו.

שונות מוחלטתמודד שונות בתכונה בְּ-בשלמותו בהשפעת כל הגורמים שגרמו לשונות זו (סטיות). זה שווה לסטיית הריבוע הממוצעת של ערכים בודדים של התכונה בְּ-מהממוצע הגדול וניתן לחשב אותה כשונות פשוטה או משוקללת.
שונות בין קבוצותמאפיין את הווריאציה של התכונה המתקבלת בְּ-נגרם מהשפעת סימן הגורם איקס, שהיוו את הבסיס להתקבצות. הוא מאפיין את השונות של ממוצעי הקבוצה ושווה לריבוע הממוצע של סטיות של ממוצעי הקבוצה מהממוצע הכולל:
,
היכן הממוצע האריתמטי של הקבוצה ה-i;
- מספר יחידות בקבוצה ה-i (תדירות הקבוצה ה-i);
- הממוצע הכולל של האוכלוסייה.
שונות בתוך הקבוצהמשקף וריאציה אקראית, כלומר אותו חלק מהווריאציה שנגרם מהשפעתם של גורמים לא ברורים ואינו תלוי בתכונת הגורם המהווה את הבסיס לקיבוץ. הוא מאפיין את השונות של ערכים בודדים ביחס לממוצעים קבוצתיים ושווה לסטיית הריבוע הממוצעת של ערכים בודדים של התכונה בְּ-בתוך קבוצה מהממוצע האריתמטי של קבוצה זו (ממוצע קבוצתי) ומחושב כשונות פשוטה או משוקללת עבור כל קבוצה:
אוֹ ,
היכן מספר היחידות בקבוצה.
בהתבסס על השונות בתוך הקבוצה עבור כל קבוצה, ניתן לקבוע הממוצע הכולל של שונות בתוך הקבוצה:
.
הקשר בין שלושת הפיזור נקרא כללים להוספת שונות, לפיו השונות הכוללת שווה לסכום השונות בין הקבוצות והממוצע של השונות בתוך הקבוצה:

דוגמא. כאשר בוחנים את השפעת קטגוריית התעריפים (הכשרה) של עובדים על רמת הפריון של עבודתם, התקבלו הנתונים הבאים.
לוח 5 - התפלגות העובדים לפי תפוקה שעתית ממוצעת.



עמ

עובדים מהקטגוריה הרביעית

עובדי קטגוריה 5

תְפוּקָה
עובד, יחידות,

תְפוּקָה
עובד, יחידות,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

בדוגמה זו, העובדים מחולקים לשתי קבוצות על פי מאפייני הגורמים איקס– כישורים, המתאפיינים בדרגתם. התכונה המתקבלת - ייצור - משתנה הן בהשפעתה (וריאציה בין קבוצות) והן בשל גורמים אקראיים אחרים (וריאציה תוך קבוצתית). המטרה היא למדוד את הווריאציות הללו באמצעות שלוש שונות: סך הכל, בין קבוצות ובתוך קבוצות. מקדם הקביעה האמפירי מראה את שיעור השונות במאפיין המתקבל בְּ-בהשפעת סימן גורם איקס. שאר הווריאציה הכוללת בְּ-נגרם כתוצאה משינויים בגורמים אחרים.
בדוגמה, מקדם הקביעה האמפירי הוא:
או 66.7%,
המשמעות היא ש-66.7% מהשונות בפריון העובדים נובעת מהבדלים בכישורים, ו-33.3% נובעת מהשפעת גורמים אחרים.
קשר מתאם אמפירימראה את הקשר ההדוק בין קיבוץ ומאפייני ביצוע. מחושב כשורש הריבועי של מקדם הקביעה האמפירי:

יחס המתאם האמפירי, כמו , יכול לקחת ערכים מ-0 ל-1.
אם אין קשר, אז =0. במקרה זה =0, כלומר, האמצעים הקבוצתיים שווים זה לזה ואין וריאציה בין קבוצות. המשמעות היא שמאפיין הקיבוץ - גורם אינו משפיע על היווצרות וריאציה כללית.
אם החיבור פונקציונלי, אז =1. במקרה זה, השונות של אמצעי הקבוצה שווה לסך השונות (), כלומר, אין וריאציה בתוך הקבוצה. משמעות הדבר היא שמאפיין הקיבוץ קובע לחלוטין את השונות של המאפיין המתקבל הנלמד.
ככל שערך יחס המתאם קרוב יותר לאחדות, כך הקשר בין המאפיינים קרוב יותר, קרוב יותר לתלות התפקודית.
כדי להעריך באופן איכותי את סמיכות הקשר בין מאפיינים, נעשה שימוש ביחסים של צ'אדוק.

בדוגמה , מה שמעיד על קשר הדוק בין פריון עובדים לכישורים שלהם.



אהבתם את הכתבה? שתף את זה
חלק עליון