סטטיסטיקה
סטטיסטיקה היא תחום ידע הנוגע לאיסוף, עיבוד, ניתוח, והצגת מסקנות מנתונים כמותיים. בתחום שני ענפים מרכזיים: סטטיסטיקה תֵּאוּרִית, וסטטיסטיקה הֵיסֵקִית.
תחום הסטטיסטיקה בכללותו, ובפרט הסטטיסטיקה ההיסקית, נשענים על תורת ההסתברות ובמקרים רבים גם על הנחות פרקטיות. בשל הישענותה על הנחות פרקטיות, יש מחלוקת בין הסטטיסטיקאים לגבי סיווגה של הסטטיסטיקה כענף של המתמטיקה או כענף של מדעי הטבע והחברה.
המדעים הבולטים בהישענותם על הסטטיסטיקה הם פיזיקה סטטיסטית, כימיה סטטיסטית, חלק מתחומי הביולוגיה וחלק נכבד מתחומי הרפואה, מדעי החברה והמחקר הטכנולוגי.
היכולת להבין נתונים סטטיסטיים, נקראת אוריינות סטטיסטית.
רקע
[עריכת קוד מקור | עריכה]במקרים רבים קשה לנתח את האיברים בקבוצה באופן פרטני בשל מספרם הרב, ואז אפשר להתייחס אל הנתונים כמכלול, ולנתחם ככאלה. כאשר מסתכלים על משתנה מסוים (למשל מידת גובה) והופעתו באוכלוסייה מסוימת (למשל ילדי כתה ג' בישראל), מתקבלת התפלגות של משתנה מקרי (הגובה). במקרים רבים ניתן לדגום מדגם שייצג את האוכלוסייה לצורך הסקה סטטיסטית.
הסטטיסטיקה מתחלקת לסטטיסטיקה תיאורית, שמטרתה תיאור של הנתונים על ידי אפיון ממדים שונים בהם, וסטטיסטיקה היסקית, שמטרתה הסקת מסקנות מהמדגם עליו נאספו הנתונים הסטטיסטיים לכל האוכלוסייה.
מדע או מתמטיקה?
[עריכת קוד מקור | עריכה]הסטטיסטיקה לא מכילה כמעט כל ניסויים שהם כשלעצמה (למעט סימולציות מחשב כגון "שיטת מונטה קרלו"). אולם, היא מסיקה על יעילות שיטות המחקר שלה מהצלחת הניסויים להם היא מסייעת בתחומי מדע מגוונים. על כן הסטטיסטיקה יכולה להיחשב למדע.
הכללתה של הסטטיסטיקה בין ענפי המתמטיקה שנויה במחלוקת בין הסטטיסטיקאים. אי הכללת הסטטיסטיקה בין ענפי המתמטיקה נשענת על טיעונים פילוסופיים. הפילוסופים מציינים שיש שלוש דרכים לנתח נתונים ולהגיע למסקנות: לוגיקה, מטאפיזיקה והשכל הישר (Common sense). הטוענים שסטטיסטיקה אינה מתמטיקה גורסים כי מתמטיקה מכילה ניתוחים לוגיים בלבד ואילו הסטטיסטיקה, כמו המדעים, מכילה ניתוחים על פי השכל הישר לצד ניתוחים לוגיים.
לעומתם, אלה הטוענים שהסטטיסטיקה היא כן ענף במתמטיקה מביאים טיעונים מתחום הסוציולוגיה של המדע. הם טוענים שסטטיסטיקאים לומדים בעיקר מתמטיקה ושהפיתוחים המרכזיים בה נעשים בעיקר על ידי מתמטיקאים. מעבר לזאת, אנשים אלה טוענים שהצורך של הסטטיסטיקאים להישען על הנחות השכל הישר במקום על היסקים לוגיים הולך ונחלש עם התפתחות הסטטיסטיקה ובעיקר עם התפתחות הענף הסטטיסטי הקרוי סטטיסטיקה לא פרמטרית.
סטטיסטיקה תיאורית
[עריכת קוד מקור | עריכה]- ערך מורחב – סטטיסטיקה תיאורית
סטטיסטיקה תיאורית היא הענף הסטטיסטי העוסק בתיאור תמציתי ומייצג של מדגמי נתונים גדולים. בבעיה אופיינית מתחום זה יש לתאר את המאפיינים הבסיסיים של מדגם בן אלף ציונים במבחן בתנ"ך. במקום להציג את כולם, אפשר להציג היסטוגרמה. תיאור קצר אף יותר מתקבל אם מוסרים את מדדי האמצע והפיזור הנפוצים: הממוצע וסטיית התקן.
סטטיסטיקה היסקית
[עריכת קוד מקור | עריכה]- ערך מורחב – הסקה סטטיסטית
סטטיסטיקה היסקית עוסקת בניסיון להגיע למסקנות לגבי האוכלוסייה מתוך נתוני המדגם.
- מודלים סטטיסטיים
מודלים סטטיסטיים הם שיטות מתמטיות המאפשרות לגזור מתוך נתוני המדגם נוסחה המאפשרת לנבא את ערכו של המשתנה התלוי בהינתן המשתנים הבלתי-תלויים. מספר המודלים הוא רב מאוד, ותלוי בסולם המדידה של כל אחד מהמשתנים, בקשרים אותם מעוניינים לחקור ובאופי הקשר המשוער בין המשתנים. המודל הפשוט ביותר, וזה הנמצא בשימוש הנרחב ביותר, הוא רגרסיה ליניארית (חד-ממדית) - מודל המאפשר ניבוי של משתנה רציף אחד מתוך משתנה רציף נוסף אחד.
- מבחנים סטטיסטיים
מבחן הוא כלי מתמטי המאפשר לבחון הנחות מסוימות לגבי משתנה אחד או לגבי הקשר בין מספר משתנים. קיים מגוון רב של מבחנים, המותאמים לבדיקת הנחות שונות.
חישוב סטטיסטי
[עריכת קוד מקור | עריכה]לגידול המהיר והמתמשך בכוח החישוב, שהתחיל במחצית השנייה של המאה ה-20, הייתה השפעה משמעותית על שימושי מדע הסטטיסטיקה. מודלים סטטיסטיים מוקדמים היו כמעט תמיד מהסוג של מודלים ליניאריים (כגון אלו המשמשים ברגרסיה קלאסית), אך מחשבים חזקים בשילוב עם אלגוריתמים נומריים מתאימים גרמו לעניין מוגבר במודלים לא ליניאריים (כגון רשתות עצביות), כמו גם יצירת סוגים חדשים, כגון מודלים ליניאריים מוכללים ומודלים רב-שכבתיים. כוח החישוב הגדל הוביל גם לפופולריות ההולכת והגדלה של שיטות אינטנסיביות חישובית המבוססות על דגימה חוזרת כגון מבחני פרמוטציות ו-Bootstrapping, ואילו טכניקות כמו דגימת גיבס הפכו את השימוש במודלים בייסיאנים ליותר מעשיים. למהפכת המחשב היו השלכות על עתיד הסטטיסטיקה, עם דגש חדש על סטטיסטיקה "ניסויית" ו"אמפירית". מספר רב של תוכנות סטטיסטיות (הן כלליות והן ייעודיות) זמינות כיום לשימוש.
דוגמאות ליישומים
[עריכת קוד מקור | עריכה]- מדינות משתמשות בסטטיסטיקה על מנת לאמוד את מספר תושביהן ומצבם, גידולן הדמוגרפי וכדומה, (כחלק ממגמותיהן של מדינות לבקר את המתרחש בתחומיהן על מנת להיטיב, לשלוט ולהתערב בו). בישראל עוסקת בכך הלשכה המרכזית לסטטיסטיקה.
- הכלכלה נעזרת בסטטיסטיקה כדי לאפיין מגמות כלכליות[דרושה הבהרה].
- המדע נעזר רבות בסטטיסטיקה במחקרים תצפיתיים שונים.
- במדעי החברה נעשה שימוש רב בסטטיסטיקה לצורך מחקר (שיטות מחקר כמותניות).
- ארגונים נעזרים בסטטיסטיקה לצורך שיפור ביצועים וקבלת החלטות על-סמך נתונים ועובדות. ניתוח שכזה כולל הן מודיעין עסקי והן בינה עסקית (BI).
- הרפואה משתמשת בסטטיסטיקה לחקר אפידמיולוגי של היבטים שונים של מחלות כמו סיכון יחסי.
תוכנות
[עריכת קוד מקור | עריכה]ראו גם
[עריכת קוד מקור | עריכה]קישורים חיצוניים
[עריכת קוד מקור | עריכה]- ריכוז אתרים סטטיסטיים ברשת, אתר הלשכה המרכזית לסטטיסטיקה
- אתר האיגוד הישראלי לסטטיסטיקה
- פרופ' סהרון רוסט, מהי סטטיסטיקה ובשביל מה זה טוב, סרטון בערוץ "TAUVOD", באתר יוטיוב (אורך: 20:24), 13 בפברואר 2015
- רן לוי, על שקרים, שקרים מתועבים וסטטיסטיקה, באתר "עושים היסטוריה" (שידור של הפודקאסט וטקסט מלא שלו)
- ד"ר אלונה רביב, סטטיסטיקה אפרמטרית - ספר חופשי
- צבי ינאי, החוקיות שבמקריות, מחשבות 54, אוגוסט 1986, עמ' 32–39
- שיטות סטטיסטיות בהנדסה אזרחית
- תוכנות חופשיות לסטטיסטיקה:
- סטטיסטיקה, באתר MathWorld (באנגלית)
- מילון למונחי סטטיסטיקה (1945, 1952), באתר האקדמיה ללשון העברית
- סטטיסטיקה, באתר אנציקלופדיה בריטניקה (באנגלית)
- סטטיסטיקה, דף שער בספרייה הלאומית