» «
סטטיסטיקה
מהי סטטיסטיקה?



סטטיסטיקה היא תחום ידע שבו אוספים ומנתחים מידע כמותי, כדי להסיק מסקנות. כך למשל אוספים נתונים על אזרחי המדינה ומנתחים אותם וכך לומדים על חייהם, עיסוקיהם, מצבם הכלכלי ועוד. או שאוספים את נתוני הקליעה של שחקני כדורסל ואחרי ניתוח מגיעים למסקנות על הבולטים שבהם ואלו שעושים עבודה פחות טובה.

הסטטיסטיקה נחשבת מדע שאינו ניסויי, אך היא משרתת היטב את אנשי המדע. הסטטיסטיקאים משתמשים בכלים מתמטיים כדי לטפל בנתונים שלקוחים במרבית המקרים מהתחומים המדעיים של מדעי הטבע ומדעי החברה ומסייעים לגלות בהם דברים חשובים, שיכולים לתרום מאד.

אך לסטטיסטיקה יש גם מגבלות לא קטנות. למשל בכך שהיא עובדת טוב על מספרים גדולים ודי רע על מספרים קטנים. לדוגמה, הבה נביט על אדם שרגלו האחת בגיגית מים רותחים ורגלו השנייה בגיגית של מים קפואים. על פי הסטטיסטיקה יהיה מצבו טוב, שכן ממוצע החום שבין המים הרותחים והמים הקפואים יהיה נורמלי. עם זאת, ברור לנו שבמציאות אדם כזה יסבול מאד... אולי משום כך היה מי שהעיד שאמר פעם בנג'מין ד'יזראלי, ראש ממשלת בריטניה, "יש שלושה סוגי שקרים: שקרים, שקרים גסים וסטטיסטיקה"...

דוגמה נוספת לבעיה של הסטטיסטיקה היא היכולת לנבא ממדגם קטן על האוכלוסיה כולה. למשל, לא פעם חוזים הסוקרים הפוליטיים את תוצאות הבחירות. הם עושים זאת בעזרת מדגם (קבוצה קטנה שאמורה לייצג את האוכלוסיה כולה). אך לא פעם, עם פרסום תוצאות האמת, מסתבר שהם טעו. ברוב המקרים הסיבה לכך היא שסטטיסטיקה היא מנבא מוגבל ולא תמיד מדויק של המציאות.


הנה הסטטיסטיקה של 24 שעות בעולם כולו:

https://youtu.be/ovHzvkoqiZA?t=16m21s&end=22m36s


סרטון שמדגים כמה שסטטיסטיקה יכולה להטעות כשמבינים ממנה דברים לא נכונים:

http://youtu.be/cKHAfiqHwZc


על הבעיות והסבירות שסטטיסטיקה תטעה:

https://youtu.be/sxYrzzy3cq8
תסוגה לממוצע
מהי רגרסיה לממוצע?



למה סרטי המשך של להיטים קולנועיים לא יצליחו כמו הסרט הראשון?
איך זה שילדיהם של גאונים או כשרונות גדולים לא יהיו מוצלחים כמוהם?
למה ספורטאי לא ישבור ברצף שיאים?

האם ראיתם או קרה פעם משהו מדהים וחשבתם שהוא יקרה שוב, אבל הוא לא חזר על עצמו בפעם הבאה? - ובכן, זה נורמלי וזו תופעה ידועה בשם "תסוגה לממוצע" או רגרסיה לממוצע.

רגרסיה לממוצע היא תופעה מרתקת וטבעית, שמתגלית שוב ושוב בתחומים רבים, הן בטבע והן במעשים ידי אדם. התופעה אומרת שהסבירות של התרחשויות קיצוניות ברצף, זו אחרי זו, היא נמוכה מאד. כלומר, אחרי התרחשות של אירוע קיצוני כלשהו, אם יש קשר חיובי בין ההתרחשויות (מה שנקרא במדע "מתאם סטטיסטי חיובי"), כמעט בוודאות לא יהיה האירוע הבא מסוגו כה קיצוני והוא יהיה קרוב יותר לממוצע.

מי שגילה את התופעה ופרסם אותה בסוף המאה ה-19 היה המדען האנגלי סר פרנסיס גולטון, מי שגילה את המתאם הסטטיסטי וגם אחראי לגילוי עקרון "חוכמת ההמונים". גולטון חקר את הרגרסיה לממוצע בזרעים ובגבהים של הורים וילדים והופתע לגלות כמה התופעה רווחת וכמה היא יכולה להיות שימושית לניבוי דברים כמו מגמות עתידיות בתחומים רבים, או שינויים במצבם של חולים.


הנה הסבר על התסוגה לממוצע:

https://youtu.be/GEmuEWjHr5c


והנה הסבר מילולי:

https://youtu.be/Qw8b_igoMTM
הסתברות
מהי הסתברות?



אי-ודאות היא אחד הדברים שמלווים אותנו בחיים. לא פעם אנו חשים בחוסר וודאות, מכיוון שאין לנו יכולת לחזות את מזג האוויר, תוצאות של אירועי ספורט, או תוצאות של בחירות. למצבים כאלו יש כלי שיכול לסייע - הִסְתַּבְּרוּת (Probability).

הסתברות היא מושג מתמטי שמבטא את הסבירות שמאורע מסוים יתרחש. לעיתים יש לנו מושג מה סביר שיקרה, גם אם איננו יודעים בודאות מה יקרה. תורת ההסתברות מכמתת את "הסביר" ומודדת אותו באופן מדויק.

מדידת הסתברות של מאורע מסוים היא בסקאלה שבין 0 ל־1. מאורע בלתי אפשרי מקבל הסתברות 0, בעוד הסתברות 1 ניתנת למאורע שיש ודאות מוחלטת שיקרה. לעיתים קורה שמשתמשים באחוזים, בין 0% ל־100%, כדי לבטא הסתברות.

היסטורית יש להסתברות עבר ארוך. עוד במאה ה-16 עסקו בחישובי הסתברויות. מאז הלך הענף הזה במתמטיקה והתפתח, כשהשימוש בו מסייע בתחומי הכלכלה, העסקים, ההימורים ועוד. כך למשל קובעות חברות ביטוח את מחיר ביטוח החיים על פי ההסתברות שהמבוטח ייפגע או ימות במהלך תקופת הביטוח. חזאי מזג אוויר בוחנים את ההסתברות לגשם, בכדי להציע תחזית אמינה. מהמרים נעזרים בחישובים כדי לדעת את הסיכויים שיזכו בהגרלות או משחקים וכך הלאה.


הנה סרטון (מתורגם) על הדרך שבה ניתן לראות הסתברות:

https://youtu.be/Kgudt4PXs28


והדגמת ההסתברות דרך ניחושים (מתורגם):

https://youtu.be/3V2omKRX9gc
אינפוגרפיקה
למה משתמשים באינפוגרפיקה?



ויזואליות עובדת הרבה יותר טוב מרשימות ארוכות של טקסט.

אינפוגרפיקה (Infographic) היא המחשת מידע (הדגמה) בעזרת אמצעים גרפיים מגוונים, כמו איורים, תמונות, אנימציה, גרפים, תרשימי זרימה ועוד. שיטת האינפוגרפיקה משמשת להצגה פשוטה ומובנת יותר של תהליכים שונים, מידע מורכב וכבד, רצף אירועים וכדומה. המבוגרים, שאוהבים מילים קשות ומרשימות בלועזית, היו אומרים שהאינפוגרפיקה היא סוג של ויזואליזציה (המחשה ויזואלית) המלווה בהסברים טקסטואליים.

לתחום האינפוגרפיקה יש שורשים עתיקים, שמגיעים עד התרבות של סין העתיקה. בעידן המודרני נחשב פרופסור בשם אדוארד טאפטי לאבי האינפוגראפיקה היישומית המודרנית.

בשנים האחרונות הולכת האינפוגרפיקה ונעשית פופולארית. שילוב אינפוגרפיקה באינטרנט, ובמאמרים בעיתונות הפך נפוץ ושכיח מאד. כולנו הרי יודעים שפעמים רבות היכולת של איור או צילום להמחיש רעיון מורכב, או לסייע ביצירתיות וחשיבה יצירתית, היא טובה הרבה יותר מפסקאות ארוכות של מלל. הרי הסבים והסבתות שלנו כבר אמרו ש"תמונה טובה מאלף מילים"..


הנה הסבר המושג אינפוגרפיקה:

https://youtu.be/M3fBmZR2fTU


אוסף של אינפוגרפיקות מהממות בנושאים שונים:

https://youtu.be/9z3jhIeX7Vc


באנימציה:

https://youtu.be/zbTYyl7WVd8


שימוש באינפוגרפיקה לסרטון הדרכה:

https://youtu.be/VCG_L5jEX0c


וכך מציגים מדינה באמצעות אינפוגרפיקה:

https://youtu.be/i9vzQJylSFg


או תפוח:

https://youtu.be/rzRZPAnJU1Q

סטטיסטיקה

שפות
מהן השפות שהכי הרבה אנשים מדברים בהן?



יש בעולם מעל 6500 שפות שונות.

מביניהן, השפות הכי מדוברות בעולם הן סינית, אנגלית, ספרדית, ערבית ורוסית. כמות האנשים שמדברים שפות אלה היא הגדולה ביותר מכל שפה אחרת. סין היא המדינה בעלת האוכלוסיה הגדולה בעולם ולכן הסינית היא השפה שמספרית הכי הרבה מדברים בה. אנגלית הפכה במאה ה-20 לשפה הבינלאומית המנצחת ולכן רוב אזרחי העולם שמדברים שפה נוספת מדברים בה.


כך התפתחו שפות העולם:

http://youtu.be/iWDKsHm6gTA
משפט הקוף המקליד
מה הקשר בין קופים לגאונות?



משפט הקוף המקליד גורס שבסופה של הקלדת כל רצף ארוך מספיק של תווים אקראיים, יופיע כמעט בוודאות, כל טקסט אפשרי. התאוריה אומרת שאם תהיה ההקלדה אינסופית, יווצר בוודאות כל טקסט שהוא, כולל נבואות, טקסטים של שייקספיר ורשימות מכולת מאתמול. זהו סדר שנוצר מתוך כאוס.

מתמטיקאי צרפתי בשם אמיל בורל היה הראשון שכתב את הדברים. הוא ניסח זאת כך שניתן לומר שאם קוף יקליד תווים אקראיים במכונת כתיבה, לבסוף הוא יקליד גם את כל כתבי וויליאם שייקספיר.

בגישה זו ניתן לענות גם לטענה שנבואות קדומות ניבאו כל מיני אירועים שקרו במאה האחרונה (כולל עלית היטלר, רצח רבין ועוד). הם גורסים בפשטות שבתנ"ך ניתן למצוא "רמזים" לאירועים אלה ואחרים, אם רק מחפשים מספיק...

אבל מה ניתן להפיק מהקלדות אקראיות כמו מה שהקופים מקלידים? - משפט הקוף המקליד הוא ניסוי מחשבתי בלבד. בניסוי שערכו ב-2003 בגן חיות, הסתבר שקופי המקוק שקיבלו 6 מכונות כתיבה למשך חודש כתבו רק 5 עמודים, שרובם היו מלאים באות "S" והרסו את מכונות הכתיבה.‏‏ אתר שמדמה את הקופים המקלידים בעזרת תוכנה שיוצרת אינספור הקלדות אקראיות, הצליח להפיק 24 אותיות רצופות מתוך המחזה "הנרי הרביעי‏" של שייקספיר.


הנה סרטון על תיאורמת הקוף האינסופי, או משפט הקוף המקליד:

http://youtu.be/Imd_Vhg8Afk?t=13s


הנה תיאור ציורי של תיאורת הקופים האינסופיים:

http://youtu.be/ipdRhgLWGXo


הנה סרטון על תוצאותיו של הניסוי עם קופים ומכונות כתיבה:

http://youtu.be/pDUn7dDigvI


הנה סימולטור שמדמה את תיאורמת הקופים האינסופיים:

http://youtu.be/iSn8L6Uj5L8
אקראיות
מהי אקראיות והאם מחשב מסוגל לייצר אותה?



אקראיות היא אי-סדר. כשאין שום תבנית או סדר מוגדרים, נוצרת אקראיות. מספר אקראי למשל, הוא מספר ש"הוגרל" ללא שום יכולת לחזות אותו, באופן מקרי לחלוטין.

מחשב לעומת זאת הוא דטרמיניסטי. כל מספר שהמחשב יעלה על הדעת נקבע על ידי אירועים קודמים, או על ידי תכנות מראש. אין בו הגרלה או התנהגות בלתי צפויה. זה חלק מהיתרון שבו וסוד היציבות שלו, אבל בתחום האקראיות הוא לא משהו ואין בו שמץ של אקראיות. ומכיוון שהמחשב אינו מסוגל לייצר אקראיות של ממש, כדי לקבל ממחשב מספר אקראי, או סדרת מספרים שונה בכל הרצה של תכנית, על המחשב להשתמש במקור שתמיד יתן ערך שונה. המספרים שיופקו ממנו נראים אקראיים, על אף שאינם כאלה.

כזה הוא למשל השעון הפנימי של המחשב, שמדמה מחולל אקראיות בצורה טובה מאד. אם ניקח למשל את מספר השניות שעבר מאז תאריך מסויים יתקבל ערך שהוא בלתי תלוי ולכן הוא קרוב לאקראיות של ממש. הפעלת מחולל, אלגוריתם שעוד יותר "מבלבל" אותו, יהפוך אותו למספר דומה ביותר למספר אקראי של ממש. בצורה דומה גם תנועות העכבר יכולות לספק מספרים שמדמים מספרים אקראיים.


הנה הדרך שבה מחשבים מתמודדים עם אקראיות:

http://youtu.be/Td3MUJ3I1Io
עקומת הפעמון
מהי עקומת הפעמון?



נניח שנמדוד את הגבהים של אוכלוסיית ישראל ונביט על גרף שמציג את ההתפלגות שלהם (כמה אנשים יש מכל גובה). סביר שהגרף יהיה גבוה באמצע, כי הגבהים של רוב האוכלוסיה ממוצעים, הגרף יהיה נמוך במידות הגבוהות (יש יחסית מעט אנשים גבוהים בחברה) ונמוך בגבהים הנמוכים (יש גם מעט נמוכים בחברה הישראלית). הגרף שנקבל נראה כמו פעמון ולכן הוא נקרא "עקומת פעמון".

אם נשרטט גרף של התוצאות הסטטיסטיות של כמעט כל תופעה חברתית (ואולי לא כמעט), כנראה שנקבל גרף בצורת פעמון.

השמות הללו כמו עקומת הפעמון, עקומת ההתפלגות הנורמלית או עקומת גאוס הם שמות שונים לעקומה שמתארת את ההתפלגות הסטטיסטית של משתנים סביב הערך הממוצע שלהם.

זוהי התפלגות סטטיסטית שמשמשת בכל תחומי המדע, אך היא מקובלת מאד במדעי החברה. גאוס, המתמטיקאי שאחראי לגילויה כונה לא פעם "נסיך המתמטיקאים".


הנה עקומת הפעמון:

https://youtu.be/1X1WCmHJcQQ


כך מוצג ה-IQ של האוכלוסייה בעקומת פעמון:

https://youtu.be/XQdenK0Pl38


מס על טיפשות
מהו ה"מס על טיפשות"?



הסיכויים הנמוכים לזכות בהימורים לא מפריעים לרבים להתחבר להימורים. אפילו מי שלומדים סטטיסטיקה ומבינים שהתוחלת לזכייה בהימורים היא נמוכה מהסכום שמושקע בהם, לא משתכנעים ומפסיקים. זו הסיבה שהימורים כמו הלוטו זכו כבר מזמן לכינוי "מס על טיפשות".

האם הכינוי המעליב הזה הוא מוצדק?

שניהם, גם מיסים וגם הימורים דוגמת הלוטו, מהווים מנגנונים יעילים ליצירת הכנסות ממשלתיות מהאזרח. אבל בעוד מסים הם לא עניין של החלטה אישית וכל אזרח מחויב לשלמם לשלטון, ההימורים הם וולנטריים - כל אחד מחליט אם הוא מעוניין או לא.

מצד שני, רק מי שלא מצליחים להשתכנע שמשחקי ההימורים הם עסקה כלכלית גרועה במיוחד הם משתתפי המשחק. מחקרים מצאו שוב ושוב שרובם הם מהשכבות הפחות מבוססות בחברה ומהעשירונים התחתונים. רבים מעידים שבימי התשלום של קצבאות הביטוח הלאומי, המהמרים מגיעים יותר, כדי להמר בתחנות מפעל הפיס.

אז זה אומר שהעניים הם טיפשים?

לא. זה אומר שגם אם אינם מבינים שהסיכויים לזכות קטנים מאד ושבסך הכל סיכוייהם להפסיד את כספם גדולים משמעותית מסיכויים להרוויח, יש שם משהו נוסף שמושך אותם לזה ויתכן שבדיוק את המשהו הזה מפסידים מי שלא מהמרים.

המשהו הזה שווה כסף ולפעמים לא מעט. מי שזוכרים את "קלפני המרפסת", אותם אנשים שהתכנסו בבית של אחד מהם למשחקי קלפים, "על כסף". זה היה נפוץ בעשורים הראשונים למדינה. רבים זוכרים שגם מי שהפסיד, מאד נהנה מהאירועים הללו. הסיבה היא חברתית והיא גם עובדת בהקשר של הימורי הלוטו, הטוטו ושאר הגרלות. הדיבור על כך, החלפת הדעות, ההימורים, החדשות על "ההם שזכו" ו"ההוא שהתעשר" - כל אלו מספקים הרבה עניין, רכילות ודיונים חברתיים. זה שווה קצת, לא?

והמשהו הנוסף הזה, שאיש לא מדבר עליו, הוא שמי שיש לו פחות כסף - חולם לזכות בהגרלה. התקווה הזו ש"השבוע זה יקרה לי!" היא משהו שלרבים, במיוחד מקרב מי שהחיים לא מפנקים אותם ביום יום, היא יקרה מפז. עדיף לא להמר ולהשקיע בדברים חשובים כמו חינוך הילדים, שיפור היכולות המקצועיות ואיכות החיים, אבל עדיין - לכל אחד יש את הבחירות שהוא עושה.

אז אולי רציונלית להשתתף בהגרלות ולזרוק כסף עליהן זה נראה טיפשי, אבל לעתים ה"טיפשות" הזו ממלאת אותך בשמחה וחברה וגם "החכמים" משלמים לא מעט על הדברים האלה. זאת כל עוד ההימור הוא בסכום סביר, לא הופך להתמכרות להימורים, למכונות מזל או למרוצי סוסים ולא פוגע במשפחה ובתפקוד היומיומי של המהמר.


הנה החלום - שיתקשרו אליך עם הפרס:

https://youtu.be/YzJwXm4goKo


הסיכויים הנמוכים לזכות בהגרלות כאלה לא מפריעה לאנשים להתמכר להימורים:

https://youtu.be/nRLbvXMFKtc


רבים מאלה שכן זוכים לא יודעים לנהל את הכסף שבו זכו ומתרוששים שוב:

https://youtu.be/0t3k5yh9Dh8


והסיפור המדהים על האיש שאיבד את הטופס הזוכה בהמון מיליונים של שקלים:

https://youtu.be/Q-luW5Nmqe8
מהי התפוצצות המידע וכמה מידע נוצר בעולם?



התפוצצות המידע (Information explosion) בעולם היא תופעה שלא תיאמן. אם פעם היו 33 מיליון הספרים השמורים בספריית הקונגרס האמריקני מרשימים אותנו בכמות שלהם, כדאי לדעת שהעולם האינטרנטי מייצר כיום כמות של כמה ספריות כאלה בכל יום!

רוצים נתונים? - בכל דקה מעלים משתמשים לפחות 100 שעות של וידאו לאתר האינטרנט יוטיוב. אל פייסבוק לבדה אנו מעלים כמות של 300 פטה-בייטים של מידע בכל שנה. הצילום הדיגיטלי מאפשר לנו להעלות בכל יום מעל שני מיליארד של תמונות חדשות. הן לבדן מציעות משהו כמו אקסה-בייט של מידע דיגיטלי ביום. בכל שנה אנו מייצרים מאות אקסה-בייטים, כמות מידע המקבילה לכמה מאות או אלפי ספריות קונגרס חדשות בשנה!

אין ספק שאחד הגורמים העיקריים שמאיצים את קצב יצירת המידע החדש הזה הוא תוכן הגולשים. אתרים אישיים, בלוגים, פורומים ורשתות חברתיות הביאו לכך שכל אחד מאיתנו יוצר המון מידע חדש בכל יום, לא פעם לאורך כל היום. לא כל המידע הזה חשוב. רובו מידע אישי וחסר חשיבות לאנושות, אבל בכל זאת - הוא נוצר ונערם בכמויות בלתי נתפסות ולא יימחק כל כך מהר. יש לו שימוש למישהו.

עוד סיבה חשובה להאצת ייצור המידע היא ענן המחשוב. הענן הוא פלטפורמה שמחיר האחסון בה הולך ויורד, מה שמאפשר ייצור של מידע בכמויות גדולות ואיחסונו בזיל זול. צניחת המחירים שדורשות ספקיות הענן הציבורי הגדולות, דוגמת אמזון, גוגל ומיקרוסופט, מגדילה את כמויות המידע הזה ללא הפסקה.

וגם אם לא נרצה בו, יש מי שאוגר את כל המידע הרב הזה למטרותיו. ההתייחסות לאוקיינוס המידע הזה היא כאל מאגר עצום שטומן בחובו הזדמנויות עסקיות והכנסות כספיות רבות.


הנה סרטון שמראה את כמויות המידע העצומות שמייצר המין האנושי כיום:

https://youtu.be/NTMkc0bLRlI


ומה הבעיה האנושית עם כמות המידע הזו:

https://youtu.be/VxfGuZ5Bsgk


ובחיוך, הנה האנשים שמוצפים במידע הרב ומתמכרים:

https://youtu.be/6MpfVD-c-QI
מה זה ממוצע? ומהו חציון? ומה זה שכיח?



ממוצע, חציון ושכיח הם מספרים שמחושבים מתוך קבוצת מספרים:

הממוצע מתאר את "מרכז" קבוצת המספרים מבחינת גודלם. הוא המספר הדמיוני שכולם היו, אם הם היו שווים בגודלם.

החציון הוא המספר האמצעי בגודלו מבין קבוצת מספרים, כשהיא מסודרת לפי הסדר.

השכיח הוא המספר שניתן למצוא הכי הרבה בקבוצת מספרים.

אפילו שנראה אולי שמדובר בסתם עניינים של חישוב, ההבדלים בין המושגים הללו חשובים מאד. פעמים רבות מזכירים את הממוצע בהקשרים כלכליים. למשל כשמציינים שהשכר הממוצע במשק עלה. יש בכך נסיון לומר שאנשים מרוויחים שכר גבוה יותר, אבל מספיק שהמנהלים העלו את שכרם כדי "למשוך" את השכר הממוצע למעלה ולתת אשליה של עליה בשכר הכללי. מבט בחציון ייתן תמונה מדויקת יותר, כי שכרו של האדם האמצעי בין המשתכרים לא משתנה ומשקף טוב יותר את מצב השכר הכללי.


הנה סרטון עם "שיר הממוצע" שמסביר מהו הממוצע (Mean) והחציון (Median), שכיח (mode):

http://youtu.be/QH2obAPwfqk


הנה עוד שיר שמלמד את המושגים הללו:

http://youtu.be/uydzT_WiRz4


הנה סרטון שמסביר את ההבדלים ביניהם מתמטית:

http://youtu.be/onSebaCChTg


הנה סרטון שמסביר כמה הממוצע הוא דבר מטעה וכמה כדאי להכיר את החציון למשל:

http://youtu.be/cKHAfiqHwZc
מהי כריית מידע?



כריית מידע היא סריקה של נתונים, כדי לזהות את מאפייניהם, למצוא קשרים ביניהם ולהסיק מהם מסקנות שיכולות לשפר תהליכים שונים. שימוש בטכנולוגיית המידע המודרנית, דוגמת האינטרנט ומאגרי מידע גדולים, יכול לאפשר לכורי המידע להפוך את המידע הרב שיש בהם לידע.

חברות מסחריות למשל, משתמשות באלגוריתמים או תוכנות מחשב לכרייה של מידע. הכלים הללו מאפשרים לזהות קבוצות של לקוחות לפי סוגי הפעילות שהם עושים. על ידי זיהוי קבוצות כאלה, יכולה חברה להציע לכל קבוצה מוצרים שיותר סביר שהאנשים שבה ירצו לקנות. יש לקבוצות כאלה גם תרומה לשיפור השירות ללקוחות ועוד.

ישנן שיטות לכריית נתונים, כמו כרייה ברשת (Web Mining), סוג של כריית נתונים שמתבצע באתרי אינטרנט שונים וברשתות חברתיות גדולות כמו פייסבוק וטוויטר, במטרה לזהות בהם מאפייני התנהגות של גולשים. מידע שנאסף כך משמש, לעתים קרובות ללא ידיעת הגולש, להגדלת המכירות ואף נמכר לחברות אחרות.


הנה הסבר לילדים על כריית המידע:

http://youtu.be/2V2YiXlCpMs


והנה הסבר מפורט יותר:

http://youtu.be/_HbjsNaUJ2A


מומחה לניהול מסביר מהי כריית המידע:

http://youtu.be/R-sGvh6tI04
מהם סקרים ומה הבעיה בהם?



שמעון פרס אמר עליהם פעם ש"סקרים הם כמו בושם. אפשר להריח אותם אבל לא כדאי לשתות...". מי כמוהו חווה את כשלון הסוקרים, שמסתמכים על מדגמי ענק אך לא מצליחים לזהות את המגמות האמיתיות בבחירות.

סקר (Poll) הוא מדידה של משהו במדגם, חלק קטן באוכלוסיה, ושימוש באמצעים סטיטסטיים כדי להכליל על האוכלוסייה כולה. התחזיות של סקרים פוליטיים, למשל, מתבססות על מדגם קטן של קלפיות, שבו מתבקשים אנשים להצביע בקלפי המדגם, כמו שהצביעו בקלפי האמיתית. על המדגם להיות לא "מוטה", כלומר שיהיה בו ייצוג שווה של קבוצות שונות באוכלוסייה.

בשנים האחרונות הולכים הסקרים ומאבדים את היכולת לחזות מגמות פוליטיות. זו מגמה שהולכת ומתבררת בהרבה מאד מקומות. מישראל של בחירות 2015, בהן ניצח ראש הממשלה, בניגוד לכל הסקרים שחזו את נפילתו, דרך סקרים שהכזיבו בגדול בעולם כולו. דוגמאות לא חסרות, אבל המפורסמות שביניהן הן תוצאות הבחירות האחרונות בבריטניה, ההפעה המדהימה של הברקזיט (היפרדות מגוש היורו) במשאל העם האנגלי וכמובן - הניצחון הבלתי צפוי, של דונלד טראמפ לנשיאות ארצות הברית.

אז מה הבעיה בסקרים?

מזה שנים מצביעים מומחים על הדרך שבה מתקבלות ומפוענחות לא נכון תוצאות המדגמים. הן מצביעות על נצחון של מי שלבסוף יתגלה כמובס במערכת הבחירות. שוב ושוב טופחות תוצאות האמת על פניהם של הסוקרים ומצליחה לערער את אמינותם. מצד שני, משפיעות תוצאות הסקרים לא אחת על תוצאות הבחירות. זאת מכיוון שהבוחרים מחליטים למי להצביע בהתאם לתוצאות הסקרים. כך לדוגמה הם קוראים בסקר שהליכוד עומד לנחול תבוסה בבחירות ובשל כך הם "חוזרים הביתה", להצביע לו.

מצד אחד, הסקר הוא הכלי האובייקטיבי ביותר שעומד לרשות הפוליטיקאים. בעזרתו הם מנסים לנבא את התנהגות הבוחרים והעמדות שלהם. מצד שני הניסיון כבר הוכיח עד כמה חשוב להתייחס אל הסקרים בזהירות. אם משתמשים בהם בלי להיות מודעים לחולשות ולבעיות שבהם - נוהגים בחוסר אחריות ובטפשות של ממש.

למשל התעלמות מכך שבתנאים של קרבה לתיקו בהצבעה, המשמעות הפוליטית של הסטייה הסטטיסטית, סטייה שתמיד תהיה שם והיא נסבלת בכל סיטואציה אחרת, היא עצומה. במילים פשוטות, אם טראמפ והילרי מתחרים בצמידות, או שמתנגדי הברקזיט מתחלקים כמעט 50-50, הרי שהסקר לא יוכל לומר מי ינצח. כל סטייה קטנה תמליך צד אחר.

יש גם בעיות אחרות, כמו העובדה שתוצאות הסקר, גם אם נקבל אותן כמו שהן, נכונות רק ליום הסקר. בקמפיין פוליטי הופך כל יום לסיפור חדש והשינויים הללו הם כל כך משמעותיים, במיוחד במירוץ צמוד, שהסקר של שלשום שווה לניחוש פשוט. בעיה נוספת היא אמינות הנסקרים. יותר ויותר אנשים נלחצים מלהודות בעובדות שונות שקשורות בתמיכה במועמד או בנושא שנוי במחלוקת. קשה להם להציב את עצמם בקבוצה הנרדפת על ידי דעת הקהל והתקשורת הדומיננטית והם מספרים לסוקר דבר אחד, בזמן שבקלפי הם עושים דבר הפוך. בישראל למשל, יש טענה קבועה שיש מגזרים באוכלוסיה, שאינם משתפים פעולה. גם שינויים טכנולוגיים, במיוחד כניסת האינטרנט, הרשתות החברתיות, החדשות שכבר לא מתקבלות מכלי התקשורת הגדולים דווקא - כל אלו הפכו את הסקרים ויכולת הניבוי שלהם לבעייתיים מאד.

מצד שני, הסקרים, במיוחד הכמותיים שבהם, מהווים עדיין את כלי העבודה העיקרי של הפוליטיקאים ויועציהם. גורלות נחרצים על פיהם ובאין כלי אחר, מתקבלות החלטות פוליטיות חשובות מאד, לפחות בתקופת מערכת בחירות, על פי תוצאות הסקרים הללו. בתנאים כאלה, עיבוד הנתונים ופירושם על ידי הסוקרים ובאופן כללי - המקצועיות שלהם, הופכת למרכיב קובע ביכולת להתגבר על מגוון בעיות הסקר.


הנה עולם הסקרים הפוליטיים (מתורגם):

https://youtu.be/ubR8rEgSZSU


בארץ יש מי שמנסים לבדוק אותו:

https://youtu.be/c1odMcMrcpo
מה זה ביג דאטה?



בעידן האינטרנט ורשתות המחשבים הגדולות והעולמיות מצטברות כמויות עצומות של מידע. התחום המדעי המכונה ביג דאטה (Big Data) עוסק בניהול של כמויות חסרות תקדים של מידע שמצטבר במאגרי נתונים ענקיים, תוך נסיון למצוא בו דפוסים ותבניות שיכולות לסייע בהפקת תועלת.

ההגדרה היפה של ביג-דאטה שאנו מכירים היא ש"ביג-דאטה הוא חתונה של סטטיסטיקה ומחשוב". ואכן, החתונה הזו מצליחה ליצור התפתחות לא רגילה בניתוח נתונים גולמיים בתחומי הרפואה, הכספים, המדעים ועוד. עולם הביג דאטה מתפתח במהירות וצפוי לשנות את חיינו בעתיד, בדרכים רבות.

באמצעות שירות "פלו טרנדס", למשל, חוזה כיום חברת גוגל מראש התפרצויות של מחלת השפעת. היא עושה זאת על סמך העליה בחיפושים שנערכים במנוע החיפוש שלה, של ביטויי חיפוש שקשורים למחלה, כמו חום, נזלת וכאבי שרירים. יש מחקרים שמצאו אמנם שגוגל לא הצליחה לחזות התפרצויות כאלה, אבל המאמץ נמשך..

אגב, בניגוד למחשבה שרק מחשבי-על הם שמעבדים את המידע לתחום הביג דאטה (קראו באאוריקה בתגית "ווטסון"), ישנן כיום מערכות שמטפלות בעיבוד נתונים כאלה, גם במחשבים רגילים.


הנה פרסומת שמציגה את הבעיה של עודף המידע ואת הפתרון בעיבודו:

http://youtu.be/TUiPQfydpB0


סרטון מתורגם לעברית על הביג דאטה:

http://youtu.be/j-0cUmUyb-Y?t=14s


והדרכים שבהן יתרמו המחשוב והביג דטה לעולם:

http://youtu.be/5LhTNMrxM5M
באיזו מדינה חיים הכי הרבה זמן?



תוחלת החיים בנסיכות הזעירה אנדורה היא הגבוהה בעולם. זה אומר שבנסיכות הקטנה והעשירה הזו אנשים חיים בממוצע מעל 83 שנה - תוחלת החיים הגדולה ביותר בעולם.


הנה סרטון על הטבע שבנסיכות אנדורה:

http://youtu.be/qanEizWxsGk


ועל מדינת אנדורה:

http://youtu.be/B10DiNXmFQM
מהי הקרטוגרפיה?



קרטוגרפיה היא תורת ציור המפות. בעבודה זו עורכים, מציירים, מעבדים ומדפיסים מפות גאוגרפיות מסוגים שונים. לפני מאות שנים היו המפות מאד לא מדויקות במונחים של היום, אך הן עוצבו כמעט כיצירות אמנות. הן היו מסוגננות ומקושטות, היו עליהן איורים יפים של ספינות, יצורי ים קסומים ועוד. בהמשך השנים הפכו המפות למסוגננות פחות ומדויקות יותר..

עוד במאה השניה הכין האסטרונום והגאוגרף היווני תלמי מאלכסנדריה ספר מפות קדום, שאבד במהלך השנים. מהיום שבו יצא האטלס המודרני הראשון, על ידי הקרטוגרף והגאוגרף הפלמי אברהם אורטליוס, הפכו המפות נפוצות הרבה יותר והחלו להגיע ליותר אנשים. הקרטוגרפים החלו לחבר את הציבור הרחב למקומות ולהתרחשויות היסטוריות שקרו בהם והציבור גמא בשקיקה את ספרי המפות, שהיו אולי תחליף למסעות יקרים ומלאי סכנות, שרק העשירים יכולים היו לצאת אליהם אז.

כיום ציור המפות הוא מקצוע המנצל תצלומי אוויר, צילומי לוויין, מידע סטטיסטי ממקורות שונים ועוד. הקרטוגרף המודרני יכול לוודא היום כל פרט מבסיסי נתונים מקוונים וממקורות מידע אינספור. בנוסף לכך, המפה שוב אינה לבד - תצלומי לוויין נגישים לציבור דרך האינטרנט ובצירוף עם מפות מקוונות, מערכות GPS מדויקות ושלל גאדג'טים יכול כל ילד לנווט בקלות ובמהירות, לכל פינה בעולם.


הנה תערוכה שמספרת את תולדות הקרטוגרפיה:

http://youtu.be/0dXvEYPaLL4


הנה סרטון על עבודת הקרטוגרף וכיצד נולדות מפות:

http://youtu.be/PoMOjLwFje0


והנה סרטון שמציג את הכנת המפות כפי שעשו אותה פעם, לפני עידן הלוויינים:

http://youtu.be/c0jBvnRHxRg
מה ההסתברות ללדת תאומים זהים?



תאומים זהים הם עוברים שנוצרו בלידה אחת, עם מטען גנטי זהה. זהו המקרה היחידי בטבע שבו קיימים שני יצורים נפרדים שיש להם מטען גנטי זהה. כמו כל עובר, גם התאומים הזהים הם שילוב של ביצית וזרעון, רק שהם נוצרים כתוצאה מהפריה אחת - ביצית אחת מופרית מזרעון אחד ונחלקת לשניים. כלומר, תאומים זהים מתפתחים כתוצאה מפיצול של עובר בודד, מספר ימים לאחר שההפריה מתרחשת.

תאומים זהים נוצרים אחת למאתיים וחמישים לידות. בישראל נולדים כ-400-500 זוגות תאומים זהים מדי שנה.


הנה הסבר על התאומים הזהים בשיר חביב באנגלית:

https://youtu.be/X3TQEQIXyRg


תצפית מדהימה על התהליך הביולוגי שבו ביצית מתפצלת ויוצרת תאומים זהים:

http://youtu.be/sOBvRhXIJN4


מתיחות שאפשר לעשות רק עם תאומים זהים:

http://youtu.be/GRHeiVmUR5w


ושיר חביב על הדמיון וההבדלים בין תאומות זהות:

http://youtu.be/2kkuVRU4AM8


מי חזה שבשנת 1996 האינטרנט ייעלם?



"אני צופה שבקרוב האינטרנט יצליח כמו סופרנובה מרהיבה ובשנת 1996 הוא יקרוס לחלוטין." אמר בשנת 1995 ד"ר רוברט מטקאלף, ממציא האת'רנט, הרשת ה"רגילה" שהומצאה לפני כן.

מטקאלף, שהיה מכותבי פרוטוקול האתרנט ואחד האנשים המוערכים בתחום המחשבים ורשתות המחשב, היה רשאי להיות ספקני. עם זאת, בדיעבד הסתבר שהרשת הצעירה של אותם זמנים, הפכה לגורם הטכנולוגי המשפיע ביותר בעשרים השנה שלאחר מכן ולא קרסה.. בשנת 2010 היו כמעט שני מיליארד איש שהיו מחוברים לאינטרנט בעולם!


הנה עוצמת הרשת שעל פי התחזית הזו הייתה אמורה להיעלם כבר מזמן:

http://youtu.be/nm82gPydmH0


ופרסומות שמציגות לקהל בניינטיז את הקסם הממכר של רשת האינטרנט:

https://youtu.be/qh_AZWq1lfo
האם הצופן התנכ"י מנבא את מה שיקרה?



הצופן התנכ"י, או הקוד התנכ"י, הם כינויים לשיטה שמאמינה שניתן לראות סימנים בתנ"ך לאירועים היסטוריים שיקרו. מאמיני השיטה גורסים שעל ידי קריאה של התנ"ך בדילוגי אותיות, ניתן למצוא נבואות לדברים שיקרו בעתיד. הכינוי של הצופן התנכ"י, בא מספר בשם זה שבו הציג הכותב מייקל דרוזנין את השיטה.

השיטה של קריאת התנ"ך בדילוג של כמה אותיות, במרווח קבוע, מאפשרת למצוא כל צירוף שמחפשים. אם נחפש למשל את הצירוף 'שלום עם לבנון' בדילוגים של מספר קבוע של אותיות, נוכל למצוא אותו כמעט בביטחון מוחלט. כך לדוגמה, יתכן שתופיע בפסוק כלשהו בתנ"ך האות ש', שבע אותיות אחריה תופיע האות ל', שבע אחריה האות ו', עוד שבע אותיות מ' וכן הלאה. ואם לא בדילוגים של 7 אותיות אז 3, 4, 5, 6, 8, וכן הלאה...

טכנולוגיות המחשוב המודרני מאפשרות יכולות פענוח מדהימות, שנועדו לפענוח צפנים ומיושמות כאן בדרך מקורית ואף אידאולוגית. כי אם יש צפנים נסתרים ונבואות בכתבי הקודש, הרי שיש בכך חיזוק לאמונה ולדת. ואכן, ברעיון הקוד התנ"כי משתמשים בין השאר מחזירים בתשובה ביהדות, שמוכיחים בעזרתו את החכמה האלוהית שבתנ"ך. מיסיונרים נוצרים, מצידם מייחסים את התבונה הזו למסרים סודיים שהעביר ישו למאמינים. בצעירותו עסק בחקר השיטה גם גדול המדע אייזק ניוטון.

גם המדע חקר את הדברים. ההנחה הראשונית הייתה שיש בסך הכל סטטיסטיקה של טקסטים גדולים, שבהם ניתן למצוא כל צירוף שמחפשים. בעוד שחוקרים מסוימים מצאו שסטטיסטיקה רגילה לא יכולה להסביר את הממצאים המדהימים שמצאו בספר "בראשית", מצאו חוקרים אחרים שגם בספרים עבי-כרס אחרים, כמו "מלחמה ושלום" של טולסטוי (או "הארי פוטר"), יש ריכוז דומה של ממצאים. ועדת חוקרים בכירה שמינתה האוניברסיטה העברית בירושלים, בראשות חתן פרס נובל ישראל אומן וחתן פרס ישראל הלל פורסטנברג, מצאה שאין בסיס מדעי לשיטה ופסלה סופית את האפשרות שמידע מוצפן על העתיד חבוי בין פרקי התורה והתנ"ך בכלל.


כך מוצג הקוד התנכ"י על ידי המאמינים שהוא מנבא את העתיד לקרות:

http://youtu.be/NcL7nG9rvvs


והנה הסבר נגדי על הצופן התנכ"י:

http://youtu.be/OGxxWE7msH8


הנה תיאוריית ראמזי שמצמיחה חלק גדול מתיאוריות הקונספירציה הללו:

https://youtu.be/88_C-fogY40


כך יכול למשל הצופן התנכ"י ניבא את רצח ראש הממשלה יצחק רבין ואז מראה כיצד ניתן לראות שם בעתיד את רצח המרצה:

http://youtu.be/H9anECrH_38


הנה דעתו של זוכה פרס נובל על הקוד התנכ"י:

http://youtu.be/IN7n4PEJ5CY
מי היה אלברט איינשטיין?



שמו של אלברט איינשטיין הפך למילה נרדפת לגאונות. האיש שאמר שדמיון חשוב יותר מאשר ידע, היה גדול המדענים במאה ה-20 ואולי בכל הזמנים. הוא היה פיזיקאי יהודי שלצד אייזק ניוטון, אבי המכניקה הקלאסית, נחשב לגדול התאורטיקנים בכל הזמנים.

איינשטיין זכה לפרסום ברבע הראשון של המאה ה-20 בזכות תורת היחסות אותה הגה, ששינתה את כל אשר היה ידוע עד אז על טיבם של הזמן, המרחב, המסה, התנועה וכוח הכבידה. תגליותיו פרצו דרכים חדשות להבנת העולם, האנרגיה והחלל. בזכותו נעשתה קפיצה אדירה בהבנת היקום.

הנוסחה המפורסמת שלו E=MC2, שבה קשר בין חומר לאנרגיה והסביר שאנרגיה עצומה אצורה בחומר, פרצה את הדרך לפיתוח תחום האנרגיה הגרעינית ולהישגים יוצאי דופן, גם בתחום האזרחי ובתחום החלל וגם בתחום הצבאי. הוא גם נודע בזכות תרומותיו ליסודות מכניקת הקוונטים, למכניקה סטטיסטית ולהסברת האפקט הפוטואלקטרי (עליה קיבל פרס נובל לפיזיקה ב-1921) ועוד.

מלבד השפעתו העצומה והמהפכנית בתחומי המדע, הייתה לאיינשטיין גם תרומה מכריעה לניצחון על הנאצים, בזכות השימוש שנעשה בנשק גרעיני במלחמת העולם השנייה. זאת בשל תמיכתו ביוזמה שקידמה את פיתוח פצצת האטום בארצות הברית, על אף שהגדיר עצמו כפציפיסט. הסיבה - איינשטיין הבין שאם ארצות הברית לא תפתח נשק כזה שיאפשר את סיום המלחמה, יעשו זאת אויבותיה כנגדה וכנגד העולם החופשי. משהבין שניצחון של דיקטטורות כאלה יביא לסופו של העולם החופשי, הוא נקט עמדה ותרם תרומה גדולה לניצחון הדמוקרטיות.

איינשטיין אהב את מדינת ישראל ותמך בציונות מאד. עם הקמת המדינה הוצע לו התפקיד של נשיא מדינת ישראל הראשון, אך הוא לא ראה עצמו עוזב את המחקר ונאלץ לוותר על התפקיד ההיסטורי והחשוב לטובת המדע שכל כך אהב.


הנה שנת 1905 המופלאה שבה הפציץ איינשטיין ב-4 מאמרים גאוניים (מתורגם):

https://youtu.be/91XI7M9l3no?t=7s


תולדות חייו של איינשטיין:

http://youtu.be/ZMVKvO-gTs8


אלברט איינשטיין עצמו:

http://youtu.be/l-1Z2wi2uSA


שחקן בדמותו של איינשטיין מסביר על התפשטות היקום והמפץ הגדול:

http://youtu.be/_gRfgWOBg1A


לאן היקום מתפשט:

https://youtu.be/6PiyUjVxukI


התממשות התיאוריה של איינשטיין לגבי נסיעה בזמן (מתורגם):

http://youtu.be/7H3ksmxwpWc


סרט תיעודי על הגאונות של אלברט איינשטיין:

https://youtu.be/Uvpw6Jh1WGQ?long=yes


ותכנית טלוויזיה על איינשטיין:

https://youtu.be/V4YRfaJ1atY?long=yes


אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

העולם הוא צבעוני ומופלא, אאוריקה כאן בשביל שתגלו אותו...

אלפי נושאים, תמונות וסרטונים, מפתיעים, מסקרנים וממוקדים.

ניתן לנווט בין הפריטים במגע, בעכבר, בגלגלת, או במקשי המקלדת

בואו לגלות, לחקור, ולקבל השראה!

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.