» «

דאטה אנליסטים

למידה חישובית
מהי למידת מכונה או למידה חישובית? ומהם מדעני הדאטה?



למידת מכונה (Machine Learning), או למידה חישובית, היא היכולת של מערכת מחשב ללמוד ולהשתפר על ידי התבוננות ופעילות עצמאית שלה עם מידע.

זוהי לא בדיוק טכנולוגיה או כלי ספציפי, אלא תחום מחקרי מדעי, המשלב מרכיבים מעולמות הסטטיסטיקה ומדעי המחשב. באמצעותם מאפשרת למידת המכונה זיהוי אוטומטי של דפוסים מרתקים בכמויות נתונים גדולות.

אבל איך מכונה לומדת?

ובכן, בואו נדמיין לרגע מצב דמיוני. דמיינו מיליוני תלמידים מטומטמים, שלומדים אצל מורה לא מוכשר במיוחד, אולי אפילו אידיוט. כל פעם המורה הזה מראה להם משהו שהוא רוצה שיידעו (מראה להם למשל שתי תמונות ואומר מה מופיע בכל אחת) ואז בוחן אותם. חוץ מלתת ציון לתשובות שלהם, הוא תמיד מעיף מהכיתה שלו את אלו שלא זיהו ומשכפל את אלה שכן. אז מראה המורה עוד משהו ובוחן ושוב מעיף... הוא עושה את זה מיליוני פעמים... כן, דמיינו שהוא חוזר על התהליך הזה עם מיליוני תלמידים, שוב ושוב... קוראים לזה, אגב, "אִיטֵרַצְיות", פעולות שחוזרות על עצמן שוב ושוב במהלך פתרון של בעיה.

כך, בהדרגה ובאופן שלא תמיד מובן לנו, המכונות, סליחה - התלמידים המטומטמים, הולכים ומשתפרים. הם לומדים!

אז לאור הסיפור הזה, איך עושה זאת המחשב?

בצורה דומה אבל טכנולוגית, ככל שמחשב לומד מצויד ביותר נתונים והתנסויות, הוא נעשה חכם יותר. המידע שהוא מעבד מסייע לו לשפר כל הזמן ולגמרי בעצמו, את המודל החישובי שלו.

אנשי הלמידה החישובית מפתחים אלגוריתמים ודרכים שמאפשרים למחשב ללמוד בעצמו ולשפר את יכולותיו.

אם נסכם לרגע, אנשי למידת המכונה יוצרים מכונה המלמדת את עצמה התנהגויות ותובנות, על סמך מפגשים עם מצבים שונים וסיטואציות שמהם ניתן ללמוד ולהסיק מסקנות. המכונה הזו מתנהגת כמו בן-אנוש, שלומד ללא הפסקה, מהתנסויות וטעויות, אבל בהיקפים מטורפים ועם המון דאטה.

על ביג דאטה שמעתם? התחום הזה של מכונה לומדת הוא בדיוק הסיבה שענקי האינטרנט אוספים עלינו מידע בכמויות ענק. בעזרתן הם משפרים את האלגוריתמים והמכונות הלומדות שלהם ויוצרים להן ידע המשתבח והולך.

בלמידת מכונה מצויד המחשב באינטליגנציה מלאכותית ולומד מתוך דוגמאות והתנסויות קודמות שלו ולא בזכות מתכנת אנושי שמזין את הידע למחשב. כלומר, בלמידה כזו מתרחשת הלמידה על ידי המחשב מתוך דוגמאות ומקרים שקרו לו.

האלגוריתם של המחשב ממש מחקה את הדרך שבה פועלת הרשת העצבית שבמוח האנושי. באופן מסוים, מחשבים חכמים כבר הגיעו מזמן לביצועים שמזכירים את הלמידה של תינוקות על ידי חיקוי הוריהם. באופן אחר, הם כל כך משתפרים שיש כבר רבים שמתחילים לחשוש מזה...

המדענים מזהים למידת מכונה, כאשר הביצועים של משימה במחשב הולכים ומשתפרים עם הניסיון. כלומר, בכל פעם שתוכנת המחשב מבצעת משימה, באופן יעיל מאשר ביצעה אותה בעבר. ככל שתוכנה משיגה תוצאות טובות יותר, מבלי שמתכנת אנושי השפיע על הקוד שלה, אז התרחשה למידה חישובית, או למידת מכונה.


איך מכונות לומדות? -הנה (מתורגם):

https://youtu.be/R9OHn5ZF4Uo


מאיפה מגיע המידע הנחוץ לאימון המכונה ומה חשוב באיסופו (מתורגם):

https://youtu.be/x2mRoFNm22g


המקור ההיסטורי של משין לרנינג ודרך פעולתה:

https://youtu.be/HBDp183HEic


עוד הסבר על למידת המכונה:

https://youtu.be/mJeNghZXtMo


אחד האתגרים בלמידת מכינה הוא ליצור למידה שאינה מוטית לכיוונים חברתיים ספציפיים:

https://youtu.be/59bMh59JQDo


הסבר קצר על הלמידה החישובית:

https://youtu.be/ty-kTUzMnjk


והסבר מפורט יותר:

https://youtu.be/EQhwNcQhP4g


מחשב לומד שמתבונן בשחקנים המשחקים במשחקי מחשב ולומד לשחק ברמה מקצועית שיכולה להביס את הטובים שבהם:

https://youtu.be/EfGD2qveGdQ


תוכנה לומדת שמשחקת ומשתפרת כל הזמן במשחק מחשב:

https://youtu.be/qv6UVOQ0F44


רוצים לאמן מכונה ואפילו בלי תכנות? - הנה פעילות נחמדה וחכמה:

https://youtu.be/i9tjzr1KME0
למידה עמוקה
מהי למידה עמוקה?



הלמידה העמוקה (Deep Learning) היא תחום מחקר בעולם המחשבים וספציפית בתחום "למידת המכונה" שמניח שהמחשב יכול ללמוד וללמד את עצמו, ממש כמו המוח האנושי. מטרתו הברורה של התחום הזה היא ליצור חיקוי ממוחשב של פעולת המוח האנושי.

בין שנות ה-70 לאמצע שנות ה-2000, רווחה אכזבה מאד גדולה מהביצועים של תחום הבינה המלאכותית. התחום שפעם הבטיח מהפכה של ממש בעולם המחשוב, "לא סיפק את הסחורה". התקופה הזו כונתה אז "החורף של הבינה המלאכותית".

אבל בשלב מסוים, בשנות האלפיים ואחרי שנים רבות של האכזבה, הפציעה האינטליגנציה המלאכותית מחדש, כשהפעם היא החלה לממש סוף כל סוף את ההבטחה מימי התום שלה. מחשבים מהירים פי מיליון, כמויות מידע עצומות שהחל להציע האינטרנט ושנאגרו על כונני ענק זולים ונגישים - כל אלה הבשילו לטכנולוגיה חזקה ומעשית - "הלמידה העמוקה".

התחום הזה הוא תת-תחום בתוך תחום "למידת המכונה", שגם הוא עצמו, כמו שאומרים מקצועני תחום "למידת המכונה" (ML), מהווה תת-תחום מרכזי בעולם האינטליגנציה המלאכותית.

המיוחד במערכות למידה עמוקה הוא היכולת שלהן ללמוד ולהשתפר כל הזמן ודי בעצמן. מפתחי מערכות כאלה בונים בשבילה מעין "רשת סמנטית". זו מערכת שמחקה את המערכת הנוירונים שבמוח האנושי וכאמור פועלת ולומדת כמוהו - ככל שהיא פועלת וככל שמשתמשים בה - היא משתפרת ו"יודעת" יותר.

מדובר בתחום חדש יחסית בעולם של חקר המערכות הלומדות. הוא נקרא גם "הלמידה החישובית" (Machine Learning). לטווח רחוק מטרת התחום היא פיתוח של מחשב שיוכל להחליף את החשיבה האנושית.

מערכת כזו תהיה מסוגלת לזהות תבניות ודפוסים בדיבור, תמונות, צלילים ועוד סוגי מידע, שהמערכות מתקשות כיום לעבד ולטפל בהם.

חשיבה עמוקה היא רק בתחילתה, אבל חוקרים נעזרו בה כבר לזיהוי מולקולות שייקשרו למטרות בגוף טוב יותר ומסתייעים בממצאים לפיתוח תרופות חדשות. מחשב או תוכנה שמצוידים ב"חשיבה עמוקה" מבינים כבר היום שפה אנושית במנועי חיפוש, בחיפוש קולי ובעוזרים דיגיטליים כמו "סירי" של חברת אפל ו"קורטנה" של מיקרוסופט. בעתיד יסיקו מערכות כאלה גם מסקנות ויקבלו החלטות בכוחות עצמן.

העתיד מבטיח מפיתוחים אלה מערכות רפואיות שמטפלות בחולים, אנליסטים ומומחים ממוחשבים לניהול כספים ומסחר במניות ועד למערכות ראיה ממוחשבת, שיוכלו לזהות עצמים במרחב ולסווג אותם, ללא צורך בהתערבות אנושית.

באמצעות חיקוי היכולת האנושית ללמוד, מצליחות מערכות למידה עמוקה גם ליצור ציורים, מוסיקה, סרטונים וטקסטים,להמליץ ללקוחות על רכישות, לייצר קריינות מלאכותית, לזהות עצמים ופנים מדויקות בתמונות וסרטונים, לאבחן מחלות, להפיק רווחים ממניות, להלביש פנים של מפורסמים על סרטי וידאו ועוד שלל יישומים.


המלצה:
======
קראו באאוריקה בתגית "Google Brain", על אחד מפרויקטי הבינה המלאכותית הגדולים ביותר אי פעם.


הנה טכנולוגיית הלמידה העמוקה והעתיד שהיא מסמנת, כולל הסכנות האפשריות:

http://youtu.be/IoP9akd44wk


כך עובדים על פיתוח המוח העמוק:

http://youtu.be/zLp-edwiGUU


הדגמה ויזואלית של עץ ההחלטות הגדל ומתפתח של מערכת חכמה:

http://youtu.be/nSg4HKHdDs4
כריית מידע
מהי כריית מידע ומיהם כורי המידע?



כריית מידע היא סריקה של נתונים, כדי לזהות את מאפייניהם, למצוא קשרים ביניהם ולהסיק מהם מסקנות שיכולות לשפר תהליכים שונים. שימוש בטכנולוגיית המידע המודרנית, דוגמת האינטרנט ומאגרי מידע גדולים, יכול לאפשר לכורי המידע להפוך את המידע הרב שיש בהם לידע.

חברות מסחריות למשל, משתמשות באלגוריתמים או תוכנות מחשב לכרייה של מידע. הכלים הללו מאפשרים לזהות קבוצות של לקוחות לפי סוגי הפעילות שהם עושים. על ידי זיהוי קבוצות כאלה, יכולה חברה להציע לכל קבוצה מוצרים שיותר סביר שהאנשים שבה ירצו לקנות. יש לקבוצות כאלה גם תרומה לשיפור השירות ללקוחות ועוד.

ישנן שיטות לכריית נתונים, כמו כרייה ברשת (Web Mining), סוג של כריית נתונים שמתבצע באתרי אינטרנט שונים וברשתות חברתיות גדולות כמו פייסבוק וטוויטר, במטרה לזהות בהם מאפייני התנהגות של גולשים. מידע שנאסף כך משמש, לעתים קרובות ללא ידיעת הגולש, להגדלת המכירות ואף נמכר לחברות אחרות.


הנה הסבר של מומחה על כריית המידע:

http://youtu.be/R-sGvh6tI04


המידע הזה ישמש בידיהם של מנתחי נתונים, דאטה אנליסטים (עברית):

https://youtu.be/M2lx5C6j2R4


מנתחי מידע כאלה חשובים גם בצה"ל (עברית):

https://youtu.be/a8eP40HlWN4


והרצאה על כריית ואיסוף נתונים (עברית):

https://youtu.be/phSjbS4tbSs?long=yes


אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

העולם הוא צבעוני ומופלא, אאוריקה כאן בשביל שתגלו אותו...

אלפי נושאים, תמונות וסרטונים, מפתיעים, מסקרנים וממוקדים.

ניתן לנווט בין הפריטים במגע, בעכבר, בגלגלת, או במקשי המקלדת

בואו לגלות, לחקור, ולקבל השראה!

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.