» «

סירי

שפה טבעית
מהי שפה טבעית ואיך היא קשורה למחשבים?



שפה טבעית (Natural language) היא שפה שמדברים בה בני אדם. בניגוד ל"שפות מלאכותיות" כמו שפות המחשב שבעזרתן מתקשרים עם מחשבים, או שפות לוגיות ואחרות, השפה הטבעית נוצרה באופן טבעי, על ידי בני אדם וכדי לתקשר אחד עם השני.

אנגלית, צרפתית או עברית, למשל, הן שפות טבעיות. מדהים שיש בעולם כ-6,000 שפות טבעיות ועד לפני מספר שנים לא ניתן היה לתקשר עם מחשב באף אחת מהן.

התקשורת עם מחשב בשפה טבעית, כיום, אם על ידי דיבור או בכתיבה בשפה רגילה, היא נוחה וטבעית יותר. בשנים האחרונות שופרו היכולות הללו של תקשורת בין אדם למחשב בעזרת שפות טבעיות.

זה תחום שנקרא "עיבוד שפה טבעית" (Natural language processing, או בקיצור NLP). הוא מבוצע בין השאר על ידי פיתוח תוכנות חכמות ולומדות, המנצלות בינה מלאכותית כדי שהמחשב "יבין" על מה המשתמש מדבר, כשהוא מתקשר אתו בשפה טבעית ויוכל לסייע בצורה שהמשתמש יבין.

ממחשבי-על חכמים ועד לסייענים אישיים באפליקציות סלולאריות - תוכנות רבות כיום מבינות ברמות שונות "שפות טבעיות" (Natural languages), שמאפשרות תקשורת עם המשתמש בדיבור רגיל ולא בשפת מחשב מיוחדת.

הסבר מקיף של המושג "עיבוד שפה טבעית" יש בתגית "NLP".


הנה קדימון הסרט "היא" על אדם שמתאהב במערכת הפעלה חכמה, שמבינה שפה טבעית:

https://youtu.be/4F_tHMxx23I?t=5s


שיחה עם קווירי, אפליקציה המסייעת בחיפושים, ה"מבינה" שפה טבעית:

https://youtu.be/-jrjfIDGYAE


עוזר רפואי באפליקציה שמשתמשת ב-NLP להבנת הדיבור של המשתמש:

https://youtu.be/foQIVavHA4Y


ובמרץ 26 - האם אפל חוזרת לעניינים?

https://youtu.be/u0-fLz6taNQ
בעיית מסיבת הקוקטייל
מהי בעיית מסיבת הקוקטייל?



מכירים את זה שחבר מפעיל את הסירי שלו במסיבה, שהוא מדבר אליה והיא מצליחה או לא מצליחה להבין מה הוא אומר? - זה לא ברור מאליו.

"אפקט מסיבת הקוקטייל" (Cocktail party effect) ולפעמים "בעיית מסיבת הקוקטייל" (Cocktail Party Problem) הם השמות שניתנו לתופעת האבחנה בין בליל הקולות האנושיים המתערבבים זה בזה. מדובר באפקט ידוע מתחום הפסיכולוגיה הקוגניטיבית.

בעיית מסיבת הקוקטייל (Cocktail Party Problem) שואלת שאלה פשוטה לכאורה: כיצד המוח האנושי מצליח להתמקד בקול אחד בתוך ים של רעשים?

דמיינו שאתם עומדים במסיבה רועשת, עשרות שיחות מתנהלות סביבכם בו זמנית, מוסיקה מתנגנת ברקע, כוסות מתנפצות. ובכל זאת, אתם מסוגלים להקשיב בדיוק לאדם שעומד מולכם. יותר מזה: אם מישהו בצד השני של החדר מזכיר את שמכם, אתם מיד שומעים אותו. המוח שלנו עושה משהו שמחשבי-העל המתוחכמים ביותר עדיין מתקשים לשחזר.

הבעיה הוגדרה לראשונה ב-1953 על ידי המדען הבריטי קולין צ'רי (Colin Cherry), שחקר כיצד בני אדם מפרידים בין קולות מעורבבים. בניסוי מפורסם שלו, הוא ביקש מנבדקים להאזין לשתי הקלטות שונות בו זמנית, אחת לכל אוזן, ולעקוב אחרי רק אחת מהן. הנבדקים הצליחו לבצע זאת בקלות, אבל כמעט ולא זכרו דבר ממה שנאמר באוזן השנייה. האנקדוטה המשעשעת: כשצ'רי החליף את הדיבור באוזן השנייה לדיבור הפוך, כמעט אף אחד לא שם לב.

הוא גילה שבני אדם משתמשים ברמזים כמו מיקום מרחבי של הדובר, גובה הצליל, קצב הדיבור, אפילו היכרות עם הקול. המוח שלנו, כך מתברר, הוא מנגנון סינון מדהים שפועל ברובד לא מודע לחלוטין.

מחקרים מאוחרים יותר, כמו אלה של דונלד ברודבנט (Donald Broadbent) ב-1958, הציעו שהמוח פועל כמו "מסנן בקבוק" שמאפשר רק לערוץ מידע אחד לעבור בכל רגע. אחר כך הגיעה אן טריסמן (Anne Treisman) וסיבכה את התמונה: היא הראתה שהמוח לא פשוט חוסם מידע, אלא מחליש אותו, ולכן עדיין מסוגל "ללכוד" מילים משמעותיות כמו שמך גם מהשיחות שסוננו.

נמצא שליכולת הזו האחראית היא המערכת הרטיקולרית במוח, מערכת שאחראית למנגנון הקשב הסלקטיבי שיש לנו. תפקידה של המערכת הוא לעורר ולהסב את תשומת ליבנו לכל גירוי סביבתי שאנו תופסים כרלוונטי ובו בזמן לסנן אותו מבעד לגירויים אחרים.

בדיוק כמו כשאנו רוצים לשמוע שיחה של אדם או זוג ספציפי מבין אנשים רבים שמדברים, היום הבעיה רלוונטית מאוד בעולם הטכנולוגיה. מערכות זיהוי דיבור, מכשירי שמיעה, מערכות ועידת וידאו, כולן מתמודדות בדיוק עם אותו אתגר.

אחד האתגרים הגדולים ביותר בפיתוח עוזרות קוליות כמו סירי (Siri) ואלקסה (Alexa) היה ללמד אותן להתעלם מרעשי הרקע ולזהות רק את קולו של המשתמש, בדיוק כפי שמוחנו עושה זאת ללא מאמץ וכתוצר של אינספור שנות אבולוציה.

לפריצת הדרך אחראים שני חוקרים ישראלים שהצליחו להפריד בהצלחה קולות של מספר דוברים זה מזה ובהמשך גם לגרום למערכת להבין עצמאית וללא התערבות אנושית כמה דוברים היא "שומעת". כל זאת באמצעות דיפ לרנינג, בעברית "למידה עמוקה", הכלי החזק בלמידת מכונה (Machine Learning).

בעקבות פרסום מחקרם פורץ הדרך של ד"ר יוסי עדי ואליה נחמני מאותו מרכז מו"פ של פייסבוק בישראל, פיתחו חוקרים מהאוניברסיטה הטכנולוגית של הלסינקי מערכת שבאמצעות בינה מלאכותית פתרה למעשה את "בעיית מסיבת הקוקטייל".


הנה בעיית מסיבת הקוקטייל (עברית):

https://youtu.be/nmxeVf9KimE


את העניין הזה לומדים בלימודי הפסיכולוגיה:

https://youtu.be/9yRm7iWwFws


והסבר התופעה:

https://youtu.be/iO3jTl0WuS4


אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

העולם הוא צבעוני ומופלא, אאוריקה כאן בשביל שתגלו אותו...

אלפי נושאים, תמונות וסרטונים, מפתיעים, מסקרנים וממוקדים.

ניתן לנווט בין הפריטים במגע, בעכבר, בגלגלת, או במקשי המקלדת

בואו לגלות, לחקור, ולקבל השראה!

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.