» «
פרומפט
מה עושה הפרומפט בעולם הבינה המלאכותית הגנרטיבית?



מהו המקביל של מברשת של הצייר, מקלדת המלחין או הבוס של כותב המאמר, עורך הווידאו או המשורר בעולם הבינה המלאכותית הגנרטיבית? - מיהו זה שאומר מה הוא צריך והם יושבים לעבוד וליצור?

זהו הפרומפט (Prompt), ההנחייה הטקסטואלית שאנחנו נותנים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו תוצר בינתי.

בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצר שרוצים לקבל מהבינה.

היום הפרומפט הוא המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.

זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.


#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.

יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.


#הנשיא פרומפט, או איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בהנחיות טובות לבינה הגנרטיבית:

פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:

ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח. אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, הציבו גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".

שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה. זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.

בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').

הסבר כמו למתחיל - בקשו בפרומפט כך:

"Explain [subject] in simple terms. Explain to me as if I'm a beginner."


הנה השיעור הראשון בניסוח הפרומפט:

https://youtu.be/Qos2rG3zVAM


איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney (עברית):

https://youtu.be/zFS7WtovYmo


יש תוכנה לעזרה בניסוח פרומפטים (עברית):

https://youtu.be/HLhRFaXQ0vQ


על הפרומפט שמייצר חדשות קוליות לגיק:

https://youtu.be/5TlsXXTamBs


מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:

https://youtu.be/pZsJbYIFCCw


הנה מקצוע מהנדס הפרומפט:

https://youtu.be/Bq-ncjOGeVU


והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:

https://youtu.be/hd7l9F3n4ZM?long=yes
ChatGPT
האם ChatGPT יפגע בנו בעתיד כשייקח לנו את העבודה? ואיך להימנע?



בפשטות כן. אולי לא בכולנו ולא בכל אנשי המקצוע אבל הבינה המלאכותית תוכל לגרום לקשיים עבור רבים - בעבודה ובעולם התעסוקה. באופן מסוים, היא עלולה להביא את העולם אפילו למשבר כלכלי של ממש.

אלא אם... חכו עוד מעט.

בשלהי שנת 2022 כל העולם דיבר לפתע על הצ'אט בוט המדהים של Open AI שנקרא ChatGPT. ה-GPT הוא קיצור בראשי תיבות של Generative Pre-trained Transformer.

מודל השפה שעליו התבססו המפתחים בחברת Open AI נקרא GPT-3, אבל גרסה 4 ואלו שאחריה לא יאחרו והמירוץ לפתח אותו ומודלים רבים אחרים יימשך. כי במקביל לעבודה המדהימה שעושים מפתחי Open AI פותחו די מהר כלים מתחרים.

ביחס לכל מוצר AI שהיה נגיש לציבור בעבר, ChatGPT ומקביליו עושים דברים מדהימים, מהפכניים וכמעט בלתי נתפשים במהירות שהם מבוצעים.

אז נכון שיש לצ'אט הזה ולעמיתיו עוד דרך עד שנוכל לסמוך בעיניים עצומות על הידע והמידע שהם מציעים לנו, אבל בתחומים מסוימים הם כבר כאן ועם יכולות בינה מלאכותית שהן די מהפכניות.


#אז הלך עלינו?
הבינה המלאכותית שמפגינים ChatGPT ושאר כלי ה-GPT יכולה לעשות בהצטיינות עבודות של איסוף ומיון של מידע או ידע (שני דברים שונים) ואחרי זה גם כתיבה ויצירה.

כי ה-AI ברמה הגבוהה הזו יודעת לחקות אמנות, לצייר, לתקן תמונות, למצוא תשובות לשאלות, להכין שיעורי בית, להמציא מתכונים, לכתוב עבודה לבית הספר, לחבר מוסיקה, לערוך וידאו, לכתוב קוד ולתכנת, לחבר טקסטים, לנסח מכתבים ומאמרים ועוד.

אבל היא יודעת בעיקר ליצור דברים דומים למה שכבר נעשה. אמנם ברמה גבוהה, אפילו מאוד, אבל על סמך חשיבה מקצועית וסטנדרטית של אנשי מקצוע בתחומים השונים.


#מה היא לא?
בתחום היצירה הבינה המלאכותית לא תשתווה לאנשים יצירתיים, מקוריים, שיסטו ממה שכולם יודעים לעשות ויחוללו את הפלאים שלהם. היא תדע לעשות טוב יותר ומהר יותר את מה שאנשי מקצוע טובים עושים, אבל היא תתקשה לצאת מהטוב אל המצוין, הגאוני, המבריק.

לכן היא לא תפגע באנשי מקצוע מעולים ומקוריים, בבני אדם יצירתיים, עם חשיבה מיוחדת ולא שבלונית, עם יכולת המצאה.


#אז מה ההזדמנות?
וזו רבותי ההזדמנות שלכם. משתלם היום לפתח את היצירתיות והחשיבה המקורית, ללכת על להיות קצת יותר אמן ממידען, להיות מעט פחות מהנדס "רגיל" ויותר ממציא ומי שמוצא פתרונות, כולל באינטרנט אבל לא רק - כי פתרונות לתחום אחד כבר מיושמים לא פעם בתחום אחר.

נמשיך? - להיות יותר סופר מאשר עיתונאי, יותר מלחין מאשר רק נגן ויותר מעצב מאשר גרפיקאי ביצועיסט.


#יכולות?
לשם כך דרושות יכולות מגוונות שמערכת החינוך והעולם המקצועי לא מפתחים יותר מדי. יצירתיות, ידע כללי, סקרנות וחוצפה הם חלק מהיכולות הללו.

יצירתיות - הציצו אצלנו בתגית "יצירתיות" והבינו את הצד הזה ואיך לפתח אותו. התחלה מעולה לרכישת ידע כללי תהיה באאוריקה, בהאזנה לפודקסטים, צפייה בסרטי דוקו וסרטונים של ידע ביוטיוב ועיון בבלוגים של ידע, באזור המסקרן והלא משעמם של האינטרנט ובתנאי שהוא מתויג ולא חד-ממדי.

סקרנות - גם היא תכונה שנולדתם איתה וכדאי לשמר, במיוחד כשמסביבכם יעשה כמעט כל גוף חינוכי ניסיון להשבית אותה, לטובת חיפוש תשובות סטנדרטיות ושתהיו ותנהגו "כמו כולם". כל דבר שתלמדו לבד ותחקרו אין ספק שתזכרו טוב יותר ויום אחד עשוי לשרת אתכם, לעומת שיעורי בית שכמעט אף פעם לא. היזהרו מתופעה שבעולם החינוך מוכרת כ"Yessing". חיפוש חשובות שהמורה יאהב, תשובות לשאלות שניתן למצוא בקלות ואפילו בלי חשיבה. אז מה הטעם בהן? לא עדיף שישאלו אותנו בבית הספר מעט פחות שאלות, אבל כאלה שיעודדו אותנו להשתמש בשתי האונות או בכל אזורי המוח? חקרו כאן את תגית "סקרנות".

חוצפה - על זה לא צריך להרחיב אבל נדגיש שמדובר בחוצפה מקצועית ולא התנהגותית. להעז. לא לומר לעצמכם שאינכם יודעים מספיק כדי לפתח או להמציא, לחבר או לצייר. פשוט ללכת על זה, לחקור איך, לאסוף דרכים, לחפש שיטות וטכניקות לאמנות וליצירה ביד. נסו להמציא שיטות חדשות לעשות דברים וחקרו אותן, לנסות לעבוד איתן. חפשו ידע ושאלו באינטרנט עד שתקבלו תשובות. כתבו דברים כי לא פעם רק כשכותבים מבינים. זה בסדר לגנוב ולהעתיק ואז לפרק, ללמוד, להרכיב מחדש, לעבד ולהבין כיצד לשלוט במיומנויות הכרחיות. אם אין זמן אז קומו שעתיים קודם או לכו לישון מאוחר, גם אם תהיו קצת עייפים בבית ספר. גם ככה, אתם יודעים...

כישלונות - עוד דבר שיעזור ויהיה הכרחי הוא היכולת שלא להיבהל מכשלון ואפילו ללמוד לחבק אותו. חינכו אותנו שההצלחה היא המטרה, בעוד שמה שמתקשר אצל רובנו עם כישלון הוא כמעט תמיד אכזבה ופנים נפולות. אז כדאי שתדעו שכישלונות הם חלק בלתי נפרד מההצלחה. היכולת שלא להרפות וליפול ברוח מהכשלון היא שמבדילה בין בני אדם. היא שמביאה נשים ואנשים בסופו של דבר להצלחה. אדיסון אמר על זה פעם שההמצאות הגדולות שלו היו כולן כשהוא לא הצליח להיכשל... האמינו לו! אמר את זה אדם שחתום על מאות פטנטים והמצאות ששינו את העולם.

בשום מקום לא נכתב כמה פעמים הוא נכשל בכל תהליך, עד שהוא הצליח בו. תמיד מספרים רק על ההצלחה אז אנחנו לא יודעים, אבל עכשיו אתם יודעים.

אומרים לך שזה גרוע? -המשיכי. צעקו לך בוז? - המשך. כמעט כל מצליחן ופורץ דרך שמע את זה בהתחלה. על בוב דילן אמרו שיש לו קול של צפרדע, המטוסים של האחים רייט צללו בזה אחר זה, הבכורה של האופרה הכי פופולרית בהיסטוריה "כרמן" הסתיימה בקריאות בוז וירקות שהושלכו על הבמה. את הסרט "בלייד ראנר" קטלו כשהוא עלה...

אז אמרו... מה הם יודעים?!?!

לא להרפות! - אין הבטחות, אבל עקביות חשובה לא פחות מחשיבה, יצירתיות, סקרנות ומקוריות. בלעדיה כמעט ואין סיכוי להגיע למימוש כי לא מגיעים בכלל.


#אתם הורים?
אם אתם מגדלים היום את ילדיכם יש לכם אחריות ואפשרויות. תנו להם כלים, יכולות, הרימו ותפתחו את הכשרונות המלבלבים שלהם. אל תכבו אותם עם הרגיל ועם מה שאתם למדתם או רציתם להיות. בעולם שלהם אתם תהיו מבוגרים מדי או, וסליחה שאנחנו מזכירים, אולי כבר לא תהיו.

תנו להם לחקור מה ירצו לעשות. חישפו אותם לתחומים, לעולמות ולתופעות. תנו להם דוגמה אישית, קראו ספרים, אל תעשנו, אל תהיו בטטות - צאו לעשות ספורט ואם כבר אז גם אכלו נכון. צאו איתם לטבע, לטיול או הליכה, הביטו יחד בפרחים, נסו לזהות אותם ולחקור עליהם. קראו ספר בעצמכם והביאו את הספריה של הבית לסלון, אל מול עיניהם. כבו מדי פעם את הטלוויזיה ונהלו שיחות ביניכם אל מול עיניהם. שתפו אותם, שאלו על מה מעניין אותם ומה ירצו להיות, מה החלומות שלהם, איפה הם רואים את עצמם בגיל 25.

התעניינו בהם באמת. מה מסקרן אותם. מה מרגש. התעניינו איזה חוג הכי מעניין אותם ואם אין מספיק כסף בקשו בשקט הנחה כדי שלא לבייש אותם.

נסו להשיג להם דברים שיאפשרו להם לפתח את תחומי העניין, לקנות יד שנייה, לחנך אותם שחדש זה ממש סתם ואם ראו משהו זרוק שלא יתביישו לקחת, לפרק ולהרכיב ממנו חללית. צפו איתם בתכניות מדע או בסרטי דוקו, הראו להם סרטים קלאסיים, למדו אותם ששחור לבן הוא לא פחות צבעוני ושמינימליזם הוא לא פעם הכי עשיר שיש (Less is more). בגיל צעיר ספרו להם סיפור לפני השינה. זה כל כך חשוב שאתם לא מעלים על הדעת. הרבה יותר מ-GPT, מציור בינתי וממדעי המחשב באוניברסיטה. היו הורים, לא רק אנשי קריירה.


הנה ChatGPT ולמה בחינוך מודאגים ממנו:

https://youtu.be/Fn8jDanbf0c


בעלי מקצוע מפחדים על העבודה שלהם (עברית):

https://youtu.be/0AGYOv0sGHg


תראו למשל איך הוא מייצר קליפים (עברית):

https://youtu.be/8CmXtj5gW2I


איך הצ'אט GPT בניתוח קוד? (עברית)

https://youtu.be/Z46pqHFuKHs


בחיוך - מה הכלי היחידי שיש לנו כבני אדם כדי לזהות אם הכותב או הדובר הוא בוט כמו ChatGPT? (עברית)

https://youtu.be/nes_xZjZweY


והניסיון להבין מה אומר ה"בארד" של גוגל בעניין (עברית):

https://youtu.be/oh4Bq8ifgK4?long=yes
מכונות במקום אנשים
מי חשב מזמן שאוטוטו מכונות יחליפו בני אדם לחלוטין?



זה היה הרברט סיימון שאמר בשנת 1956 ש"בתוך 20 שנה, מכונות יהיו מסוגלות לעשות כל מלאכה שבני אדם יכולים לעשות."

אז נכון שבאמת מכונות הולכות ומחליפות את בני האדם בהמון תחומים שבעבר נשמרו לידיים אנושיות, אבל זה לא קרה בשנות ה-70 של המאה הקודמת ולמעשה גם היום עדיין לא התממש, לפחות לא כמו שצפה סיימון. אגב, ההערכה של אותם מומחים, של מתי יחליפו מחשבים את האדם התבוני, הולכת ומתרחקת. אם פעם נטו לחשוב שזה ייקח שנים ספורות, לאט לאט זה הלך והתארך וההערכות נעשו ראליות יותר. זה קרה משום שהמומחים הלכו והבינו כמה מורכב לייצר מחשב תבוני, ברמה של בן אדם חושב.

בתחומים רבים החליפו היום תוכנות חכמות, רובוטים מתוכנתים ואלגוריתמים מתוחכמים להפליא, את העובדים האנושיים שעבדו לפניהם, אבל הקצב עדיין זוחל יחסית לנבואה ההיא.

כך שגם אם נראה שנצטרך להמתין עוד קצת עד שרובוטים חכמים ומצוידים בבינה מלאכותית יחליפו את הידיים והראש של בני-אדם כמעט לגמרי, זה עלול לקרות בעתיד בתחומים רבים.

נראה שזה ייקח עוד זמן מה, אבל בתחילת 2023 נראה שהבינה המלאכותית והלמידה העמוקה החלו פולשות גם לעולם של היוצרים ובגדול ולאיים על הקריירה שלהם.

כלים כמו ChatGPT ו-DALL-E של OpenAI, או המתחרה Stable AI, מציגים יצירות בינה מלאכותיות, זוכים להצלחה בעולם היצירה והאמנות ומעוררים את הדיון הציבורי. אפליקציות כמו Lensa AI ממנפות את ה-Stable Diffusion בקוד פתוח ויוצרות ברגע ציורים ואוואטרים ברמה של אמנים מקצועיים, הדבר מתחיל להשפיע על האמנים עצמם.

האופן שבו מחוללי אמנות AI (אנחנו באאוריקה מכנים אותם "מחוללאי") יכולים להחליף יוצרים ולמסמס את פרנסתם הוא די ברור. אבל דברים מסוימים אסור שיימסרו לעולם לידיהם של רובוטים ומכונות. החל מתחומים שמחייבים אתיקה וחשיבה מוסרית ועד נושאים שבהם מכונות עלולות להגיע ליכולת של השתלטות ואף למצב של לוחמה במין האנושי - אם נהיה תלויים בהם שם, אזי יש סיכוי שהמין האנושי ייפגע אנושות ואף יושמד לחלוטין. או בלשון של אחד מהמומחים הגדולים בתחום, הפרופסור מרווין מינסקי מאוניברסיטת MIT שאמר שבסוף "זה יהיה מזל אם הם (הרובוטים) יתנו לנו להיות חיות המחמד שלהם..."


הנה סרטון שמתאר החלפת עובדים ברובוטים במפעלי פוקסקון שמייצרים סמארטפונים:

http://youtu.be/Vd5R7BHcFfo


תיאור של האבטלה החדשה, שנוצרת כתוצאה מטכנולוגיה שהולכת ומחליפה בני-אדם (עברית):

https://youtu.be/jM00QpOysj8?t=44s


וכך הציג צ'ארלי צ'פלין בחיוך מריר את מכונת ההאכלה שתאכיל את העובד על פס הייצור, כדי לחסוך זמן:

https://youtu.be/_OKs2MWaBcA
רובוט מצייר
האם רובוטים יכולים לצייר?



בהחלט. אמנם לרובוטים אין דמיון והיצירתיות שלהם היא רק בתחילת הפיתוח שלה, אבל רובוטים כבר מציירים.

כי על אף שהמרכיב היצירתי אצל הרובוטים הללו הוא חלקי והם אינם מסוגלים ליצור אמנות מורכבת ומופשטת כמו האמנים האנושיים, עולם הבינה המלאכותית מבטיח שרובוטים בעתיד יוכלו להגיע לרמות מדהימות של יצירה והמצאה, גם בתחום האמנות.

העניין הזה מעלה, אגב, לא מעט שאלות חשובות, הן אמנותיות והן פילוסופיות. אחת הראשונות שבהן תהיה מי ייחשב ליוצר של יצירת אמנות שיצר רובוט - האם האמן שיקבל את הכבוד יהיה יוצר הרובוט או שבעתיד נעמוד בתור לתערוכה מעבודתו של X512V, הרובוט של חברת גוגל.

אגב, את הכסף יקבלו בכל מקרה בעליהם החוקיים של הרובוטים, כך שזה לא עניין כלכלי. יוקרה וכבוד אולי לא ואולי כן, אבל הכסף בכל מקרה יגיע לידיהם.


הנה פול, רובוט פשוט שמצייר דיוקן של מי שמתייצב מולו:

https://youtu.be/bbdQbyff_Sk


אהרון, שהוא רובוט יצירתי שלא מצייר את מה שהוא רואה, אלא גם רעיונות ויצירות אישיות:

https://youtu.be/-U-lQYwzFAQ?t=15s


אולי עוד לא אמן אבל שוליה של אמן או משכתב - בינה מלאכותית נוסח "DALL-E" כבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:

https://youtu.be/qTgPSKKjfVg


וכן - רובוטים יכולים להיות יצירתיים, בערך... (עברית)

https://youtu.be/Rh9vBczqMk0

מחוללי בינה מלאכותית

DALL-E 2
מהם מנועי הציור הבינתי נוסח Dall-e ומידג'רני?



הבינה המלאכותית (AI) DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.

הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצר AI, לצייר, צלם ועוד כל מיני אמנים - אבל באינטליגנציה מלאכותית.

באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימיבייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ולא פעם אף מדהימים.

ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.

להישג המקורי של DALL-E וגרסתה המשופרת DALL-E 2, תוצר של חברת OpenAI, קמו די מהר מתחרים ראויים נוספים ואיכותיים לא פחות, המייצרים עולם חדש וחסר תקדים של ציירים מכניים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.

איש לא יודע בדיוק כיצד DALL-E פועל, גם לא היוצרים של המודלים שלפיהם הוא פועל. אבל זו העבודה המדהימה של הלמידה העמוקה שמעבדת בעצמה את הדאטה ממיליוני התמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.

התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית וחוץ מתחרות של חברות וקוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין.


הנה הבינה המלאכותית נוסח "דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:

https://youtu.be/qTgPSKKjfVg


כתבה על היכולת המופלאה של דאלי 2 ליצור אמנות:

https://youtu.be/hiSgpZUAy2c


הסבר אמנות ה-AI:

https://youtu.be/alJdw4JDJ4o


מנועי יצירת תמונות מתחרים ומקבילים ל-DALL-E:

https://youtu.be/rGbNJrywLhk


ה"אאוט פיינטינג" של דאלי2, בו הוא מרחיב תמונה:

https://youtu.be/G-Wsh1vUeVQ


מדריך להרחבת תמונות:

https://youtu.be/V1KLG159A2s


קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:

https://youtu.be/VR3AWdyVVdU


למה יש לבינה כל הזמן בעיה עם אצבעות?

https://youtu.be/24yjRbBah3w


גם למחוללי בינה כמו מידג'רני יש בעיות (עברית):

https://youtu.be/xUpUhHsAWlg?long=yes


ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:

https://youtu.be/FRClNMC_z-s?long=yes
דיפ פייק
מהם סרטוני דיפ פייק ומה הבעיה בהם?



דיפ פייק (Deep fake או Deepfake) הוא שמה של טכנולוגיית וידאו, מבוססת בינה מלאכותית (AI), המאפשרת לייצר מציאות שנראית אמיתית ומבוססת על אנשים אמיתיים, אך לא התרחשה מעולם.

זה נעשה על ידי לקיחת תמונות, סרטונים וקולות ושינוי שלהם באמצעות AI, באופן שמאפשר לייצר תכנים דומים, הנראים אמיתיים, אך מעולם לא קרו, התרחשו או נאמרו באמת.

טכנולוגיה זו הולכת ותופסת בשנים האחרונות את מקומה ברשתות החברתיות שבאינטרנט.

העיקרון המוביל בסרטוני ה-Deepfakes הוא שחזורי פנים מדויקים, המולבשים על סרטוני וידאו, תמונות או אנימציה ומייצרים מראות הנראים אמיתיים לגמרי.

בסרטונים, למשל, מדובר על החלפת פניו של מי שצולם בווידאו, באמצעות למידת מכונה. התוצאה של זה היא יצירה בקלות של סרטוני וידאו המציגים אנשים העושים מעשים שמעולם לא עשו באמת או אומרים דברים שלא נאמרו.


#תולדות ה"דיפ פייק"
את לידת הטכנולוגיה הזו סימנה אפליקציה בשם FakeApp, שפותחה בסין על ידי מיזם בשם MoMo. המיזם היה ככל הנראה החלוץ בכך שאפשר להמונים להדביק את פניהם לזמרים, שחקנים ודמויות ממשחקי וידאו. לראשונה ראו המשתמשים שמספיקה תמונה אחת של פניהם, כדי שהאפליקציה תדביק ותמפה אותה באופן אוטומטי על גבי הקליפים שהיא מציעה.

בשנת 2016 כבר פותחו מערכות למידת מכונה אוטומטיות וחזקות יחסית, כאלה שלומדות ומשתפרות בעצמן, ככל שהן מופעלות. המערכות הללו חזרו שוב ושוב על תהליכי יצירת Deepfake וככל שהתהליך נמשך, לאחר מיליוני פעמים, הן שיפרו את התוצר. בשנה זו יצאו כבר תוכנות שאפשרו זאת גם על מחשבי PC ביתיים וחלשים יחסית.

את שמה קיבלה הטכנולוגיה הזו בשנת 2017, ממשתמש באתר Reddit שכינויו "זיופים עמוקים". הוא טבע את המונח לאחר שערך כמה סרטונים פורנוגרפיים ובהם הוא הטמיע, באמצעות טכנולוגיית "למידה עמוקה" (Deep learning), את פניהם של ידוענים ומפורסמים שונים.

את פרסומה העיקרי חייבת הטכנולוגיה הזו לסרטוני "פייק ניוז", חדשות כזב, שיצרו תומכי פוליטיקאים בארצות הברית, במהלך קמפיין הבחירות לנשיאות 2020. לפתע החלו להופיע סרטונים בהם ממליצים ומסבירים נשיאי עבר ומשפיענים פוליטיים שונים על דברים בדויים ומנוגדים לאמת. על התחום הזה שווה לקרוא בתגית "פייק ניוז".


#למה משמשים סרטונים אלו?
טכנולוגיית ה-Deepfake משמשת ליצירת תוכן וידאו המציג מציאות בדויה לחלוטין, דברים שנראים ונשמעים אמיתיים ומצולמים, אך למעשה לא התרחשו מעולם.

ביטויי הסרטונים הללו, שזכו לכינוי Deepfakes, הם רבים. הם מתחילים מפוליטיקה בה מיוצרים כך נאומים שלא ננאמו ומעבירים מסרים בדויים מפיהם של ידוענים, מנהיגים ומפורסמים ומסתיימים כיום בסרטונים "פסאודו-תיעודיים", המציגים מעשים, מראות וטקסטים מדוברים, הנראים אמיתיים לחלוטין אך מעולם לא צולמו והוקלטו.

מדובר בעניין מהפכני. מעולם לא עמדה טכנולוגיה כה חזקה וריאליסטית לטובת תעשיית השקר, או בשמה המכובס, תעשיית ה"פוסט אמת".

בעולם של ה-Deepfakes השתפרו האפשרויות ליצירה והפצה של שקרים פראיים. הן כה מרשימות, עד כדי כך שמיליונים "נופלים בפח", מאמינים לסרטוני הדיפ פייק הללו ומשנים בגללם את דעותיהם ואף את התנהגותם והעדפותיהם הפוליטיות. ראו את סרטון הטבע שאנו מציגים למטה ובו בעלי חיים בדויים וכמה שהוא נראה אמיתי.


#סיכום
הכלים ליצירת סרטוני ה"דיפ פייקס" הם כלים טכנולוגיים, מתוחכמים מכל טכנולוגיה שעמדה בעבר לטובת השקרנים ומקדמי מה שזכה לכינויים כמו "אמת אלטרנטיבית", תיאוריות קונספירציה וכדומה.

מעולם לא עמדו טכנולוגיות כה חזקות לרשות השקרים הקטנים, להם מתאפשר עתה להמציא ולהפיק את הבדיות שלהם באופן מוחשי וריאליסטי מאי-פעם.

מצד שני, מעולם הדיפ פייק נולד עם הזמן גם יישום ה"דיפ נוסטלגיה". עד שימצאו גם לו שימושים מזיקים ואף מחרידים, זהו עולם חיובי, סנטימנטלי ומעורר התרגשות אמיתי, בהנחה שנוסטלגיה אינה מזיקה לאיש. ניתן לקרוא עליו בתגית "דיפ נוסטלגיה".


הסבר לטכנולוגיה (עברית):

https://youtu.be/lk-1hBpAyiU


אובמה מדבר פייק:

https://youtu.be/gLoI9hAX9dw


סרט טבע פיקטיבי שיצרו בעזרת Sora ומציג פייק חיות:

https://youtu.be/ObUBUKOn-bo


ההשלכות של זה מטורפות (עברית):

https://youtu.be/4BsiYnt51ok


כך יוצרים פנים ממאפיינים או שילובי פנים אמיתיים:

https://youtu.be/kSLJriaOumA


שעשוע עם טראמפ ומיסטר בין:

https://youtu.be/HN-qlGf2mZw


וקצת מוסיקה מצמד הנשיאים וחתול:

https://youtu.be/dsODRfCMRoM
דיפ נוסטלגיה
מהי טכנולוגיית הדיפ נוסטלגיה?



בשנים האחרונות הולכת ותופסת את מקומה טכנולוגיה מבוססת בינה מלאכותית (AI) שנקראת דיפ פייק (Deepfake). טכנולוגיה זו משמשת לייצור או שינוי תוכן וידאו כך שהיא מציגה מציאות שלמעשה לא התרחשה מעולם. מנאומים שלא ננאמו מעבירים מסרים בדויים מפיהם לכאורה, של אנשים מפורסמים ועד סרטונים "פסאודו-תיעודיים", שמציגים מראות וטקסטים מדוברים, שנראים אמיתיים אך מעולם לא צולמו והוקלטו.

ענף חדש בעולם הדיפ פייק הוא יישום שזכה לשם "דיפ נוסטלגיה" (™Deep Nostalgia), המנפיש את פניהם של אנשים שצולמו בתמונות ישנות או היסטוריות, ומזיז את פניהם, כאילו צולמו בווידאו.

הטכנולוגיה הזו פועלת על כל תמונת סטילס (תמונות קפואות), כולל תמונות בשחור-לבן ותמונות שצולמו בצבע.

השם ניתן ליישום פורץ דרך זה על ידי חברת MyHeritage, שעוסקת בפיתוח טכנולוגיה ליצירת עצי משפחה מקוונים.

סרטוני הדיפ נוסטלגיה התפרסמו כשאנשים שיתפו עם בני משפחתם וחבריהם סרטונים קצרים ומונפשים שנוצרו כך, ובהם קרוביהם ואבותיהם מזיזים את ראשיהם, מצמצים, מחייכים ונעים בצורה ריאליסטית כמעט לחלוטין.


#איך פועלת הדיפ נוסטלגיה?
דיפ נוסטלגיה מחזירה, אם כן, לחיים אנשים שצולמו בצילומי סטילס. זה מתחיל באיתור פני המצולמים בתמונות ואז הפקה של מחוות ותנועות מציאותיות, ממש כאילו צולמו בווידאו. ההנפשה של הפנים בתמונות הסטילס מראה אותם מחייכים, זזים וממצמצים, כאילו צולמו כך במקור.

בבסיס הטכנולוגי של יישום ה"דיפ נוסטלגיה" פועל אלגוריתם למידה עמוקה (Deep Learning), המחבר בין תווי הפנים של המצולמים לבין אוסף מחוות שצולמו בווידאו ושמורים במאגר החברה.

פיתוח וצילום אותן מחוות נעשה כשצילמו אנשי מיי הריטג' מראש שלל מקטעי וידאו של שחקנים ועובדי החברה, המזיזים את ראשיהם ופניהם באורח טבעי, ממצמצים, מחייכים ומפנים את ראשם לכיוונים שונים.

למעשה שכרה חברת MyHeritage רישיון מחברת D-ID, לטכנולוגיה שפותחה בה ומאפשרת שחזור, באמצעות טכנולוגיית למידה עמוקה, של סרטוני וידאו.

על מנת שאפקט ההנפשה יופעל על התמונות, ברזולוציה הכי גבוהה האפשרית, עוברות תמונות מטושטשות חידוד אוטומטי, שמבצעת הטכנולוגיה החדשנית, מה שמעלה באופן דרמטי את איכות הסרטונים המופקים בה.

ההברקה האמיתית של הטכנולוגיה הזו נעוצה בזיהוי והבחירה האוטומטית שמבצע יישום הדיפ נוסטלגיה, מבין מקטעי המחוות בווידאו. ניתוח מהיר של מנח הראש וכיוון העיניים של המצולמים בתמונה מאפשרים ליישום להתאים להם באופן חכם את מחוללי ההנפשה המיטביים ולייצר את הסרטונים המונפשים באופן אופטימלי.


#ממה נמנעו מפתחי הדיפ נוסטלגי?
אנשי חברת MyHeritage ומפתחי היישום המלהיב נמנעו מהוספת דיבור לסרטונים.

לאור העובדה שטכנולוגיית הדיפ פייק ידועה ביכולות המטורפות שלה, גם בתחום הדיבור, נשאלת השאלה מדוע. הרי ניתן היה לשתול בפי המצולמים טקסטים מדוברים, שהיו נשמעים אמיתיים, על אף שמעולם לא צולמו והוקלטו.

ראשית, חשוב לומר שזיהוי קולי של המצולמים, ככל שמדובר באנשים שקרוביהם זוכרים עדיין את קולם האמיתי, היה מפחית את אפקט המציאות שיוצרים הסרטונים הללו.

אבל יש עוד סיבה לכך.

ב-MyHeritage מציינת שההימנעות מאפקטים קוליים של דיבור היא מכוונת. מטרתה, הם מטעימים, היא "למנוע שימושים זדוניים בכלי", דוגמת אלה שנעשים בסרטוני "דיפ פייק" של פוליטיקאים וידוענים שעודם בחיים.

לכן הם גם מבקשים מהמשתמשים לעשות בכלי שימוש רק על תמונות היסטוריות השייכות להם ולהימנע משימוש בתמונות של אנשים חיים, שלא אישרו את השימוש הזה.


הסבר לטכנולוגיה (עברית):

https://youtu.be/O4VPN_YjgIM?t=21s


הנה הדיפ נוסטלגיה:

https://youtu.be/tjBYSnoAWqg


ציורים מפורסמים שקמים לתחייה:

https://youtu.be/TWY1uBK4Zxc


ואפילו דיקטטורים קמים לתחיה עם הדיפ נוסטלגיה של מיי הריטג':

https://youtu.be/a-HR03bToew


אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

העולם הוא צבעוני ומופלא, אאוריקה כאן בשביל שתגלו אותו...

אלפי נושאים, תמונות וסרטונים, מפתיעים, מסקרנים וממוקדים.

ניתן לנווט בין הפריטים במגע, בעכבר, בגלגלת, או במקשי המקלדת

בואו לגלות, לחקור, ולקבל השראה!

אֵאוּרִיקַה - האנציקלופדיה של הסקרנות!

שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.