שלום,
נראה שכבר הכרתם את אאוריקה. בטח כבר גיליתם כאן דברים מדהימים, אולי כבר שאלתם שאלות וקיבלתם תשובות טובות.
נשמח לראות משהו מכם בספר האורחים שלנו: איזו מילה טובה, חוות דעת, עצה חכמה לשיפור או כל מה שיש לכם לספר לנו על אאוריקה, כפי שאתם חווים אותה.
»
«
פרומפט
מה עושה הפרומפט בעולם הבינה המלאכותית הגנרטיבית?
מהו המקביל של מברשת של הצייר, מקלדת המלחין או הבוס של כותב המאמר, עורך הווידאו או המשורר בעולם הבינה המלאכותית הגנרטיבית? - מיהו זה שאומר מה הוא צריך והם יושבים לעבוד וליצור?
זהו הפרומפט (Prompt), ההנחייה הטקסטואלית שאנחנו נותנים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו תוצר בינתי.
בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצר שרוצים לקבל מהבינה.
היום הפרומפט הוא המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.
זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.
#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.
יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.
#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:
פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:
ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח. אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, הציבו גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".
שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה. זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.
בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').
הסבר כמו למתחיל - בקשו בפרומפט כך:
"Explain [subject] in simple terms. Explain to me as if I'm a beginner."
כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):
https://youtu.be/joJVqKTPVsY
השיעור הראשון בניסוח הפרומפט:
https://youtu.be/Qos2rG3zVAM
איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):
https://youtu.be/zFS7WtovYmo
יש תוכנה לעזרה בניסוח פרומפטים (עברית):
https://youtu.be/HLhRFaXQ0vQ
על הפרומפט שמייצר חדשות קוליות לגיק:
https://youtu.be/5TlsXXTamBs
מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:
https://youtu.be/pZsJbYIFCCw
הנה מקצוע מהנדס הפרומפט:
https://youtu.be/Bq-ncjOGeVU
והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:
https://youtu.be/hd7l9F3n4ZM?long=yes
מהו המקביל של מברשת של הצייר, מקלדת המלחין או הבוס של כותב המאמר, עורך הווידאו או המשורר בעולם הבינה המלאכותית הגנרטיבית? - מיהו זה שאומר מה הוא צריך והם יושבים לעבוד וליצור?
זהו הפרומפט (Prompt), ההנחייה הטקסטואלית שאנחנו נותנים למכונה, כלומר לכלי הבינה הגנרטיבי (Generative AI). את ההנחייה הזו אנו כותבים לו כדי שייצר לנו תוצר בינתי.
בפשטות, פרומפט הוא התיאור המילולי בשפה טבעית של התוצר שרוצים לקבל מהבינה.
היום הפרומפט הוא המלך של עולם הבינה המלאכותית מבוססת הדיאלוג וסוגי מודלים של שפה.
זה אמנם נשמע דומה לביטוי חיפוש, אבל הפרומפט הוא לא המקבילה הפשוטה של ביטוי החיפוש במנועי חיפוש, אלא בניסוח מאוד מוקפד של התוצר הרצוי, שיכול ללכת ולהשתבח במהלך הצ'אט עם הבוט, ככל שנרצה להשביח את התוצאה שקיבלנו.
#לג'נרט אהבה
הפעולה הזו ,של ניסוח הפרומפט, זכתה בעברית החדשה לשם הפעולה "לג'נרט" (To generate). היא זו שבמידה רבה תקבע את האיכות של התוצרים.
יש אפילו מקצוע חדש שהולך ומלבלב בעולם ה-AI. הוא נקרא, החזיקו חזק, "מהנדס פרומפטים" (Prompt Engineer). מדובר באדם שמיומנותו בניסוח של פרומפטים מוצלחים.
#איך להצליח בפרומפט?
כמה מרכיבים יוכלו לסייע בכתיבת הנחיות טובות לבינה הגנרטיבית:
פירוט ודיוק - אמנם הפרומפט יכול להיות משפט פשוט כמו "כתוב סיפור לילדים על החתול שנעלם", או "מתכון לסלט חצילים". אבל במיטבו פרומפט מדויק ומפורט יותר, ישיג דיוק ואיכות טובים יותר. תיאור של התוצר המצופה, עם פרטי פרטים, יביא כמעט תמיד לתוצאות טובות יותר. הקפידו פרומפטים לכתוב:
ספציפיות - במקום לכתוב לצ'ט "צייר לי פרח" מומלץ לפרט ולבקש למשל "פרח אדום עם עלי כותרת גדולים שהקצה שלהם צהוב". אל תדאגו אם מה שאתם כותבים נשמע לכם לא הגיוני. אחד הדברים שהבינה מצויינת בהם זה יצירה של דברים שרק גאון או משוגע יכולים לחשוב עליהם וזו בדיוק היצירתיות שלכם שדרושה לג'ינרוט מוצלח. אל תבקשו מהצ'ט "מתכון לסלט" אלא בקשו "מתכון לסלט חצילים עם טחינה, מעט חריף ועם שמן זית". באופן דומה, הציבו גם מגבלות - מה לא ייכלל בתוצר. במקום לבקש "תכנית לטיול בלונדון" בקשו "תכנית לטיול של 3 ימים בלונדון, למשפחה עם בני נוער, שיהיה חינוכי ויכלול הליכה רגלית בלבד וללא שופינג".
שיפור בשלבים - את הפרומפט, בניגוד לחיפוש במנועי חיפוש, אפשר לשפר בשלבים. הצ'ט בוט של ChatGPT, למשל, זוכר את השיחה וההקשר של מה שאתם כותבים, כל עוד התכתבות היא באותו חלון שיחה. זה אומר שלמתחילים שווה לנסות ולהתחיל בפרומפט כללי ולא מפורט ובהדרגה, ככל שהשיחה והדיוק של התוצר מתקדם לכם וגם התיאבון לתוצר יותר מוצלח גדל, להמשיך ולשפר את הפרומפט ולהפוך אותו למפורט וספציפי יותר.
בקול או טון מתאימים - ניסוח של פרומפטים לטקסטים כדאי שיקל בחשבון את הטון והקול הנכונים. כמו שבפרומפט ויזואלי נוכל לבקש שהציור יהיה בסגנון של ון גוך, פיקסו או דאלי, בתיאור של טקסט החליטו אם אתם רוצים שיהיה מנוסח כרציני, מדעי, עיתונאי, רשמי, או בסגנון של מתבגרים או של החבר'ה. אפשר גם לבקש שהטקסט יהיה קצר או ארוך (כתוב לי שתי פסקאות על.. או "כתוב מאמר מלא על..." וכו').
הסבר כמו למתחיל - בקשו בפרומפט כך:
"Explain [subject] in simple terms. Explain to me as if I'm a beginner."
כך מודגם הפרומפט בפתיחת הסקירה על טכנולוגיית AI של חברת ראנוויי (עברית):
https://youtu.be/joJVqKTPVsY
השיעור הראשון בניסוח הפרומפט:
https://youtu.be/Qos2rG3zVAM
איך משתמשים ב- chatGPT כדי שהוא ינסח פרומפטים טובים למנוע תמונות, במקרה הזה Midjourney? (עברית):
https://youtu.be/zFS7WtovYmo
יש תוכנה לעזרה בניסוח פרומפטים (עברית):
https://youtu.be/HLhRFaXQ0vQ
על הפרומפט שמייצר חדשות קוליות לגיק:
https://youtu.be/5TlsXXTamBs
מודלים לציור גנרטיבי מתיאור מילולי בשפה טבעית:
https://youtu.be/pZsJbYIFCCw
הנה מקצוע מהנדס הפרומפט:
https://youtu.be/Bq-ncjOGeVU
והסבר מקיף על עבודתם של מהנדסי הפרומפט (Prompt Engineer) בעולם ה-AI:
https://youtu.be/hd7l9F3n4ZM?long=yes
מהם מנועי ציור ויזואליים כמו Dall-e ומידג'רני?
הבינה המלאכותית (AI) DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.
הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצר AI, לצייר, צלם ועוד כל מיני אמנים - אבל באינטליגנציה מלאכותית.
באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימיבייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ולא פעם אף מדהימים.
ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.
להישג המקורי של DALL-E וגרסתה המשופרת DALL-E 2, תוצר של חברת OpenAI, קמו די מהר מתחרים ראויים נוספים ואיכותיים לא פחות, המייצרים עולם חדש וחסר תקדים של ציירים מכניים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.
איש לא יודע בדיוק כיצד DALL-E פועל, גם לא היוצרים של המודלים שלפיהם הוא פועל. אבל זו העבודה המדהימה של הלמידה העמוקה שמעבדת בעצמה את הדאטה ממיליוני התמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.
התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית וחוץ מתחרות של חברות וקוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין.
הנה כלי Gen AI מצטיין ליצירה ויזואלית Ideogram.ai:
https://youtu.be/XZjaHJP0PQE
"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:
https://youtu.be/qTgPSKKjfVg
כתבה על היכולת המופלאה של דאלי 2 ליצור אמנות:
https://youtu.be/hiSgpZUAy2c
הסבר אמנות ה-AI:
https://youtu.be/alJdw4JDJ4o
מנועי יצירת תמונות מתחרים ומקבילים ל-DALL-E:
https://youtu.be/rGbNJrywLhk
גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):
https://youtu.be/KR29znIp2LU
ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:
https://youtu.be/G-Wsh1vUeVQ
מדריך להרחבת תמונות:
https://youtu.be/V1KLG159A2s
קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:
https://youtu.be/VR3AWdyVVdU
למה יש לבינה כל הזמן בעיה עם אצבעות?
https://youtu.be/24yjRbBah3w
גם למחוללי בינה כמו מידג'רני יש בעיות (עברית):
https://youtu.be/xUpUhHsAWlg?long=yes
ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:
https://youtu.be/FRClNMC_z-s?long=yes
הבינה המלאכותית (AI) DALL-E היא מערכת המסוגלת לייצר תמונות ודימויים ויזואליים דמיוניים, המבוססים על פרומפטים - תיאורי מלל, אינפוטים טקסטואליים שכתב והזין לה המשתמש.
הכל הוא חלק מטכנולוגיה שנקראת "ג'נרטיב AI". זו בינה מלאכותית שבמקום לחשב ולנצח במשחקי טריוויה הפכה ליוצר AI, לצייר, צלם ועוד כל מיני אמנים - אבל באינטליגנציה מלאכותית.
באמצעות פרומפטים, תיאורים מילוליים דוגמת "אביר ימיבייניימי עשוי מחצילים" או "מגדל מודרני בנוי על שריון של צב בסגנון פיקאסו" מייצרת המערכת תמונות וציורים מרהיבים ולא פעם אף מדהימים.
ליצירת התמונות מהטקסט אחראית הבינה המלאכותית המבוססת על למידה עמוקה, מערכת הלומדת בעצמה רשתות נוירונים מלאכותיות, על סמך דפוסים שהיא מאתרת עצמאית, במיליוני תמונות וציורים המוזנים אליה על ידי המפעילים שלה.
להישג המקורי של DALL-E וגרסתה המשופרת DALL-E 2, תוצר של חברת OpenAI, קמו די מהר מתחרים ראויים נוספים ואיכותיים לא פחות, המייצרים עולם חדש וחסר תקדים של ציירים מכניים, שרק ממתינים לבקשות מהמשתמשים ומזדרזים לצייר מבחר טיוטות, מהן יכול המשתמש לבחור את התוצר הסופי שמועדף, שיבוצע באיכות גבוהה.
איש לא יודע בדיוק כיצד DALL-E פועל, גם לא היוצרים של המודלים שלפיהם הוא פועל. אבל זו העבודה המדהימה של הלמידה העמוקה שמעבדת בעצמה את הדאטה ממיליוני התמונות ומלמדת את עצמה לצייר ולפרש את הפרומפטים לפיקסלים ותמונות.
התוצאות של DALL-E 2 היכו די מהר גלים בעולם הבינה המלאכותית וחוץ מתחרות של חברות וקוד פתוח יצרו גם הרבה שיפורים, הן באיכות הטכנית של התמונות והן ביכולות האמנותיות. כך למשל הולכות התמונות ונעשות מפורטות, הרזולוציה גדלה, יכולות הריאליזם, עבודת הצל והתאורה, השימוש במרקמים וציור הנראה כמעט טבעי לחלוטין.
הנה כלי Gen AI מצטיין ליצירה ויזואלית Ideogram.ai:
https://youtu.be/XZjaHJP0PQE
"דאל-E" שכבר יכולה לצייר דיוקנאות מתיאור מילולי בשפה טבעית של מה שיכיל הציור:
https://youtu.be/qTgPSKKjfVg
כתבה על היכולת המופלאה של דאלי 2 ליצור אמנות:
https://youtu.be/hiSgpZUAy2c
הסבר אמנות ה-AI:
https://youtu.be/alJdw4JDJ4o
מנועי יצירת תמונות מתחרים ומקבילים ל-DALL-E:
https://youtu.be/rGbNJrywLhk
גם היהדות ואפילו החרדית מקבלת אפשרויות שהולכות ומתפתחות (עברית):
https://youtu.be/KR29znIp2LU
ה"אאוט פיינטינג" של דאלי, בו הוא מרחיב תמונה:
https://youtu.be/G-Wsh1vUeVQ
מדריך להרחבת תמונות:
https://youtu.be/V1KLG159A2s
קליפ שכולו תמונות שנוצרו ממילות שיר של קינג קרימזון:
https://youtu.be/VR3AWdyVVdU
למה יש לבינה כל הזמן בעיה עם אצבעות?
https://youtu.be/24yjRbBah3w
גם למחוללי בינה כמו מידג'רני יש בעיות (עברית):
https://youtu.be/xUpUhHsAWlg?long=yes
ויוצר רשת שחודש שלם העלה לרשת החברתית תמונות אושר ואווירה שיצר AI - ואז גילה לעוקביו את האמת:
https://youtu.be/FRClNMC_z-s?long=yes
מהי המוסיקה שיוצר ה-AI?
המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.
הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:
1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.
2. ללמוד מהדאטה הזה איך הדברים נשמעים.
3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).
פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.
את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.
היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.
פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.
עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.
הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:
https://youtu.be/3_pxKK2wqvI
הבינה המוסיקלית המדהימה של Udio:
https://youtu.be/aQC0FI_asKY
המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:
https://youtu.be/dAq0YcOAB4k
הדוגמאות של המודל הבא מ-Eleven labs:
https://youtu.be/WA4Aco4rnTA
טעם רע או אזהרה - הקליפ של Apple שמדגים את החשש של המוסיקאים דווקא מ-Ai:
https://youtu.be/ntjkwIXWtrc
תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:
https://youtu.be/Xfhulh3iyWQ
מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:
https://youtu.be/iQ6ITnYAIok
Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:
https://youtu.be/FSbXnOKBK40
וההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:
https://youtu.be/cvRJ_izhs28?long=yes
המוסיקה של הבינה מלאכותית הג'נרטיבית היא אחד הפלאים האחרונים והמדהימים של הז'אנר הנפלא הזה.
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון של תוכן חדש, החל מטקסטים, דרך תמונות, סרטונים, מוסיקה ומגוון סוגי מדיה נוספים.
הבינה המלאכותית המוזיקלית יודעת לעשות 3 דברים:
1. לקבל דאטה מוסיקלי, כלומר נתונים, בכמויות ענק, מכל סגנון של מוסיקה, מכל תקופה או אזור ותרבות בעולם ועם כל קול וכלי מוסיקלי אפשרי.
2. ללמוד מהדאטה הזה איך הדברים נשמעים.
3. לייצר מוסיקה חדשה, לפי דרישות המשתמש כפי שנוסחו בהוראה מילולית פשוטה (פרומפט).
פלטפורמות וכלי בינה פופולריים כמו Suno ו-Udio מאפשרים היום יצירת מוסיקה קלה וחדשנית. יצירה כזו של מוסיקה לא מחייבת את המשתמשים בידע מוסיקלי אלא רק ביכולות ניסוח פרומפטים וטעם טוב, שיאפשר ליצור מוסיקה טובה באמצעות בינה מלאכותית.
את הידע המוסיקלי שנדרש מאז ומעולם, בכדי להלחין ולכתוב שירים ומוסיקה כלית, מחליפים כאן אלגוריתמים מתקדמים ויכולת של המודלים הבינתיים להבין את הפרומפטים, אותם תיאורים טקסטואליים שהמשתמשים כותבים ולהפוך אותם ליצירות מוסיקליות, שכוללות מלודיה (מנגינה), עיבוד והפקה שנשמעת לא פעם מקצועית והולכת ומשתפרת בכל גרסה חדשה.
היכולת המדהימה הזו, שמאפשרת לאנשים ללא רקע מוסיקלי ליצור מוסיקה ושירים שלמים בקלות יחסית, מאפשרת פתיחה של עולם יצירת המוסיקה לציבורים חדשים ופותחת הזדמנויות חדשות לביטוי יצירתי ואמנותי.
פרויקט נחמד ביוטיוב, למשל, נקרא AI Beatles ומייצר שירים שהביטלס מעולם לא שרו. הם מהמילים והמוסיקה ועד לקולות וצורת השירה, הם נשמעים מאוד כמו הדבר האמיתי אבל הם לגמרי בינה מלאכותית. את הקליפים יוצרים שם מחומרים אמיתיים, אבל סביר להניח שעם התפתחות המודלים המדהימים של הווידאו הגנרטיבי גם הם יזכו לשדרוג בינתי ובהמשך יהיו לגמרי AI.
עוד מודל Gen AI מעניין הוא Diff-A-Riff, שיוצר ליווי כלי לריף מוסיקלי שהעלית. הוא משתמש במקודד אוטומטי (CAE) ומודל דיפוזיה סמוי (LDM) כדי ליצור ערוצי מוסיקה, תפקידי כלים נוספים שמתאימים ללוות את הריף המקורי. עם Diff-A-Riff, ניתן לתת רפרנס, מעין השראה או רוח מוסיקלית, או פרומפט - הנחייה מילולית שתנחה את המודל בהפקת הערוצים הנוספים הללו. בכך פותח המודל, כלומר הכלי, אפשרויות חדשות ומרגשות, הן למוסיקאים המחפשים השראה וכן לחובבים או מתעניינים שרוצים לשלב בינה גנרטיבית וכלי AI במוסיקה.
הנה המודל של Suno שמייצר מוסיקת AI בהזמנה:
https://youtu.be/3_pxKK2wqvI
הבינה המוסיקלית המדהימה של Udio:
https://youtu.be/aQC0FI_asKY
המחשה מוקדמת של שיטת הוספת הכלים והתפקידים במודל Diff-A-Riff:
https://youtu.be/dAq0YcOAB4k
הדוגמאות של המודל הבא מ-Eleven labs:
https://youtu.be/WA4Aco4rnTA
טעם רע או אזהרה - הקליפ של Apple שמדגים את החשש של המוסיקאים דווקא מ-Ai:
https://youtu.be/ntjkwIXWtrc
תמיד יהיה מנוע וידאו שיאפשר להפוך את זה לקליפ:
https://youtu.be/Xfhulh3iyWQ
מוסיקה קלאסית לכינור וכלי מיתר שיצרה בינה:
https://youtu.be/iQ6ITnYAIok
Ai Beatles - הפרויקט שמייצר שירים שהביטלס מעולם לא שרו:
https://youtu.be/FSbXnOKBK40
וההבטחה המפוקפקת אך אפשרית לעשות כסף ממוסיקת הבינה:
https://youtu.be/cvRJ_izhs28?long=yes
מהי בינה מלאכותית גנרטיבית?
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון עצום של תוכן חדש. התוכן הזה משתרע על מגוון תחומים גדול, שהולך ומתפתח מיום ליום ובשימוש בצורת כלי איי, כלים שמאפשרים לייצר תכנים ותוצרים באופן מקוון, או בהתקנה על המחשב.
התוכן שבינה גנרטיבית יודעת לייצר כולל החל מטקסטים, דרך תמונות, סרטונים, מוסיקה, אנימציה ומגוון אדיר של סוגי מדיה ויישומים נוספים. ביניהם נכללים כתיבת קוד, עיצוב גרפי, תכניות באינספור תחומים, ניסוחי מכתבים, מאמרים וספרים ועוד.
בבסיסה, יודעת הבינה המלאכותית לעשות 3 דברים:
1. לקבל דאטה, כלומר נתונים מסוג כלשהו.
2. ללמוד מהדאטה הזה על הסוג.
3. לייצר לבקשת המשתמש תוצרים חדשים מסוג זה.
התקשורת בין המשתמש למודל השפה של בינה הגנרטיבית (LLM) מתבצעת כיום באמצעות כתיבה של פרומפט (Prompt), שהיא הנחייה מילולית בשפה טבעית, השפה הרגילה שלנו, כולל אנגלית, עברית וכדומה.
לפרומפטים הללו מתווספים כבר היום ממשקי משתמש נוספים, נוחים, קלים ולרוב גם יעילים יותר. ביניהם אנו מוצאים תפריטים, כפתורים על המסך, תגיות, בחירת אפשרויות בכפתורי רדיו, קופסאות סימון וכדומה. כיום נכנס גם הממשק הקולי בו המשתמש משוחח או פוקד על מודל השפה וההוראות מתורגמות מקול לטקסט, על ידי ה-AI, ומבוצעות מיד.
ההתחלה, אגב, של פיתוח המודלים הללו הייתה צנועה למדי. היא התבטאה בהכנסת קובץ סאונד כמו MP3 למערכת הבינה וקבלת התמלול שלו כטקסט כתוב. בהמשך הפיתוח הלכו השימושים בהם וגדלו, נעשו מורכבים ומדהימים יותר ויותר וכיום הבינה הגנרטיבית היא מפותחת להפליא.
בעיני רבים הבינה הגנרטיבית מאיימת כיום להחליף אנשים בעבודות שהם עושים. מומחים טוענים שזה לא מדויק ושמה שיוחלף הם תהליכי העבודה. לטענתם, תמיד יידרש המרכיב האנושי שיוודא שהשימוש בבינה המלאכותית ובמיוחד היצירתית, יהיה מוצלח.
אז כדי שיוכלו להמשיך לעבוד, העובדים יצטרכו להתעדכן, ללמוד ולהצטייד ביכולות חדשות, שיותאמו לדרישות החדשות של המעסיקים. קראו על כך בתגית "בינה מלאכותית גנרטיבית, אבטלה".
הנה הסבר על הבינה הגנרטיבית:
https://youtu.be/vneJieU5qlg
היכולות המטורפות של הבינה המלאכותית הגנרטיבית (עברית):
https://youtu.be/05oOucZmO8Y
התפתחות התחום הגנרטיבי כפי שהוא מוצג לאחת מאלפי חברות Generative AI (עברית):
https://youtu.be/joJVqKTPVsY
מהי בינה גנרטיבית?
https://youtu.be/pWNAtUwnBS8
משמעות ה-AI הגנרטיבי בעולם הכתיבה העיתונאית:
https://youtu.be/3Jopz-V-IRQ
כך מייצרים וידאו באחד הכלים הג'נרטיביים:
https://youtu.be/hh_mnplMtbE?long=yes
וסקירה מקיפה על הבינה המלאכותית הג'נרטיבית:
https://youtu.be/2IK3DFHRFfw?long=yes
בינה מלאכותית גנרטיבית (Generative AI) היא בינה מלאכותית שיכולה לייצר עבור המשתמש מגוון עצום של תוכן חדש. התוכן הזה משתרע על מגוון תחומים גדול, שהולך ומתפתח מיום ליום ובשימוש בצורת כלי איי, כלים שמאפשרים לייצר תכנים ותוצרים באופן מקוון, או בהתקנה על המחשב.
התוכן שבינה גנרטיבית יודעת לייצר כולל החל מטקסטים, דרך תמונות, סרטונים, מוסיקה, אנימציה ומגוון אדיר של סוגי מדיה ויישומים נוספים. ביניהם נכללים כתיבת קוד, עיצוב גרפי, תכניות באינספור תחומים, ניסוחי מכתבים, מאמרים וספרים ועוד.
בבסיסה, יודעת הבינה המלאכותית לעשות 3 דברים:
1. לקבל דאטה, כלומר נתונים מסוג כלשהו.
2. ללמוד מהדאטה הזה על הסוג.
3. לייצר לבקשת המשתמש תוצרים חדשים מסוג זה.
התקשורת בין המשתמש למודל השפה של בינה הגנרטיבית (LLM) מתבצעת כיום באמצעות כתיבה של פרומפט (Prompt), שהיא הנחייה מילולית בשפה טבעית, השפה הרגילה שלנו, כולל אנגלית, עברית וכדומה.
לפרומפטים הללו מתווספים כבר היום ממשקי משתמש נוספים, נוחים, קלים ולרוב גם יעילים יותר. ביניהם אנו מוצאים תפריטים, כפתורים על המסך, תגיות, בחירת אפשרויות בכפתורי רדיו, קופסאות סימון וכדומה. כיום נכנס גם הממשק הקולי בו המשתמש משוחח או פוקד על מודל השפה וההוראות מתורגמות מקול לטקסט, על ידי ה-AI, ומבוצעות מיד.
ההתחלה, אגב, של פיתוח המודלים הללו הייתה צנועה למדי. היא התבטאה בהכנסת קובץ סאונד כמו MP3 למערכת הבינה וקבלת התמלול שלו כטקסט כתוב. בהמשך הפיתוח הלכו השימושים בהם וגדלו, נעשו מורכבים ומדהימים יותר ויותר וכיום הבינה הגנרטיבית היא מפותחת להפליא.
בעיני רבים הבינה הגנרטיבית מאיימת כיום להחליף אנשים בעבודות שהם עושים. מומחים טוענים שזה לא מדויק ושמה שיוחלף הם תהליכי העבודה. לטענתם, תמיד יידרש המרכיב האנושי שיוודא שהשימוש בבינה המלאכותית ובמיוחד היצירתית, יהיה מוצלח.
אז כדי שיוכלו להמשיך לעבוד, העובדים יצטרכו להתעדכן, ללמוד ולהצטייד ביכולות חדשות, שיותאמו לדרישות החדשות של המעסיקים. קראו על כך בתגית "בינה מלאכותית גנרטיבית, אבטלה".
הנה הסבר על הבינה הגנרטיבית:
https://youtu.be/vneJieU5qlg
היכולות המטורפות של הבינה המלאכותית הגנרטיבית (עברית):
https://youtu.be/05oOucZmO8Y
התפתחות התחום הגנרטיבי כפי שהוא מוצג לאחת מאלפי חברות Generative AI (עברית):
https://youtu.be/joJVqKTPVsY
מהי בינה גנרטיבית?
https://youtu.be/pWNAtUwnBS8
משמעות ה-AI הגנרטיבי בעולם הכתיבה העיתונאית:
https://youtu.be/3Jopz-V-IRQ
כך מייצרים וידאו באחד הכלים הג'נרטיביים:
https://youtu.be/hh_mnplMtbE?long=yes
וסקירה מקיפה על הבינה המלאכותית הג'נרטיבית:
https://youtu.be/2IK3DFHRFfw?long=yes