טרנספורמרים וסדרות עיתיות - ש.ח – ExplAInable – Podcast

Episodes

בינה מלאכותית ללא קוד עם גל פרץ
4 nov.· ExplAInable
היום בפרק נדבר עם גל פרץ, מהפודקאסט "LangTalks" ומומחה בתחום הבינה המלאכותית. נשוחח על נושאים כמו התפתחות השימוש במודלים של בינה מלאכותית, תפקידם של כלי No-Code בעולם הטכנולוגי, ואיך בינה מלאכותית משפיעה על הגישה ההנדסית והמחקרית של פיתוח מערכות היום. נבחנן גם את האתגרים וההזדמנויות שהתחום מציב עבור אנשי מוצר, מהנדסים וחוקרים, ועל חשיבותם של כלי Prompt Engineering ככלי שימושי בעבודה עם מודלים מתקדמים.
GPT Canvas
GitHub Copilot
Cursor
Langflow
Voiceflow
לינקדאין של גל
LangTalks Podcastֿֿ
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
Policy Diffusion: המהפיכה הבאה? עם מייק ותמיר
28 oct.· ExplAInable
בפרק זה דיברנו על מאמר פורץ דרך בתחום הרובוטיקה: Diffusion Policy: Visuomotor Policy Learning via Action Diffusion
המאמר טוען לשיפור של 46.9% במשימות מוטוריות של רובוטים.
הם מראים תוצאות על סימולציות ועל רובוטים פיסיים. פעולות כמו מזיגה, עירבוב, הנחת ספל והסביבה המפורסמת push-T.
בגדול הם לקחו את מה שכבר סקרנו בעבר stable diffusion לעולם הרובוטיקה, כאשר כאן נכנסת סדרת תמונות (המתקבלות ממצלמת הרובוט) ויש להחזיר סדרת פעולות מוטוריות לרובוט.
וגם כאן יש איטרציות של denoising אבל לא מתמונות אלא מסדרת פעולות מוטוריות.
האם זו המהפיכה הבאה ?
מוזמנים להגיב בדעתכם…
קישורים:
https://arxiv.org/pdf/2303.04137v5
https://diffusion-policy.cs.columbia.edu/
https://mobile-aloha.github.io/
https://wuphilipp.github.io/gello_site/
https://umi-gripper.github.io/
https://dobb-e.com/
הפרק שמייק התארח בו
הבלוג של יאנג סונג
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
Episodes manquant?

Cliquez ici pour raffraichir la page manuellement.
שיפור וודאות במודלים: הצצה לעולם של ניבוי קונפורמי
20 oct.· ExplAInable
אחרת הטכניקות הקלאסיות (משנות ה80) שזוכה לאחרונה לפופולאריות מחודשת היא Conformal Prediction.
ברוב משימות הניבוי, לא מספיק לחזות רק מה התוצאה הכי סבירה - אלא מה הן מגוון האפשרויות, ומה הסבירות.
ניקח למשל רופא שצריך לאבחן מטופל על סמך הסימפטומים, תוצאת הדיאגנוזה שלו תגרור את הטיפול המתאים. לכל אבחנה מתוך סט האבחנות יש סיכוי, וייתכן שיידרשו בדיקות נוספות כדי לאסוף עוד נתונים.
ניבוי קונפורמי מנסה לקשור בין רמת הביטחון החזויה, לגודל הקבוצה החזויה.
אורי יסביר כיצד שיטה זו מספקת מסגרת מתמטית שמאפשרת לבצע ניבויים מדויקים יותר עבור מודלים של למידת מכונה, תוך התאמת רמת הוודאות של הניבוי בהתאם לקושי המשימה.נספר על שלושת שלבי הניבוי, שמתאימים לכל מודל קלאסיפיקציה, ונדבר על ספרית MAPIE שהנגישה את המודל לקהילת הפייתון.
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
GPT-4o1: האם אנחנו קרובים להבנה אמיתית?
14 oct.· ExplAInable
בפרק הבא נדבר על הגרסה החדשה
GPT-4o1,
שמבטיחה יכולות מתקדמות של הסקת מסקנות. מייק יסביר כיצד המודל מנסה להתמודד עם בעיות מורכבות שדורשות יכולת לוגית מרובה, ומעלה את השאלה האם המודל באמת מצליח להתמודד עם משימות הסקה מורכבות או שמא הוא "מגזים" בהערכותיו. נבדוק גם את ההבדלים בין גרסאות קודמות, כמו GPT-3 ו-GPT-4, ונבחן את האתגרים וההזדמנויות שהגרסה החדשה מביאה.
נדבר על איך אנחנו כבני חושבים ולמה הגרסה החדשה אמנם בכיוון הנכון אבל עוד רחוקה מלחשוב כמונו.
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
Mechanistic Interpretability עם מייק ארליכסון
8 oct.· ExplAInable
בפרק הבא, נצלול לנושא המורכב של מכניסטית אינטרפרטביליות (Mechanistic Interpretability) במודלים של שפה, וננסה לפשט את הדרך בה ניתן להבין מה מתרחש בתוך מודלים אלה. נסביר כיצד מודלים בשימוש רחב כמו טרנספורמרים ומבנים מתמטיים אחרים מנסים לפענח את מנגנוני השפה, אבל נדבר גם על הקושי להבין מה באמת קורה "מאחורי הקלעים" של רשתות נוירונים עמוקות. נבין את השיטות השונות לפרש את פעולת המודל תוך התמקדות בניתוח המכניסטי של שכבות ותהליכים פנימיים.
הבלוג ששווה שתכירו
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
להגדיר מחדש את החיפוש: חידושים ב - RAG עם ניר דיאנט
1 oct.· ExplAInable
בפרק הבא, נארח את ניר דיאנט, יועץ בתחום הבינה המלאכותית הגנרטיבית (GenAI)
שיספר לנו על המסע המקצועי שלו והתפתחויות חדשניות בתחום. ניר מצטרף אלינו בעקבות תרומתו המשמעותית לשיטות
RAG (Retrieval-Augmented Generation)
כולל פיתוחים כמו GenAI Agents ו-Controlable RAG, שזכו להכרה רחבה
ואף פורסמו על ידי מנכ״ל LangChain, האריסון צ׳ייס, כתכנים הפופולריים ביותר שלהם. בפרק נדון בפתרונות לשיפור החיפושים והשליפות, סידור מתקדם של דאטא, התאמות מולטימודל, ו-RAG עם לולאות פידבק להתאמת המידע לסוגי שאילתות שונים.
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
מדע הנתונים – איך הוא השתנה לאורך השנים עם דניאל אהרונוביץ'
23 sept.· ExplAInable
בפרק הזה דניאל ארונוביץ', מדען נתונים ותיק, מספר על המסע האישי שלו בתעשיית הטכנולוגיה לאורך 15 שנים. ניגע בהבדלים הבולטים בין העבר להווה, בכלים שהשתמשו בעבר לעומת הכלים שמשתמשים בהם היום שמחברים את המדע ישר לפרודקשן.
דניאל מתאר את השינויים במיומנויות הנדרשות ממדעני נתונים, מיכולת ניתוח בלבד להכרח להבין תהליכי פיתוח וניהול גרסאות. נשוחח על האתגרים הטכניים, השינויים בפרקטיקות העבודה, וכיצד התפתח התחום מימי האלגוריתמים הקלאסיים ועד לתפקידי הדאטה המודרניים בעולם התוכנה.
Dataflint/Spark
לינקדאין של דניאל
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
NotebookLM - הפרק שלא אנחנו הקלטנו
16 sept.· ExplAInable
החודש גוגל פרסמו את NotebookLM, שירות AI שמייצר שיחת עומק מוקלטת בין שני דוברים לא אמיתיים.כדי לבדוק את העניין, העלנו תמלול של "רק לא RAG" פרק הטיפים של אורי גורן מארגמקס על נסיונו עם ארכיטקטורת הRAG.והתוצאה, הפילה אותנו מהרגליים.נשמח לשמוע מה דעתכם? האם אפשר למכור את המיקרופון והציוד הקלטה ביד2?
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
Data Science בעולם הביטוח עם דוד שוקרון
15 sept.· ExplAInable
בפרק הזה, דוד שוקרון,
Head of DS & AI
בביטוח ישיר, מספק הצצה לעולם מדעי הנתונים בתעשיית הביטוח. נשמע ממנו על ההבדלים בין אקטואריה ל-Data Science,
ועל איך משלבים DS במערכות ותיקות של חברות ביטוח
דוד יסביר על יישומי DS בתעשייה עתירת נתונים כמו ביטוח, בשימוש בכלים ומודלים שונים, כולל השאלה אם יש צורך בכלים ייחודיים או שניתן להסתפק במוצרי מדף קיימים. בנוסף, נבין איך מודלי שפה משפיעים על תעשיית הביטוח, ומה הכיוונים העתידיים שמעצבים את התחום בעקבות החידושים האחרונים.
.
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
LLM לייעוץ השקעות עם אלעד נחמיאס
1 sept.· ExplAInable
בפרק זה, אנחנו נשוחח עם אלעד נחמיאס
CTO של Bridgewise,
על השימוש במודלי שפה גדולים (LLMs) בתחום ההשקעות. אלעד יסביר לנו איך משלבים טכנולוגיות מתקדמות כדי לשפר תהליכי הייעוץ והאנליזה, תוך התמודדות עם אתגרים כמו דיוק הנתונים, הטיות פוטנציאליות ושמירה על פרטיות המידע.
נשמע על האתגרים הטכניים והאתיים של יישום
LLMs, איך Bridgewise מוודאת שהפתרונות שלה נשארים שקופים ואחראיים, ומה החזון העתידי שלה לשימוש בטכנולוגיה זו בתעשיית ההשקעות.
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
Adaptive-RAG עם לירון יצחקי אלרהנד
25 août· ExplAInable
בפרק הזה, נצלול יחד עם לירון יצחקי אלרהנד ל
Interleaving Retrieval with Chain of Thought (IRCoT)
שיטה לשיפור מערכות שאלה ותשובה על ידי הרחבה איטרטיבית של תהליך חשיבה ואחזור מידע רלוונטי. נדבר על טכניקות שונות של אחזור אדפטיבי, נשווה את יעילותן על סמך מורכבות השאלה, ונדגיש את החשיבות של בחירת הגישה הנכונה לתרחישים שונים
המלצות של לירון למי שמועניין ללמוד עוד:
https://arxiv.org/abs/2212.10509
https://github.com/StonyBrookNLP/ircot/tree/main
https://colab.research.google.com/github/pathwaycom/pathway/blob/main/examples/notebooks/showcases/mistral_adaptive_rag_question_answering.ipynb
https://arxiv.org/abs/2403.14403
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
Task Aware Embedding עם ענבל חורב
18 août· ExplAInable
לא רק היופי הוא בעיניי המתבונן, מסתבר שגם הדימיון הסמנטי
בפרק הזה ענבל תספר לנו איך התגלגלה מטוקיו ל
בגונג senior staff researcher
כשחושבים על אמבדינגז, הרבה פעמים חושבים על חיפוש וקטורי וRAG
נדבר על החשיבות של אמבדינג טוב דווקא בשלב הכרת הדאטא ובחירת דוגמאות מעניינות לאימון.
נסקור את ההיסטוריה של אמבדינג, ללא הקשר, עם הקשר, ועדTask aware embeddingשהוא צעד ביניים למודל שפה מלא
לינקדאין של ענבל
E5
MTEB
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
מלימודים הומניסטים למדעי הנתונים - פרק בשיתוף עם YData
10 août· ExplAInable
בפרק זה ריאיינו את אורי גוטליב ונטע בר על המעבר שלהם לעולם ה data science במסגרת ההכשרה שלהם ב YData.על הפער העצום בין התאוריה לעבודה מעשית ועל הפרויקט שעשו שהביא אותם לעבודה הנוכחית שלהם.
קישורים:
אורי גוטליבנטע ברwids il facebookWids-linkdinקהילת באות
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
בינה מלאכותית וצ'יפים - עם ד"ר אמיתי ערמון
5 août· ExplAInable
אינטל העולמית נמצאת השבוע בכותרות בעקבות ההצהרה על הצמצומים, וזו הזדמנות מעולה להזכיר על הפעילות המדהימה של קבוצת הדאטא סיינס של אינטל ישראל.החודש פורסם כי הקבוצה
AI Solutions Group
זכתה בפרס הארגון המצטיין העולמי של אינטל.
בפרק זה ד"ר אמיתי ערמון יספר לנו על התפקיד שלו בתור ה
Chief Data Scientist
של הקבוצה, מה היא עושה? מה האתגרים היחודיים שלהם? ואיך מתנהלת העבודה של 250 עובדים שבונים ביחד מוצרים מבוססי בינה מלאכותית?
נדבר על פרוייקטים לדוגמא, על ללמים ועל המאמר שכתב
Tabular Data: Deep Learning is Not All You Need
שהגיע השבוע לאלף ציטוטים.
Tabular Data: Deep Learning is Not All You Need
עמוד הלינקדאין של אמיתי
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
על מודלים פתוחים, רשיונות ורגולציה עם עופר חרמוני
28 juil.· ExplAInable
קוד פתוח זה נושא מורכב, יש כמה סוגים של רשיונות כמו GPL, Apache, MIT וכו׳.העניינים מסתבכים עוד יותר כשמדברים על מודלים פתוחים, האם קוד המודל פתוח? אולי רק המאמר? אולי רק המשקולות פתוחות? ומה לגבי הדאטא?בפרק זה עופר חרמוני, יועץ בתחום הAI וחבר בLinux foundationיספר על הקריטריונים של הארגון למודלים פתוחים, ונמנה מספר מודלים כאלו.עולם הAI מתקדם בקצב מסחרר, והמחוקק לא תמיד מצליח לעקוב - בשיחה עם עופר דיברנו על המירוץ וההשלכות החוקיות על שימוש במודלים פתוחים, והתוצרים שלהם.LF AI & Data website: https://lfaidata.foundation/AI Open Source landscape: https://landscape.lfai.foundation/Generative AI Commons website: https://genaicommons.org/Generative AI Commons - Get Involved guide: https://docs.google.com/presentation/d/1Ie0NKJ4N5u3UINUdiwoA7pBYtaRrUdH0gEcMUo9M9Y0/edit?pli=1#slide=id.g2c0160abebd_0_72OSI - open source AI initiative - latest definition: https://opensource.org/deepdive/drafts/the-open-source-ai-definition-draft-v-0-0-8OSI - Open Source AI initiative discussion forum: https://discuss.opensource.org/Connect with me on LinkedIn: https://www.linkedin.com/in/ofer-hermoni/
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
על סימולציה בתעשייה עם גיא אדלר
20 juil.· ExplAInable
גיא אדלר מחברת אקסיליון יחלוק איתנו מנסיונו בפיתוח ושימוש במערכות סימולציה לעולם התחבורה.
אקסיליון מפתחת מוצר לעיריות לצורך אופטימיזציה של רמזורים ותנועה, כדי שכולנו נבלה כמה שפחות זמן בפקקים.

נדבר על האתגרים בתחזית של אירועים נדירים כגון מזג אוויר, הופעות, ושיבושי תנועה.
ועל החשיבות של עבודה משותפת עם מומחי תוכן ואינטגרציה עם מערכות אמיתיות של עיריות כבר בתהליך הסימולציה.
סימולציה היא דבר יקר, וגיא חולק איתנו מאתגריו בפיתוח מערכות יעילות בc++ כדי שהמערכת תוכל לרוץ בזמנים סבירים.
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
ניסויים מדעיים באמצעות סימולציות - עם רותם רוזנבלום
13 juil.· ExplAInable
פרק פיצוץ על איך סימולציות יכולות לעזור לנו לחזות תגובה של חומרי נפץ במתחים שונים.בפרק זה רותם תספר לנו על המחקר האקדמי שלה בשיתוף עם רפאל, ועל איך סימולציות עזרו לחסוך המון כסף וזמן על ניסוי שטח.נדבר על ההבדלים בין סימולציות סדרתיות, ובין סימולציות אגרגטיביות.ומדוע סימולציות הם הכלי הנכון לבדוק את המודל שלנו בכל מיני מקרי קצה נדירים, או שטרם קרו. קישור ללינקדין של רותם
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
על ההיסטוריה של סימולציות עם יניב טננבאום קטן
6 juil.· ExplAInable
סימולציות היו פעם כלי הניבוי המרכזי, והיום הוחלפו על ידי מודלי למידת מכונה.האם מדובר בכלי מיושן ולא רלוונטי, או באומנות עתיקה שנשכחה.בפרק זה נדבר על המוטיבציות לסימולציות אל מול הרצת ניסויים על דאטא אמיתי, ונדבר על החוזקות והחולשות מול מודלי למידת מכונה. קורס חינמי של אוניברסיטת חיפה על סימולציות
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
המלצות, סימולציות, שינוי העדפות ודילמות טווח ארוך - טווח קצר - עם פרופ׳ עומר בן פורת
29 juin· ExplAInable
מערכות המלצה נתפסות לרוב כבעיית רגרסיה או קלאסיפיקציה, בפרק זה פרופסור עומר בן פורת מהטכניון ואורי ינהלו דיון טכני על האתגרים במידול סטטי כזה.נדבר על יצירת העדפות, ועל האחריות המשפטית של מערכת ההמלצה.מערכת המלצה אמורה למדל אנשים, ואנשים הם לא יצור רציונאלי או עקבי - כיצד מערכת ההמלצה אמורה להתמודד עם זה?ונדבר על החשיבות של סימולציה למדידה ואימון מערכות המלצה, גם כאשר יש הרבה דאטא. קישורים:Duelling banditsRecsimטווח ארוך לעומת טווח קצר במערכות המלצה
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
Consistency Large Language Models עם מייק ארליכסון
23 juin· ExplAInable
למודלי שפה (גדולים) יש שלושה תת-מודלים: הטוקנייזר, הטרנספורמר, ואלגוריתם הפענוח.
אלגוריתם הפיענוח בדרך כלל אינו נלמד, אלא הוא איזה שהיא יוריסטיקה סדרתית של חיפוש בעץ על סמך ההסתברויות של הטרנספורמר.
אבל מי מבטיח שהיוריסטיקה הזו היא הדבר האידיאלי לעשות בהנתן הפלט של הטרנספורמר.
Consistency LLMs מנסים לקשור את שתי הקצוות, ולהתאים את ההטרנספורמר לאלגוריתם הפענוח.
מרוויחים מזה מודלים יעילות יותר, ואפשרות למיקבול.
מייק יספר לנו איך הקסם הזה קורה
- Écouter Écoute encore Continuer Écoutez...
- Écoutez plus tard Écoutez plus tard
Montre plus

Episodes

בינה מלאכותית ללא קוד עם גל פרץ

Policy Diffusion: המהפיכה הבאה? עם מייק ותמיר

שיפור וודאות במודלים: הצצה לעולם של ניבוי קונפורמי

GPT-4o1: האם אנחנו קרובים להבנה אמיתית?

Mechanistic Interpretability עם מייק ארליכסון

להגדיר מחדש את החיפוש: חידושים ב - RAG עם ניר דיאנט

מדע הנתונים – איך הוא השתנה לאורך השנים עם דניאל אהרונוביץ'

NotebookLM - הפרק שלא אנחנו הקלטנו

Data Science בעולם הביטוח עם דוד שוקרון

LLM לייעוץ השקעות עם אלעד נחמיאס

Adaptive-RAG עם לירון יצחקי אלרהנד

Task Aware Embedding עם ענבל חורב

מלימודים הומניסטים למדעי הנתונים - פרק בשיתוף עם YData

בינה מלאכותית וצ'יפים - עם ד"ר אמיתי ערמון

על מודלים פתוחים, רשיונות ורגולציה עם עופר חרמוני

על סימולציה בתעשייה עם גיא אדלר

ניסויים מדעיים באמצעות סימולציות - עם רותם רוזנבלום

על ההיסטוריה של סימולציות עם יניב טננבאום קטן

המלצות, סימולציות, שינוי העדפות ודילמות טווח ארוך - טווח קצר - עם פרופ׳ עומר בן פורת

Consistency Large Language Models עם מייק ארליכסון