דף זה מכיל מונחי מילון מונחים של מערכות המלצות. לכל המונחים במילון המונחים, לחצו כאן.
C
יצירת מועמדים
קבוצת ההמלצות הראשונית שנבחרה על ידי מערכת ההמלצות. לדוגמה, נניח שיש לכם חנות ספרים שיש בה 100,000 כותרים. שלב יצירת המועמד יוצר רשימה קטנה בהרבה של ספרים מתאימים למשתמש מסוים, למשל 500. אבל גם 500 ספרים הם הרבה יותר מדי מכדי להמליץ למשתמש. השלבים הבאים ויקרים יותר של מערכת ההמלצות (כמו ציון ודירוג מחדש) מפחיתים את 500 ההמלצות האלו לקבוצת המלצות קטנה ושימושית הרבה יותר.
סינון שיתופי
יצירת תחזיות לגבי תחומי העניין של משתמש אחד על סמך תחומי העניין של משתמשים רבים אחרים. הרבה פעמים משתמשים בסינון שיתופי במערכות המלצה.
I
מטריצת פריטים
במערכות המלצה, מטריצה של וקטורים של הטמעה שנוצרה על ידי פירוק לגורמים של מטריצה ומכילה אותות נסתרים לגבי כל פריט. כל שורה במטריצת הפריטים מכילה את הערך של תכונה לטנטית אחת לכל הפריטים. לדוגמה, נניח שיש מערכת המלצות על סרטים. כל עמודה במטריצת הפריטים מייצגת סרט אחד. האותות הלטנטיים עשויים לייצג ז'אנרים, או שהם קשים יותר לפירוש, שיש בהם אינטראקציות מורכבות בין ז'אנרים, כוכבים, גילאי הסרט או גורמים אחרים.
במטריצת הפריטים יש אותו מספר עמודות כמו במטריצת היעד שעוברת לפירוק לגורמים. לדוגמה, בהינתן מערכת המלצות על סרטים שבודקת 10,000 שמות של סרטים, מטריצת הפריטים תכלול 10,000 עמודות.
items
במערכת ההמלצות, הישויות שהמערכת ממליצה. לדוגמה, סרטונים הם הפריטים שמומלצים בחנות סרטונים, בעוד שספרים הם הפריטים שמומלצים על ידי חנות ספרים.
M
פירוק לגורמים של מטריצות
במתמטיקה, מנגנון למציאת מטריצות שמכפלת הנקודות שלהן קרובה למטריצת יעד.
במערכות המלצות, מטריצת היעד כוללת בדרך כלל את הדירוגים של המשתמשים בפריטים. לדוגמה, מטריצת היעד של מערכת המלצות על סרטים יכולה להיראות בערך כך, שבה המספרים השלמים החיוביים הם דירוגי משתמשים ו-0 פירושו שהמשתמש לא דרג את הסרט:
קזבלנקה | הסיפור של פילדלפיה | הפנתר השחור | וונדר וומן | ספרות זולה | |
---|---|---|---|---|---|
משתמש 1 | 5.0 | 3.0 | 0.0 | 2.0 | 0.0 |
משתמש 2 | 4.0 | 0.0 | 0.0 | 1.0 | 5.0 |
משתמש 3 | 3.0 | 1.0 | 4.0 | 5.0 | 0.0 |
מערכת ההמלצות על סרטים שואפת לחזות את דירוגי המשתמשים לסרטים ללא סיווג תוכן. לדוגמה, האם משתמש 1 כמו הפנתר השחור?
אחת הגישה למערכות של המלצות היא להשתמש בפקטורים של מטריצות כדי ליצור את שתי המטריצות הבאות:
- מטריצת משתמשים, שמעוצבת כמספר המשתמשים X מספר מאפייני ההטמעה.
- מטריצת פריטים, שמעוצבת כמספר מאפייני ההטמעה X מספר הפריטים.
לדוגמה, שימוש בפירוק לגורמים של מטריצות על שלושת המשתמשים וחמישה פריטים עלול להניב את מטריצת המשתמשים ואת מטריצת הפריטים הבאים:
User Matrix Item Matrix 1.1 2.3 0.9 0.2 1.4 2.0 1.2 0.6 2.0 1.7 1.2 1.2 -0.1 2.1 2.5 0.5
מכפלת הנקודות של מטריצת המשתמשים ומטריצת הפריטים יוצרת מטריצת המלצות שמכילה לא רק את דירוגי המשתמשים המקוריים, אלא גם את החיזויים לסרטים שכל משתמש לא ראה. לדוגמה, נניח שקיבלתם את הדירוג של משתמש 1 לקזבלנקה, שהוא 5.0. מכפלת הנקודות שתואמת לתא הזה במטריצת ההמלצות אמורה להיות בערך 5.0, והוא:
(1.1 * 0.9) + (2.3 * 1.7) = 4.9
חשוב מכך, האם משתמש 1 יהיה כמו הפנתר השחור? אם משתמשים במוצר עם הנקודות שתואם לשורה הראשונה ובעמודה השלישית, יתקבל דירוג חזוי של 4.3:
(1.1 * 1.4) + (2.3 * 1.2) = 4.3
פירוק לגורמים של מטריצות בדרך כלל יוצר מטריצת משתמשים ומטריצת פריטים, שביחד הם קומפקטיים הרבה יותר ממטריצת היעד.
R
מערכת המלצות
מערכת שבוחרת לכל משתמש קבוצה קטנה יחסית של פריטים רצויים מתוך אוסף גדול. לדוגמה, מערכת המלצות על סרטונים יכולה להמליץ על שני סרטונים מתוך אוסף של 100,000 סרטונים, ולבחור באפשרות קזבלנקה וסיפור פילדלפיה למשתמש אחד, ובאפשרות וונדר וומן והפנתר השחור למשתמש אחר. מערכת ההמלצות על סרטונים עשויה לבסס את ההמלצות שלה על גורמים כמו:
- סרטים שמשתמשים דומים דירגו או צפו בהם.
- ז'אנר, במאים, שחקנים, יעד דמוגרפי...
דירוג מחדש
השלב האחרון במערכת ההמלצות, שבו ניתן לתת ציון מחדש לפריטים שקיבלו ציון לפי אלגוריתם אחר (בדרך כלל לא ML). הדירוג מחדש מעריך את רשימת הפריטים שנוצרו על ידי שלב הציון, בעקבות פעולות כמו:
- הסרת פריטים שהמשתמש כבר רכש.
- משפר את הציון של פריטים חדשים יותר.
S
ניקוד
החלק במערכת ההמלצות שמספק ערך או דירוג לכל פריט שנוצר בשלב יצירת הצעות.
U
מטריצת משתמשים
במערכות המלצה, וקטור הטמעה שנוצר על ידי פירוק לגורמים של מטריצה ומכיל אותות לטנטיים לגבי העדפות המשתמש. כל שורה במטריצת המשתמשים מכילה מידע על העוצמה היחסית של אותות נסתרים שונים למשתמש יחיד. לדוגמה, נניח שיש מערכת המלצות על סרטים. במערכת הזו, האותות הלטנטיים במטריצת המשתמשים עשויים לייצג את תחומי העניין של כל משתמש בז'אנרים מסוימים, או שהם עשויים להיות מסובכים לפירוש אותות שכוללים אינטראקציות מורכבות על פני מספר גורמים.
במטריצת המשתמשים יש עמודה לכל תכונה סמויה ושורה לכל משתמש. כלומר, במטריצת המשתמשים יש אותו מספר שורות כמו במטריצת היעד שמחולקת לגורמים. לדוגמה, בהינתן מערכת המלצות על סרטים ל-1,000,000 משתמשים, מטריצת המשתמשים תכלול 1,000,000 שורות.
W
ריבועים מזרחיים חלופיים משוקללים (WALS)
אלגוריתם למזעור פונקציית המטרה במהלך פירוק לגורמים של המטריצה במערכות המלצה, שמאפשר להפחית את המשקל של הדוגמאות החסרות. WALS מצמצמת את השגיאה המשוקללת בריבוע בין המטריצה המקורית והשחזור על ידי תיקון של פירוק לגורמים של השורות והפירוק לגורמים של העמודות. אפשר לפתור כל אחת מהאופטימיזציות האלה באמצעות אופטימיזציה קמורה של ריבועים לפחות. פרטים נוספים זמינים בקורס Recommendation Systems.