הנדסת מערכות מידע ותוכנה |
הערכת הסברים עבור אנומליות באמצעות ground truth
|
סטודנטים
|
מנחים
|
תקציר
אלגוריתמים ללמידת מכונה וללמידה עמוקה נמצאים בשימוש רחב עבור זיהוי אנומליות. במקרים רבים, הסברים עבור האנומליות נדרשים על מנת להדגיש את התכונות שהכי ראויות להיחקר על ידי מומחה. שיטות מסגרת להערכה של שיטות הסבר עבור אנומליות לוקות בחסר, בפרט שיטות הערכה אשר משוות בין הפלט של שיטות הסבר לבין הסיבות האמיתיות לכך שתוצאה מסוימת הוחזרה, כלומר ה-ground truth . בתרחיש זה, ה-ground truth מאפשר בחינה של הנכונות והשרידות של ההסברים. אלו חשובים במיוחד עבור זיהוי אנומליות, תחום בו היכולת לספק מידע מועיל אודות המקור של האנומליה הוא קריטי. בעבודה זו, אנו מציגים שיטת מסגרת אשר כוללת (1) מערך נתונים של מעגלים חשמליים המכיל אנומליות שנוצרו בהתבסס על מודל, (2) ground truth עבור הסברים לאנומליות, אשר נוצרו על ידי אלגוריתם שמוצג בעבודה זו, (3) מדדים עבור הערכת הנכונות והשרידות של הסברים לאנומליות. הערכה זו אפשרית לאור השימוש שלנו בהסברי ה-ground truth. אנחנו מדגימים את השימוש בשיטת המסגרת באמצעות שלוש שיטות הסבר מסוג model-agnostic ומראים את התוצאות של שלושה מדדי נכונות ומדד שרידות, אשר חושבו באמצעות השוואת ההסברים ל-ground truth .
|
|
תיקון שגיאות כתיב ועריכת טקסט באמצעות קול ומבט
|
סטודנטים
הילה כהן
|
מקסים ז'יבודרוב
|
שון אברוטין
|
|
מנחים
|
תקציר
כיום, תהליך תיקון שגיאות הכתיב ועריכת הטקסט במעבד התמלילים מתבצע באמצעות העכבר כאשר על המשתמש להזיז את העכבר למילה אותה הוא רוצה לתקן, ללחוץ עליה ולבחור את האופציה המתאימה. תהליך עבודה זה מאט משמעותית את קצב העבודה, במיוחד אם מדובר על טקסט ארוך וכמות גדולה של פעולות עריכה אותן המשתמש נדרש לעשות.
במסגרת הפרויקט, אנחנו מציעים לפתח ולהעריך שיטת עריכת טקסט חדשנית, המבוססת על אינטראקציה טבעית של המשתמש עם המחשב. על פי שיטה זו המשתמש יערוך את הטקסט רק באמצעות שימוש בקולו ומבטו.
בחלק הפיתוחי של הפרויקט, פיתחנו ממשק ידידותי למשתמש לעריכת ותיקון טקסט כאשר אחד מהעקרונות המרכזיים שהנחה אותנו הוא שהממשק יהיה כמה שיותר אינטואיטיבי וטבעי למשתמש וזאת על מנת שיוכל להתרגל במהרה לשיטה החדשנית אותה אנו מציעים אחרי שימוש ממושך בשיטה המסורתית של תיקון שגיאות ועריכת טקסט באמצעות שימוש בעכבר ומקלדת.
בחלק המחקרי של הפרויקט, ערכנו ניסוי שמטרתו להשוות בין השיטה המוצעת על ידנו לשלוש שיטות עריכת טקסט אחרות: באמצעות עכבר וקול, באמצעות הקול בלבד והשיטה המסורתית. במסגרת הניסוי נמדדנו מדדים כגון זמן ביצוע משימת תיקון או עריכת טקסט והמאמץ אותו נדרש הנסיין להשקיע לביצוע משימה זו. כמו כן, בניסוי שאלנו את חוות דעתם הסובייקטבית של הנסיינים בדבר היבטים הקשורים לשימוש במערכת כגון שימושיות ומאמץ.
|
|
תוצאות ניתוח מעקפים כתלות בניסיון של מרכז רפואי או של מנתח
|
סטודנטים
יערה רמני
|
דניאל גורסיה
|
הילה פטרפרוינד
|
|
מנחים
|
תקציר
מטרת המחקר היא לבדוק האם לניסיון של מרכז רפואי או של מנתח יש השפעה על הסיכון לסיבוכים ולתוצאות ניתוח מעקפים.
נתוני המחקר כוללים מעל מיליון וחצי רשומות של ניתוחים במהלך עשר השנים האחרונות מרחבי העולם וע"י כך מאפשר לנו לבחון מגמות לאורך זמן.
ביצענו מספר אנליזות ובדיקות האם קיימת השפעה של הניסיון על התמותה והסיבוכים.
מכיוון שיכול להיות אפקט של המרכז הרפואי בעקבות נהלי עבודה, אוכלוסייה, ופרמטרים נוספים, היה עלינו להשתמש במודל שיכול לקחת בחשבון אפקטים שכאלו. ולכן בנינו מודל רגרסיה לינארית GLMM שממדל אפקט אקראי עבור מרכזים רפואיים שונים. מטרת המודל היא לבדוק האם לניסיון יש אפקט על התמותה תוך תקנון השונות הקיימת בין המרכזים הרפואיים השונים.
בנוסף, אימנו מודלים של XGBoost - מודל למידת מכונה המבוסס עצי החלטה ומטרתו לחזות את הסיכוי לתמותה ולסיבוכים בעקבות הניתוח. במחקר יצרנו שני מודלים עבור חיזוי תמותה ושני מודלים עבור חיזוי סיבוכים, כאשר מודל אחד הוא ללא הניסיון רפואי ובמודל השני הניסיון הרפואי מצורף בתור פיצ'ר. לבסוף ביצענו אנליזת SHAP הבודקת השפעה של כל מדד על החיזוי לסיכוי לתמותה ולסיבוכים בעקבות הניתוח.
תוצאות האנליזות הראו כי קיים קשר שלילי בין הניסיון של מנתח או של מרכז רפואי לתוצאות הניתוח. כלומר ככל שהנסיון גדול יותר, כך הסיכוי לתמותה ולסיבוכים קטן.
|
|
מערכת סימולציה לבעיות תכנון מרובות סוכנים אינטילגנטיים
|
סטודנטים
ערן טוטיאן
|
דניאל בן סימון
|
אלונה לסרי
|
חן שורש
|
|
מנחים
|
תקציר
מטרת פרויקט זה היא להקל על מתכנתים, צופים ואנליסטים בעת הסקת מסקנות וקבלת החלטות כאשר הם מעוניינים להריץ אלגוריתמי למידת מכונה אשר עושים שימוש בסוכנים אינטליגנטים.
הלקוח שלנו, פרופ' גיא שני, מחזיק באלגוריתמי למידה שונים המפעילים סוכנים אינטליגנטים ורצונו לפתח סימולציה שתעזור לו להבין את תהליכי הריצה של הסוכנים בנוחות המרבית.
הסימולציה הממוחשבת תהווה כלי עזר ויזואלי, שאליו טוענים את סדרת הפעולות שהסוכנים מבצעים, ובאמצעותו המתכנת/ צופה/ אנליסט יוכל לקבל החלטות ביתר קלות ובנוחות שאינה מתאפשרת מתוך קריאת הפלט בלבד.
הסימולציה שבנינו בפרויקט זה נעשתה באמצעות פלטפורמת Unity, שמספקת ממשק וארגז כלים מגוון המאפשר לייצר סימולציות ממוחשבות העונות על מטרות רבות ובתוכן מטרת הוויזואליזציה של אלגוריתמי תכנון מרובה סוכנים.
הסימולציה שבנינו מאפשרת בחירה בין שתי סביבות עולם שונות:
1. Sokoban: זהו משחק וידאו שבו מטרת השחקן היא לדחוף את כל האובייקטים במבוך ליעדים שונים תוך שימוש במספר מינימלי של תזוזות. האובייקטים במשחק זה הם בדרך כלל ארגזים והסוכנים הם הדמויות אשר דוחפות את הארגזים אל עבר מצב המטרה.
2. Multi Agent Elevator Movement Simulation System: בסביבה זו הסוכנים הם המעליות והאובייקטים הם אנשים המפוזרים בקומות השונות ורצונם להגיע ליעדים השונים.
בשתי הסביבות לעיל, פלט האלגוריתם לא מספק את האינפורמציה באופן נגיש ולכן קיים צורך בביצוע סימולציה המציגה את סדרת הפעולות שביצעו הסוכנים.
הסימולציה הממוחשבת אינה מהווה כלי הכרחי לצורך הבנת התהליכים המתרחשים במהלך ריצת האלגוריתם, אך היא כלי עזר חיוני אשר ללא ספק מייעל את זמני הסקת המסקנות, איכות הסקת המסקנות ותהליכי קבלת ההחלטות שעל הצופה, המתכנת או האנליסט יש לבצע, ולשם כך בחרנו למממש סימולציה ממוחשבת לתכנון מרובה סוכנים.
|
|
פפר- רובוט חברתי
|
סטודנטים
יצחק פינקלשטיין
|
איתמר זיגל
|
צחי קפרי
|
נועה וויס
|
|
מנחים
|
תקציר
הפרויקט שלנו הוא חלק משיתוף פעולה עם מעבדת הזקנה, הקוגניציה והשיקום באוניברסיטת בן-גוריון. הפרויקט שלנו מתמקד במשתקמים משבץ מוחי אשר צריכים לעבור הליך שיקום קשה וממושך.
הייחודיות של המערכת שלנו היא המעורבות של רובוטים חברתיים בהליך השיקום על ידי שימוש במשחקים. רובוטים חברתיים הוכחו כמעוררי מוטיבציה אצל מטופלים ומעודדים התמודדות עם טיפולים ממושכים. מערכת לזיהוי התנועות מתעדת את המטופלים תוך כדי המשחקים , הנתונים האלו מעובדים ומועברים לאלגוריתם שיידע לסווג אותן ולהעריך אילו תנועות גפיים מפצות ביצע המטופל ולהעביר את התוצאות לפפר-הרובוט שלנו למתן פידבק מתאים.
הצוות שלנו פיתח ושיפר את האלגוריתם אשר אומן על ידי נתונים שנאספו וסווגו על ידי פיזיותרפיסטים ומשתמש במודל מבוסס רצף זמן. על-ידי העברת הבעיה לתחום עיבוד התמונות ושימוש ב 'transfer learning' שיפרנו בצורה ניכרת את אחוזי הדיוק וזמני הריצה שלנו.
לאחר שפפר מנתח את הנתונים שחוזרים מהאלגוריתם הוא מחליט, על בסיס סט חוקים איזה פידבק להציג למטופל.
פיתחנו שירותים אשר מתקשרים ומחברים בין מנעד הטכנולוגיות הרחב אשר עומד לרשותנו ומנהלים את כל הליך המפגש עם המטופל. השירותים האלה כוללים את מערכת זיהוי התנועות אשר פיתחנו בפייטון עם שימוש בבקרי ארדואינו ותוכנת 'motive' אשר יחדיו בצורה אוטומטית לחלוטין מייצרים קובץ נתונים כאשר מטופל מסיים משחק ולוחץ על כפתור.
קובץ הנתונים עובר לשירות האלגוריתם שמסווג אילו תנועות גפיים לא טובות עשה המטופל לפי קובץ הנתונים. האלגוריתם מתקשר עם שירות התגובות של פפר אשר שם אנו מחליטים איזה פידבק יוצג למטופל על בסיס סט חוקים שהוצע על-ידי אנשי מקצוע ומערב בהחלטה את הזמן שלקח למטופל לבצע את המשחק, מפגשיו הקודמים ותנועותיו הלא נכונות במפגש.
|
|
סאמר אייז - תמצות טקסט מבוסס תנועות עיניים
|
סטודנטים
מתן שושן
|
עידו קסטנבאום
|
אדיר בירן
|
|
מנחים
|
תקציר
תמצות טקסט הינה משימה מורכבת אשר נחקרה רבות בעבר כאשר עיקר המיקוד של מחקרים קודמים היה רק במאפיינים טקסטואלים (גודל כתב, מיקום המילה, תחילת פסקה וכו'). בפרויקט זה, נחקור דרך נוספת לתמצות טקסט – ע"י כריית נתוני תנועות העיניים של המשתמש בזמן קריאת הטקסט. במהלך הפרויקט, ביצענו ניסוי על כ-80 נבדקים וכ-320 טקסטים במטרה לאסוף את נתוני תנועות עיניים של הנדקים תוך כדי קריאה טבעית של הטקסט. נתונים אלו מתקבלים ממערכת ה-GazePoint, אשר מסוגלת לבצע כיול לעיני הנבדק, ולאחר מכן להפיק מידע רב בקצב של כ-40 דגימות/לשנייה. ממידע זה אנו מסיקים את מיקום הנקודה בה צופה המשתמש במסך, זמן ההשתהות, מיקום וסדר הפיקסציות ופרמטרים נוספים.
נתוני תנועות העיניים מושפעים מגורמים רבים, כגון: קליברציית הנבדק למערכת, מיקומו לאורך הניסוי, הרכבת משקפיים/עדשות, שפת אם הנבדק ועוד.
נתונים אלו משמשים אותנו לבניית מודל תמצות הטקסט, תוך הבנת המידע, הרכבת הפיצ'רים המשמעותיים ביותר על מנת למקסם את דיוק המודל. בנוסף, אנו מציגים הערכה והשוואה של המודל שלנו מול מודלים קיימים של תמצות טקסט המתבססים על מאפיינים טקסטואלים בלבד, תוך שימוש בתמצותי Gold Standard ומדדים היודעים להתחשב בתמצות אבסטרקטי ובתמצות אקסטרקטי.
|
|
Systance - מערכת להשוואת אלגוריתמי stance detection ושיפור השיטות
|
סטודנטים
חן אברהם
|
גל תדיר
|
עדי אבינון
|
איריס דרייזנשטוק
|
|
מנחים
|
תקציר
כיום, תחום ה-stance detection, העוסק בחיזוי עמדת בן אדם בנושא מסוים, הוא אחד התחומים החמים בשוק. חברות שיווק, סקרים וכן גם העוסקים בשוק ההון, משקיעות סכומי עתק בניסיון למצוא אלגוריתם מדויק , שבהינתן משפט של אדם, ידע לזהות את דעתו בנושא מסוים. התפתחות הטכנולוגיה ובפרט תחום עיבוד השפה הטבעית מהווה בסיס למחקרים המנסים לזהות עמדה של משתמש ברשתות החברתיות בנושא מסוים. חוקרים רבים פיתחו שיטות שונות בחיזוי עמדות ואחוזי הדיוק אכן נראים מבטיחים.
עם זאת, אחת הבעיות הגדולות שהתחום נתקל בו היא שכל שיטה מותאמת לדאטאסט ספציפי. לכן כאשר חוקר בוחר אלגוריתם שהניב דיוק גבוה, אין הבטחה כי הדבר יחזור על עצמו בדאטאסט שאותו הוא מעוניין לאמן (אחת הסיבות לכך היא overfitting) או לחלופין אין הבטחה שהאלגוריתם ירוץ.
לשם כך, הקבוצה שלנו בחרה לממש מערכת, אשר בהינתן דאטאסט, מאפשרת השוואה בין מודלים שונים של stance detection. המערכת מאפשרת בחירת דאטאסט מתוך עשרה דאטאסטים שאנו מציעים, או לחלופין הכנסת דאטאסט על ידי המשתמש. כמו כן, בחירה של אלגוריתמים מתוך שישה אלגוריתמים שמימשנו וכן השוואה בין תוצאות האלגוריתמים. כל התהליך כמובן מלווה במידע וסטטיסטיקות המוצגים ב-dashboard שהכנו עבור המשתמש, שיאפשרו לו לנתח את הנתונים בצורה נוחה יותר.
בנוסף למערכת זו, בפרויקט שלנו קיים היבט מחקרי בו אנחנו מפתחים שיטה חדשה לסיווג stance. השיטה פועלת על דאטאסטים מטוויטר. מכל טוויט בדאטאסט אנחנו יוצרים גרף המייצג את ההתפשטות שלו ברשת. מהגרף אנחנו מוציאים פיצ'רים רשתיים, אותם אנחנו משלבים במודליםmainstream machine learning algorithms (SVM, Logistic Regression) או מצרפים אותם לשיטות הקיימות ב- stance detection. כיוון שהשיטה לא הוכיחה דיוק גבוה בכל המקרים אלא רק בחלקם ועל כמות הדאטאסטים עליה היא עובדת, החלטנו לא לצרף אותה כרגע למערכת שלנו מכיוון שהיא דורשת מחקר מעמיק יותר.
|
|
כלי תיוג לניסויי מוות תאי באמצעות למידה אקטיבית
|
סטודנטים
ליאת מרגרט כהן
|
עמית סולטן
|
ירין חיון
|
חיים רייס
|
|
מנחים
|
תקציר
בשנת 2012 התגלה מנגנון ביולוגי שהפעלתו על קבוצת תאים ברקמה גורמת למוות של התאים בסדר מסוים. מנגנון זה עשוי להעיד שקיימת תקשורת בין התאים ושתאים שכנים משפיעים זה על זה. במטרה לחקור ולהבין טוב יותר את תהליך מוות התאים ברקמה, החוקרים במעבדה נדרשים לתייג ניסויים, הכוללים מאות תמונות, ולבצע באופן ידני את מלאכת תיוג התאים המתים בכל אחת מתמונות הניסוי.
במטרה לייעל את התהליך, פיתחנו אפליקציית WEB בשם "Cell Death Annotation Tool using Active "Learning אשר תהווה פלטפורמה נוחה וגנרית לתיוג תאים ותשמש חוקרים ביולוגיים לתייג תאים בניסויים שמורכבים מתמונות מיקרוסקופיה.
המערכת שפיתחנו מורכבת מפלטפורמה דו שלבית שמציעה אוטומציה לתהליך תיוג התאים. בשלב הראשון, מתבצע עיבוד תמונה בסיסי שכולל תיוג ראשוני של תאים באמצעות כלי StarDist המבוסס על רשת נוירונים. כהכנה לשלב הבא, האלגוריתם שלנו עובר על התוצאות, מחשב את המסלול של כל אחד מהתאים בניסוי ומחלץ עבור כל מסלול אוסף פיצ'רים רלוונטיים. בשלב השני, במטרה לטייב את התיוג, אוסף הפיצ'רים עוברים למודל למידה שמשתמש באלגוריתם סיווג XGboost ומחליט עבור כל תא האם הוא אכן תא שמת בפריים זה (True positive) או שמדובר בתא שסומן באופן שגוי בעזרת כלי עיבוד התמונה (False positive) .
המודל מבוסס על שיטת ה- active learning, שזו כאמור שיטת למידה איטרטיבית המשלבת את החוקר בתהליך הלמידה, כך שהחוקר עובר רק על תוצאות של סימוני תאים שהמודל סיפק רמת ביטחון נמוכה לגבי תיוגם ומתקן אותן בהתאם.
בסוף תהליך ה active learning, בהינתן תוצאות מספקות, תיוג התאים על גבי תמונות הניסוי באתר יתבצע באופן אוטומטי ללא התערבות ידנית.
הפרויקט מבוצע בשיתוף פעולה בין מעבדת "Overholtzer" הנמצאת במרכז לחקר הסרטן שבניו-יורק לבין המעבדה של ד"ר אסף זריצקי באוניברסיטת בן גוריון.
|
|
מציאת נקודת מפגש אופטימלית בעבור סוכנים מרובים, ומסלול חסר קונפליקטים בעבור כל סוכן לנקודת המפגש
|
סטודנטים
אורן רפאל שיכמן
|
תומר גודלי
|
אוסקר אפשטיין
|
שחר אידן פריימן
|
|
מנחים
|
תקציר
Multi-Agent Meeting (MAM) היא בעיה במציאת נקודת מפגש עבור מספר סוכנים ונתיבים לאותו נקודה. פתרון ל- MAM עשוי להכיל מסלולים עם התנגשויות בין הסוכנים. בעיה דומה המתכננת מסלולים נטולי התנגשויות בהנתן נקודות יעד היא בעיית מציאת מסלולים מרובים (MAPF). בפרויקט זה אנו פותרים את בעיית Conflict-Free Multi-Agent Meeting (CF-MAM). ב- CF-MAM, אנו מוצאים נקודת מפגש עבור סוכנים מרובים (כמו ב- MAM) וכן מסלולים ללא קונפליקטים (כמו ב- MAPF) לאותו מיקום. אנו מציגים שני אלגוריתמים המשלבים פתרונות MAM ו- MAPF לפתרון אופטימלי של CF-MAM ומשווים את האלגוריתמים בניסוי, ומראים את היתרונות והחסרונות של כל אלגוריתם.
|
|
השלמת נתונים עתית
|
סטודנטים
|
מנחים
|
תקציר
נתונים חסרים היא אחת הבעיות הנפוצות שנתקלים בה בשלב ניתוח ועיבוד הנתונים בתחומים רבים. הגישה הנפוצה כיום לטיפול בבעיה זו, היא ע״י ביצוע זקיפת נתונים, בה הערכים החסרים מוחלפים באומדן. רוב השיטות לזקיפת נתונים כיום מסתמכות על מתאם בין התכונות ע״מ לאמוד את הערך החסר, אך עבור נתונים סדרתיים יש צורך לקחת בחשבון גם את מאפיינים הזמניים של הנתונים.
כיום נושא זה מהווה אתגר משמעותי בתחומים רבים, ובעיקר בנתונים רפואיים. על כן, בכדי להתגבר על בעיה זו ולבצע זקיפת נתונים יעילה עבור סדרת נתונים בעלת משתנים רבים, אנו מציעים גישה חדשה לפתרון הבעיה. בשיטה שלנו, נתוני סדרתיים יוחלפו בערכים בדידים כפי שיתקבלו משימוש בשיטות דיסקרטיזציה שונות. לאחר מכן, אנו נשתמש בשיטת חלון הזזה (window sliding) ע״מ להשתמש במודלים של למידת מכונה בכדי לחזות את הנתונים החסרים. ההשערה שלנו היא שהפיכת הנתונים לערכים בדידים תאפשר לעשות אבסטרקציה שתאופיין גם ע״י המבנה הגלובלי של המידע וגם ע״י המבנה הלוקלי שלו ולבצע השלמת ערכים חסרים טובה יותר כאשר אחוז הערכים החסרים בנתונים הוא גבוה. בניסויים שלנו אנו נרצה להשוואת את השיטה לשיטות אחרות שמבצעות זקיפת נתונים לנתונים בדידים, וננסה לבחון את השפעה שיטת זקיפת הנתונים שלנו על יכולות הסיווג של מודלים שונים על אותו מידע.
|
|
מציאת קשרים בין miRNA באמצעות אמבדינג
|
סטודנטים
|
מנחים
|
תקציר
זהו פרויקט מחקרי בתחום הביואינפורמטיקה שתכליתו למצוא קשרים חדשים בין מולקולות מיקרו-רנ״א (miRNA). מולקולות זעירות אלה, הנקראות בקצרה מירים, הן סוג של רנ״א שאינו מקודד לחלבון (ncRNA) שקיים בתאים של רוב היצורים החיים, לרבות בני אדם. למירים תפקיד מפתח באבחון מחלות ובמניעתן, ועל כן הפכו לתחום מחקר הולך ומתפתח בשנים האחרונות.
מטרת הפרויקט היא למצוא קשרים חדשים בין מירים באמצעות שיטות מתחום ה-NLP, דבר אשר לא נעשה קודם לכן ביחס למירים. כדי לבצע זאת נאספו פרופילים של דגימות מרקמות שונות, חולות ובריאות, המכילים את הספירה של כל סוג מיר באותה דגימה. תהליך ה-word embedding התבצע ע״י יצירת pipeline שמורכב משלושה שלבים. השלב הראשון הוא המרת הפרופילים למסמכים שמכילים את המירים כמילים, כך שכל מיר מופיע במסמך ככמות הפעמים שנספר בדגימה התואמת, כך שנוצר מאגר של מסמכים שמייצגים את הפרופילים. השלב השני הוא הרצת אלגוריתם word embedding על מאגר המסמכים שייצר וקטור לכל מיר. כל וקטור מייצג את המיר בהתאם להופעותיו לאורך כל הקורפוס. השלב השלישי הוא חישוב מדדי דמיון על הווקטורים ועל הפרופילים הגולמיים כדי לדמות דמיון בין מירים ובכך למצוא קשרים חדשים ביניהם.
לאחר הרצת ה-pipeline הנ״ל הדמיון שחושב בין המירים נבדק למול קשרים ידועים כך שניתן היה להסיק מהם הזוגות שהקשר ביניהם מהווה חידוש. מבין הזוגות החדשים נאספו אלה שהתקבלה אינדיקציה לקשר ביניהם לאחר שהציגו דמיון גבוה במספר רקמות שונות, דבר העשוי להעיד על שיתוף פעולה פוטנציאלי.
|
|
שיפור תיקון ועריכת טקסט על ידי שילוב קול בלבד
|
סטודנטים
פלינט עדי
|
ענבל ביטון
|
נועה שבתאי
|
|
מנחים
|
תקציר
בימינו, כאשר הטכנולוגיה תופסת תאוצה ומהווה חלק בלתי נפרד משגרת היום יום שלנו, הצורך בממשקים שמישים ויעילים עולה. העולם כיום מציע מגוון רחב של ממשקים טבעיים למשתמשים, על מנת להגדיל את היעילות והתפוקתיות שלנו בעבודה, בתקשורת, ובחיים האישיים שלנו.
במחקרנו נעסוק בשאלה מהי הדרך הטבעית והיעילה ביותר לביצוע תיקון שגיאות ועריכת טקסט במסמכים. מספר שיטות ומתודולוגיות הוצעו במהלך השנים להוות אלטרנטיבה לשיטת מקלדת ועכבר, שיטות כגון שימוש בזיהוי מבט, שימוש בקול ומבט וכו'.
אנו נפתח מערכת, אשר תהווה שיטה אלטרנטיבית המתבססת על התממשקות באמצעות זיהוי קולי לביצוע תיקון שגיאות ועריכת טקסט, ונרצה לבחון בניסוי שנבצע, האם שיטה זו מהווה אלטרנטיבה אפקטיבית, יעילה ושימושית יותר למשתמש.
|
|
למידה חישובית אוטומטית (AutoML) באמצעות CNN
|
סטודנטים
|
מנחים
|
תקציר
מחקר זה בוחן את השימוש ב- convolutional neural network (CNN)בתור meta-learner עבור אתגר בחירת אלגוריתם למידה חישובית על ידי ייצוג תמונתי של dataset. אחד האתגרים העיקריים שאנשים שאינם מומחים נתקלים בהם ביישום למידת מכונה בבעיות חדשות הוא בחירת אלגוריתם, כלומר זיהוי האלגוריתם\ אלגוריתמים שיספקו את הביצועים הטובים ביותר בהינתן dataset ,משימה ומדד הערכה. גישה אוטומטית אחת להתמודדות עם אתגר הבחירה באלגוריתם היא meta-learning.
כיום ישנם מספר פתרונות בתחום ה-AutoML שבאים לתת מענה על בעיה זו, אך אף אחד מהם אינו עושה שימוש בראייה ממוחשבת. בעשור האחרון, ראייה ממוחשבת ואלגוריתמי למידה עמוקה הראו תוצאות פורצות דרך במשימות סיווג תמונה, זאת כפי שניתן לראות בתחומים רבים בחיים וכן במחקרים רבים שנעשו בתחום.
השיטה שלנו ראשית יוצרת ייצוג תמונתי של dataset, באמצעות ייצוג זה אנחנו יכולים להשתמש ב-CNN שמצטיינות בסיווג תמונות ועל כן נשתמש ביתרון זה כדי לסווג את האלגוריתם הטוב ביותר. העבודה שלנו במחקר זה מתבססת על ההיפותזה שעבור datasets עם ייצוג תמונתי דומה יש גם דירוג זהה של אלגוריתמים.
יתרה מזאת, בשל העובדה שכל רשומה אצלנו היא בעצם dataset, כמות הדאטה שברשותנו הינה מוגבלת לאימון מודל CNN בעל ביצועים גבוהים. על כן, אנו בוחנים את השימוש ברשת מאומנת מראש על פני יצירת מודל חדש. ספציפית, ביצענו העברת למידה מהגרסה השלישית של המודל Inception של גוגל ואימנו את המודל עבור המשימה שלנו שהיא קבלת תמונה של dataset וסיווג האלגוריתם הטוב ביותר עבורה. הניסויים שביצענו עד כה מראים כי השיטה המוצעת מגיעה לביצועי חיזוי שעומדים בשורה אחת עם פתרונות AutoML אחרים עבור אתגר בחירת האלגוריתם.
|
|
הבנת התהליך של יצירה ושחזור של סיב שריר באמצעות live-cell imaging ולמידת מכונה
|
סטודנטים
|
מנחים
|
תקציר
בעת פציעה בשריר, מתרחש תהליך של שחזור סיב השריר הפגוע. תאי גזע שעתידים להפוך לתאי שריר עוברים דיפרנציאציה (התמיינות), נעים לכיוון סיבי שריר קיימים ומתאחים אליהם על מנת לתקן את הפציעה בשריר. פציעת שריר עלולה להוביל למוגבלות בתנועה, ולתהליך שיקומי ארוך. הבנה של המנגנונים המשפיעים על תהליך יצירת סיב השריר עשויה לסייע בפיתוח טיפול המבוסס על שחזורו. על מנת לפענח את המנגנון מאחורי תהליך שחזור סיב השריר, אני מפתחת מעטפת חישובית שתנטר את התהליך באופן כמותי. לטובת זאת, מעבדתו של ד"ר אורי אבינועם ממכון ויצמן למדע מספקת live-cell imaging data. המעטפת החישובית שאני מפתחת, כוללת עיבוד תמונה במטרה לזהות ולעקוב אחרי התאים, למידת מכונה לבניית מדד כמותי המתאר את השלב בו נמצא תא בודד בתוך תהליך הדיפרנציאציה ועל מנת לפענח את הקשרים בין תנועת התאים, תהליך הדיפרנציאציה ותהליך האיחוי. תוצאות ראשוניות מצביעות על כך שתאים נוטים להתאחות אל תוך סיבי שריר קיימים באופן מובנה ושאינו רנדומלי; בין התאים קיימת תקשורת לוקלית המתחזקת ככל שחלה התקדמות בתהליך הדיפרנציאציה. ממצאים אלו יחדיו, מעלים את ההיפותזה לפיה קיים מנגנון המקשר בין השלב של התא בתהליך הדיפרנציאציה לבין התקשורת הלוקלית בין התאים. התאים מקבלים מידע מתאים שכנים, מעבדים אותו לקבלת החלטה להתמיין ולהתאחות לתוך סיב שריר קיים. המעטפת החישובית למעקב אחרי התהליך, תספק כלים שישפכו אור על המנגנונים התאיים והמולקולרים המשפיעים על יצירה או שחזור של סיב השריר. בטווח הרחוק, כלים אלו עשויים לסייע בפיתוח טיפול המבוסס על שחזורו ולהביא לקיצור תהליך השיקום מפציעת שריר.
|
|
פרויקט סינכרוניזציה מוטורית מרוחקת
|
סטודנטים
ירדן שוורץ
|
עדן מזרחי
|
אביטל זהבי
|
אור אלפסי
|
|
מנחים
|
תקציר
הפרויקט שלנו עוסק בתחום סינכרוניזציה מוטורית מרוחקת, כלומר בביצוע פעולות מוטוריות מסונכרנות על ידי אנשים שאינם רואים זה את זה. מערכות זו נועדה לעזור לחוקרים לבצע מחקרים בנושא. מטרת החוקרים הינה לבחון האם סינכרוניזציה מוטורית מרוחקת אפשרית ומה הן השפעותיה על המשתמשים. המערכת שלנו אמורה לספק את הבסיס עליו תתבצע הסינכרוניזציה בין האנשים המרוחקים. זוהי מערכת ראשונה מסוגה, שאחת מסגולותיה היא יכולתה לבודד צד אחד של האינטראקציה (כלומר את אחד המשתמשים) ובכך לשלוט ולשנות את יכולתו של המשתמש השני להסתנכרן. בעזרת שליטה זו נוכל לבחון בצורה מבוקרת את השפעתם של פרמטרים מסוימים על יכולת הסנכרון ותחושות המשתמש.
התוצר הסופי הינו מערכת הכוללת אפליקציית Android שבה יתבצע הניסוי עבור המחקר. המערכת תאפשר לחוקרים לשנות פרמטרים של התנהגות אחד מהצדדים ושל עכבת רשת התקשורת , תאסוף ותשמור נתונים על התנהלות הנבדקים במשחק, ותכין את הנתונים לניתוח. האפליקציה מכילה משימה משותפת בין המשתמש האנושי למשתמש המדומה ("סוכן"). במהלך הניסוי המשתמש משחק מול 5 "בני זוג", אשר יגולמו על ידי פרמטרי ההתנהגות שונים – רמת ההשהיה וקצב התגובה של הסוכן. הפרמטרים השונים אמורים לגרום למשתמש להרגיש כי הוא משחק מול 5 שחקנים שונים במהלך המשחק.
במסגרת הפרויקט עיצבנו את מנשק המשתמש של האפליקציה, פיתחנו אלגוריתם לחישוב תזמון פעולת הסוכן העתידית במשחק, והגדרנו את הפרמטרים שישפיעו על רמת הסנכרון של הסוכן ועל קצב הפעולה שלו. האלגוריתם מתבסס על היסטורית הפעולות של הסוכן והמשתמש במשחק ועל הפרמטרים הקבועים עבור הסוכן הרלוונטי.
בסיום בניית המערכת, ביצענו ניסוי משתמשים שבמהלכו הנבדקים שיחקו באפליקציה. אספנו נתונים על מהלך המשחקים של כל משתמש וניתחנו את הנתונים בכדי לבדוק את עמידות המערכת וטיב הניסויים.
|
|
הולודרום - מערכת לניתוח והצגת מידע עבור קבוצת רכיבה
|
סטודנטים
עמית נחימוביץ
|
יער מי-פז
|
עינבר צור
|
|
מנחים
|
תקציר
Israel Start-Up Nation היא קבוצת אופניים ישראלית יחידה מסוגה המדורגת כ- UCI World Tour על ידי האיגוד הבינלאומי לאופניים.
כדי לקבוע את תוכנית האימונים עבור כל רוכב, מנהל הקבוצה והמאמנים זקוקים למידע אודות מצבו הגופני של הרוכב וביצועיו במהלך האימונים. לכל רוכב בקבוצה מותקן על האופניים מחשב רכיבה אשר אוסף מידע אודות מצבו הפיזי וביצועיו במהלך הרכיבה. על מנת להפיק מידע זה הקבוצה נעזרת ב-API חיצוני. מנהל המידע של הקבוצה נעזר ב-script כדי לשלוף את המידע מה-API ולאחר מכן מפיק על סמך מידע זה דוחות שונים. הדוחות מוצגים ב-google sheets ומציגים על ידי גרפים שונים את המידע עבור מספר הרוכבים שנבחר. החסרונות המהותיים בתהליך זה הם ששליפת המידע והצגתו אינו מתבצע באופן אוטומטי אלא דורש הפעלה ידנית, המידע אינו נשמר במערכת פנימית של הקבוצה אלא רק בשרתי ה-API החיצוני והצגת הגרפים אינה נגישה דיה לקריאה.
מטרת הפרויקט היא ליצור מערכת אשר תבצע בצורה אוטומטית את תהליכי שליפת המידע, עיבוד המידע והאחסון שלו וכן שתאפשר הצגה נוחה ונגישה של המידע.
המערכת מבצעת את משימת איסוף המידע באמצעות תהליכים מתוזמנים אשר מופעלים אוטומטית ומאחזרים מידע מה-API החיצוני. המידע שנאסף מעובד ומאוחסן בבסיס הנתונים של המערכת. לאחר מכן, מופעל תהליך נוסף אשר מעדכן את הטבלאות הסיכומיות ב-Data Warehouse ממנו שולפים את המידע עבור הגרפים השונים (הנועד לשליפה מהירה).
כמו כן, על מנת להציג את המידע אודות הרוכבים עבור מנהל הקבוצה והמאמנים, בנינו Web application אשר מאפשרת לצפות בגרפים שונים אודות הרוכבים וכן לבצע פעולות מנהליות שונות.
|
|
OpenCoVid : ניטור הנחיות הקורונה ע״י ראייה ממוחשבת
|
סטודנטים
אבי חי אברהם צרפתי
|
דביר שמחון
|
אסף אטיאס
|
|
מנחים
|
תקציר
בדצמבר 2019, מגיפה עולמית בשם Covid-19 החלה להתפשט ברחבי העולם. לפי ארגון הבריאות העולמי (WHO), נכון לכתיבת שורות אלה, יותר מ- 169 מיליון אנשים נדבקו בנגיף. בעקבות כך, הוציא הארגון הנחיות להתנהגות בשעת חירום ובהן: שמירת ריחוק חברתי של שני מטרים בין אדם לאדם ועטיית מסכת פה ואף במקומות ציבוריים, על מנת למנוע את התפשטות הנגיף.
הצורך בביצוע מעקב ואכיפת השמירה על ההנחיות הציב קשיים מהותיים בפני מדינות העולם. קשיים אלו הביאו רבים, וביניהם גם אותנו, לחפש אחר פתרונות יעילים, זמינים ונגישים, שיקלו על ההתמודדות ויאפשרו להאט את קצב ההדבקה.
אנו מציעים פתרון יעיל המבוסס ראייה ממוחשבת ומתמקד בניטור אוטומטי בזמן אמת של בני אדם במרחב שתכליתו: בדיקת עטיית מסכת פה ואף ומדידת המרחק בין זוגות האנשים שזוהו במרחב.
בפתרון שלנו אנו משתמשים באלגוריתם למידה עמוקה המשלב טכניקות גיאומטריות לחישובי מרחקים. אנו משתמשים ברשת עצבית על מנת לנתח זרמי וידאו בזמן אמת באמצעות אלגוריתם זיהוי אובייקטים State-of-the-Art בשם YOLO בשילוב טכניקות גיאומטריה קלאסיות. הפתרון מתחלק ל-2 חלקים עיקריים:
מודל לזיהוי עטיית מסכת פה ואף.1
אלגוריתם לזיהוי בני אדם במרחב וחישוב המרחקים ביניהם.2
המערכת מציגה את תוצאות הניתוחים שביצעה על גבי המסך (בצורת bounding boxes עם קווים לסימון מרחק ותגיות - מסכה, מרחק מחושב), בזמן אמת, ומסמנת בצבע אדום את מפירי ההנחיות. יתרה מזאת, ניתן לצפות בסיכום תוצאות הניתוח שהמערכת ביצעה ברגע נתון: כמה אנשים עטו מסכה תקנית? כמה לא? כמה הפרות של ריחוק חברתי זוהו?
מבדיקות שביצענו עולה כי אנו עומדים על כ-81 אחוזי דיוק בעטיית מסכת פה ואף, ו-93 אחוזי דיוק בחישוב מרחק (בטווח ביטחון של 60 ס"מ, עבור זוגות במרחק של 2-3 מטרים בלבד).
בהשוואה לפתרונות המוצעים בשוק כיום, אנו מציעים פתרון ייעודי, נגיש וחינמי. המערכת לא מצריכה רכישת ציוד ייעודי, אלא ביכולתה להתחבר לכל מצלמה שהיא ולהפיק פלט מיידי ומדויק.
|
|
חיפוש תת אופטימלי חסום בעצי משחק מרובי שחקנים
|
סטודנטים
פלג ביטון
|
שחר מרץ
|
אסף זקס
|
עומר נגר
|
|
מנחים
|
תקציר
מערכות משחק בהן המחשב מתמודד כנגד בני אדם ואף מביס אלופי עולם קיימות שנים רבות. העיקרון שעומד בבסיס מערכות אלו מבוסס עצי החלטה – המערכת ממפה את מצבי המשחק בצורה של עץ, כל צומת מייצג את מצב המשחק בתורו של אחד המשתתפים, והקשתות מייצגות מהלכים המובילים למצבים חדשים. המערכת תבצע חיפוש בין קודקודי העץ במטרה למצוא את המצב האידאלי ובהתאם תבצע את המהלך הנדרש. מערכות המבוססות על אלגוריתמים נאיבים המנסים לחקור את כל המצבים לא יעמדו במשימה בזמן פיזיבילי, על כן תוטל מגבלה על מספר הקודקודים אותם מערכת תחקור, וערכו של מצב יקבע באמצעות חישוב יוריסטי שכן לא נגיע למצב סופי. איכות החישוב עולה ככל שהמצב שנעריך רחוק יותר מהמצב ההתחלתי, על כן פותחו טכניקות לגיזום חלקים מן העץ בצורה שלא פוגעת באופטימליות החיפוש, במטרה להעדיף קודקודים עמוקים יותר.
על בסיס טכניקות הגיזום האופטימלי, בפרויקט הגדרנו לראשונה תנאים לביצוע חיפוש תת-אופטימלי חסום בעצי משחקים מרובי משתתפים. בכך שאכפנו תנאים אלו על אלגוריתמים אופטימלים מוכרים, יצרנו שתי וריאציות בעלות פוטנציאל לבצע גיזומים רבים יותר, מכיוון שאינן מחפשות אחר הערך האופטימלי אלא אחר ערך הקטן ממנו עד כדי קבוע מוגדר. המטרה היא להגיע לקודקודים רחוקים יותר ולקבל באמצעות החישוב היוריסטי החלטה איכותית יותר – על אף המחיר שהסכמנו לשלם.
בניסויים שביצענו באמצעות מחולל עצים רנדומלים ובאמצעות סימולטור משחק רוליט לארבעה שחקנים, ניכר כי האלגוריתמים התת-אופטימלים חוקרים מצבים מתקדמים יותר ומשיגים תוצאות טובות יותר בהשוואה לאלגוריתמים האופטימלים מהם פותחו. יתכן ושימוש בתנאים אלו על אלגוריתמים שונים יציגו תוצאות טובות יותר, אך גם לתוצאות שאנו מציגים יכולת להשפיע על זמן ואיכות התגובה של מערכות משחק עתידיות.
|
|
אלגוריתם אגרגציה עבור מקרי קבלת החלטות בקבוצה
|
סטודנטים
מיכל אזרץ
|
אורטל פרפרה
|
רז קליין
|
|
מנחים
|
תקציר
במקרי קבלת החלטות או פתרון בעיות בקבוצה מבוזרת, הידוע גם כחוכמת ההמונים, היעד הוא מציאת התשובה הנכונה.
הגדרת שיטות אגרגציה של תשובות בכדי למצוא פתרונות לבעיות שונות ע"י חוכמת ההמונים, הוא נושא מחקר משמעותי בעולם של קבלת החלטות. מרבית שיטות האגרגציה לקבלת תשובה מתוך נתוני קהל מבוססות על פונקציה פשוטה בעלת חוקיות קבועה. לפשטות וחוקיות יש מגוון יתרונות אך מחקרים מראים שלבעיות שונות מתאימות שיטות אגרגציה שונות למציאת התשובה הנכונה ביותר, ותהיה תועלת רבה במציאת שיטה שתוכל לקבוע בכל מקרה של קבלת החלטה, איזו מבין שיטות האגרגציה היא המתאימה ביותר לפתרון המקרה הנתון.
בפרויקט שלנו אנו מציגים מערכת המבצעת מטא-אגרגציה. בהינתן אוסף תשובות, המערכת מציעה את השיטה בעלת הסבירות הגבוהה ביותר לפתור נכונה את הבעיה הנתונה. המערכת שלנו מבוססת על אלגוריתמי למידת מכונה, הלומדים ממקרי עבר של קבלת החלטות והפיצ'רים המתאימים להם, כל מקרה של קבלת החלטה מיוצג כתצפית בודדת והאלגוריתם חוזה אילו שיטות אגרגציה ידעו לפתור נכונה את המקרה הנתון ובאילו אחוזי דיוק.
מימוש האלגוריתם שלנו מבוסס על מסווג מרובה אפשרויות (מבצע חיזוי נפרד עבור כל אחת משיטות האגרגציה האפשריות), פיצ'רים המבוססים על עקרונות פסיכולוגיים וסטטיסטיקה, ונוסף על כך אנו מציגים שיטת אגרגציה חדשה שיצרנו, המאפשרת חיזוי פתרון במקרים של בעיות קשות או מבלבלות, בהן השיטות הקיימות לא הצליחו לחזות את התשובה הנכונה.
בתוצאות הניסויים נצפתה עלייה של מעל 20% בדיוק התוצאות של המערכת שלנו, בהשוואה לשיטת האגרגציה הטובה ביותר.
לגישת המטא-אגרגציה יש פוטנציאל גדול בזיהוי ואפיון של מקרי קבלת החלטות שונים בקבוצות מבוזרות, והשפעה על תחום מחקר זה.
|
|
Twixper: פלטפורמה לניסויים בטוויטר
|
סטודנטים
דקל לוי
|
טל פרימרמן
|
ניר דזורייב
|
|
מנחים
|
תקציר
רשתות חברתיות הן אחת הדרכים המשמעותיות ביותר של אנשים ללמוד על מה קורה בעולם. יש חשיבות רבה לביצוע ניסויים ברשתות חברתיות, ובפרט בטוויטר, הנחשבת לפלטפורמת חדשות אינטרנטית המתעדכנת לעיתים במהירות רבה יותר משאר כלי התקשורת. כרגע, הכוח לבצע ניסויים רחבי היקף על משתמשים ברשתות חברתיות קיימת בידי הרשתות עצמן. הרחבת היכולת לבצע ניסויים כאלה יכולה לשרת את טובת הכלל ולאפשר בחינה אובייקטיבית של סוגיות שאינן בהכרח עולות בקנה אחד עם האינטרסים של חברה מסחרית.
בפרויקט שלנו פיתחנו את Twixper - פלטפורמה המאפשרת לבצע ולנהל ניסויים על משתמשי טוויטר בצורה אורגנית, קלה, שקופה ואתית. היא מאפשרת לחוקרי רשתות חברתיות לבצע מניפולציות על התוכן שמשתמשי טוויטר נחשפים אליו, ולתעד את האינטראקציה שלהם עמו.
המערכת שלנו מורכבת מאתר ייעודי לחוקרים, ומאפליקציית מובייל למשתתפים בניסויים.
באתר החוקרים ניתן ליצור, לנהל ולעקוב אחר ניסויים. חוקר יכול לצפות בניסויים שיצר, להוריד דו"חות ניסויים וליצור ניסוי חדש, כולל הגדרת קבוצות ושליטה בתוכן הפיד באפליקציה של הנסיינים.
המשתתפים בניסויים ישתמשו באפליקציית מובייל שפיתחנו, המדמה את אפליקציית טוויטר. המשתמשים יוכלו להתחבר לאפליקציה לאחר אימות מול טוויטר והזנת קוד הניסוי שיקבלו מהחוקר שיצר את הניסוי. האפליקציה מספקת חווית שימוש דומה מאוד לשל טוויטר ומאפשרת פונקציונליות רחבה - לצפות בפיד, להגיב על תוכן, לפרסם תוכן חדש, לעקוב אחר משתמשים, לצפות בפרופילי משתמשים, חיפוש ועוד.
המערכת תומכת במספר מניפולציות אפשריות על תוכן הפיד - הסרת תוכן, הוספת תוכן, פיקסול מדיה או הסרתו מציוצים. לבסוף, החוקר יכול להוריד דוח המכיל יומן פעילות מלא של המשתתפים בניסוי שלו, ולהעריך את אפקטיביות המניפולציות שהגדיר על התנהגות המשתמשים.
|
|
Framework שיאפשר שימוש בשירותי ML בענן תוך כדי שמירה על פרטיות הנתונים
|
סטודנטים
|
מנחים
|
תקציר
התקדמויות אחרונות ביכולות מחשוב ענן ולמידת מכונה (ML) אפשרו לציבור גישה לאלגוריתמים חדישים שעד לא מזמן היו נגישים רק למעט. למרות זאת, השימוש ביכולות האלו טומן בחובו סכנה אפשרית: אובדן הפרטיות של המידע. פתרונות כמו הצפנה הומומורפית (Homomorphic encryption) שומרות על המידע מוצפן בכל עת, אבל הם יקרים מבחינה חישובית ודורשים שיתוף פעולה מספק שירות המחשוב בענן. פתרונות Differential privacy מבטיחים רמה מסוימת של ערפול המידע, אך תוקף מסוגל להשיג תובנות מסוימות על המידע המעובד. במאמר הזה אנחנו מציגים פתרון חדשני שמציע יתרונות רבים של הצפנה הומומורפית ללא התוספת בעלויות החישוב בצד השרת, ובעלות מוגבלת לצד הלקוח. על ידי הצפנת המידע בעזרת רשתות deconvolution המיוצרות בצורה אקראית, אנחנו מסוגלים לייצר פתרון הצפנה מאובטח ופשוט. ניתוחים אמפיריים מציגים את האפקטיביות ואת החוסן של גישתנו.
|
|
מציאת מדיניות בריחה עבור בעיית הרודף-בורח
|
סטודנטים
|
מנחים
|
תקציר
בעיית הרודף-בורח מתארת שני סוכנים, רודף ובורח, הנעים בסביבה תלת ממדית. מטרת הסוכן הבורח היא להגיע אל מטרה מתוך אוסף של מטרות סטטיות הנמצאות בסביבה. מטרת הרודף היא למנוע מהבורח להגיע את אחת מהמטרות, והוא יכול לעשות זאת על ידי התנגשות בורח לפני שהוא מגיע ליעדו. ברגע שהרודף מצליח לתפוס את הבורח שניהם נעלמים מסביבת הבעיה. המחקר מתמקד בתפקודו של הסוכן הבורח, כאשר המטרה העיקרית היא לפתח שיטה שתעזור לסוכן למצוא מדיניות אופטימלית לתזוזה, שמוגדרת כמדיניות שתגדיל ככל הניתן את הסיכויים שלו להגיע למטרה, ומצד שני תקטין ככל הניתן את הסיכויים שייתפס על ידי הרודף. האתגר העיקרי הוא המידע שנתון לכל אחד מהסוכנים- הסוכן הבורח לא יודע דבר על מיקומו של הרודף או על התזוזה שלו במרחב, אך הוא יכול לדעת האם בסוף המסלול שלו הוא הגיע למטרה או שנתפס. לעומתו, הרודף יודע מהו מיקומו של הבורח בכל רגע נתון. הדרך המוצעת להשגת הבעיה היא מידול בעיית הרודף-בורח כבעיית Q-learning, המתבססת על מתן ערכים לפעולות אפשריות בהינתן מצב מסוים, וכך בסופו של דבר למצוא סדרי פעולות אופטימליים. בעולם בעיית הרודף-בורח מצב מוגדר כזוג סדור של מיקום הבורח (x,y,z), ושל מהירותו, אשר מגדירה את השינוי במיקום ביחידת זמן, כלומר (?x,?y,?z). באמצעות שיטת הלמידה Q-learning ייצר הרודף מסלולים במרחב ובאמצעותם ילמד מהם הכיוונים והאזורים שבהם כדאי לו להתקדם, וכך יגבש את המדיניות שלפיה הכי כדאי לו לפעול.
|
|
פלטפורמה לחקר מערכות הגנה של בקטריות
|
סטודנטים
ינון בן זיכרי
|
עובדיה עידו עפרוני
|
אלון גולומבק
|
תומר זיינפלד
|
|
מנחים
|
תקציר
פרויקט פיתוח זה שייך לענף הביואינפורמטיקה, ומספק פלטפורמה לכריית מידע בתחום מערכות הגנה של הבקטריה Pseudomonas Aeruginosa, באמצעות אפליקצייתweb ידידותית למשתמש. לאור כמות המידע העצומה שקיימת בנושא, היעדר ממשק ייחודי המתמקד ב-Pseudomonas Aeruginosa, והיעדר כלים לחקר מערכות הגנה וקורלציה של פנוטיפים או מאפיינים גנומיים – עלה הצורך בפלטפורמה המשלבת בתוכה את המידע הנ"ל.
הפרויקט עוסק במערכות הגנה של Pseudomonas Aeruginosa ומספק מידע אודות 18~ מערכות הגנה שונות ב-6000~ זנים שונים, בכל אחד מ-6000~ הגנים שלהם, וכן בכ- 50,000~ קלאסטרים של גנים של הבקטריה. הפרויקט יאפשר לחוקרים לחקור מערכות הגנה של מיני בקטריות וכן יאפשר להם להבין טוב יותר את הקשר של מערכות ההגנה לתכונות גנומיות, סביבתיות ופנוטיפיות.
האתר מספק מגוון תצוגות וכלים ויזואליים המסייעים לחוקרים להגיע לתובנות שונות בתחום תוך ביצוע של מספר פעולות פשוטות בממשק. בין כלים ותצוגות אלו: 1. תצוגה טבלאית אינטראקטיבית של פרטי גנים של זנים לבחירת המשתמש. 2. Circos genome browser אינטראקטיבי המציג גנום של זנים לבחירת המשתמש וכן מידע על גנים המזוהים עם מערכות הגנה ספציפיות בזן שנבחר. 3. עץ פילוגנטי המציג זנים והתפלגות של נתונים לבחירת המשתמש (וביניהם מערכות הגנה, meta data ועוד). 4. מבחני קורלציה בין כל זוג מקבוצת הקטגוריות הבאה: מערכות הגנה, קלאסטרים של גנים, תכונות של זנים וגנים (כלומר גודל הגנום ועוד) ו-meta data. 5. הורדת המידע העומד לרשות האתר ישירות מה- DB שלו לשימוש אישי של המשתמש, במגוון וריאציות אפשריות.
מטרת הפרויקט היא לספק לחוקרים ולקהילה המדעית ממשק בו יוכלו לצרוך, למפות ולהמחיש באמצעים ויזואליים את המידע המורכב על הבקטריה Pseudomonas Aeruginosa, זאת לחקר פשוט ומקיף יותר של הבקטריה.
|
|
זיהוי האם commit הכניס באג לקוד
|
סטודנטים
|
מנחים
|
תקציר
חיזוי באגים על ידי למידת מכונה הינה בעיה ידועה שנחקרת במשך שנים רבות. המטרה העיקרית של התזה היא לחזות האם Commit הכניס באג לקוד טרם הכנסת ה-commit ל- repository. על מנת להשיג מטרה זו, נבדוק שני דברים. ראשית, נמצא קבוצה של תכונות המצביעות על גרימת באג בקוד המקור. התכונות יתבססו על ניתוח סטטי, ונראה שתכונות אלה מאפשרות לנו להוכיח הכנסת באג בקוד. שנית, נבנה מודל שיאפשר לנו לזהות אם commit מסוים גרם לבאג בקוד בעזרת מכלול התכונות שמצאנו. מודל זה מבוסס על Generative Adversarial Networks (GAN). באמצעות GAN, נוכל ליצור דוגמאות נוספות ולשפר את חיזוי הבאגים.
|
|
שיפור זיהוי אנומליות בעזרת אוגמנטיות מגוונות בזמן הבדיקה, הנלמדות בשיטה לא מונחית
|
סטודנטים
|
מנחים
|
תקציר
איתור חריגות היא משימה ידועה שנחקרת בספרות כבר עשרות שנים. חריגות הן תצפיות שאינן עונות על ההתנהגות הצפויה ביחס להקשר או לתחום כלשהו. אירועים חריגים מתרחשים לעיתים רחוקות יחסית, אך עם זאת, עלולים להיות להם השלכות חמורות ומסוכנות בתחומים כגון זיהוי מתקפות סייבר, הונאת כרטיסי אשראי, שירותי בריאות וביטוח נזק תעשייתי. הגדלת תצפית בזמן הבדיקה (TTA) היא יישום של טכניקת הגדלת נתונים רק שהיא מבוצעת על מערך הבדיקה. דבר זה נעשה על ידי יצירת עותקים נוספים עבור כל דגימת בדיקה, ניבוי כל אחד מהם, ושילוב התוצאות עם חיזוי תצפית הבדיקה המקורית. TTA יעיל יותר מהגדלת הנתונים בשלב האימון מכיוון שהוא אינו דורש אימון מחודש של המודל, תוך שמירה על הדיוק ובנוסף, משפר את עמידותו (Robustness). למיטב ידיעתנו, אין מחקרים המשתמשים ב-TTA לזיהוי חריגות לנתונים טבלאיים.
אנו מציעים שיטה מבוססת TTA לשיפור ביצועי זיהוי חריגות. אנו לוקחים את השכנים הקרובים ביותר לתצפית הבדיקה ומייצרים את העותקים שלה באמצעות ה-centroids של מודל k-Means שאומן על שכניה. הגישה המתקדמת שלנו, משתמשת ברשת סיאמית כדי ללמוד מדד מרחק מתאים לשימוש בעת אחזור השכנים הקרובים ביותר של תצפית הבדיקה. אנו מראים כי עבור כל שמונת ה-datasets שהערכנו, מזהה חריגות אשר המשתמש בגישת ה-TTA שלנו משפר את ה-AUC באופן משמעותי. יתרה על כך,עבור כמעט כל ה-datasets המוערכים (למעט אחד), הגישה המשתמשת במדד המרחק הנלמד, מראה שיפור משמעותי יותר מהגישה המשתמשת במרחק האוקלידי.
|
|
KarmaLegoWeb מערכת לכריית מידע מבוסס זמן
|
סטודנטים
יפתח סוקה
|
עומר הופמן
|
רועי שלמה כץ
|
|
מנחים
|
תקציר
פרויקט KarmaLegoWeb עוסק בכריית מידע מנתונים מבוססי זמן. כיום, חוקר בעל נתונים מבוססי זמן המעוניין לנתח ולהסיק מסקנות על הדאטה שלו נדרש להשתמש במספר אפליקציות אשר סגורות לקהל מצומצם ביותר ובמקביל הן דורשות ידע טכנולוגי רב בקוד.
מערכת KarmaLegoWeb מפשטת ומרכזת את כל התהליכים למערכת web אחת פתוחה שבה כל משתמש המחזיק נתונים מבוססי זמן יכול להעלות אותם למערכת, לאתר תבניות מבוססות זמן, לנתח אותן מכמה זוויות שונות באמצעות כלים ויזואליים מתקדמים ולשתף אותם עם משתמשים אחרים.
הלקוח בפרויקט זה הוא ד"ר רוברט מושקוביץ' ומעבדת CDALab, מטרת הפרויקט על פי הגדרתו היא יצירת מערכת אשר תאפשר שימוש באלגוריתמים מבוססי זמן שפותחו במעבדה בצורה יעילה, פשוטה, מהירה ויציבה, וכל זאת באפליקציה אחת. כיום המערכת הוטמעה במעבדה ומשמשת ככלי עזר למחקרים שונים.
כאמור הפתרון שנבחר הינו יצירת אפליקציית web אשר מנגישה למשתמש את ההיבטים הטכניים של שימוש בכריית תבניות מבוססות זמן כקופסא שחורה. ביצירת הפרויקט השתמשנו בטכנולוגיות רבות כמו Python, Flask, React, Apache ועוד..
בפרויקט התמודדנו באתגרים רבים אשר המרכזיים הינם תכנון ויצירת אפליקציית צד שרת ולקוח שתעמוד בדרישות הלקוח, יצירת מודול ויזואליזציה לתבניות בזמן אשר מנגיש את פלטי האלגוריתמים בצורה נגישה שממנה המשתמש יכול להפיק תובנות חדשות ואינטגרציה בין מספר פרויקטים מהעבר (אלפי שורות קוד שנכתבו בשפות שונות) שנכתבו במעבדה, אל תוך אפליקציית web אחת שתאפשר גישה ושימוש נוחים מכל העולם.
עמדנו בכל היעדים שהוגדרו לנו ע"י הלקוח וכיום המערכת זמינה לכלל המשתמשים באינטרנט בקישור הבא: https://icc.ise.bgu.ac.il/njsw22
|
|
מערכת ביצוע מחקרים בשפות עם כיווני כתיבה שונים
|
סטודנטים
ראזי אלשיך
|
מוחסן עבדאללה
|
יבגני אומנסקי
|
|
מנחים
|
תקציר
כיום אנו חיים בעידן טכנולוגי מתקדם מאוד שבו נוכל לבנות אפליקציות ואתרי אינטרנט מסובכים ביותר, שכוללים הרבה פונקציונאליות. למרות זאת, לעיתים הממשקים של אותן אפליקציות או אתרים לא מציגים את התוכן באופן שיתאים למשתמשים ששפתם נכתבת מימין לשמאל, כמו עברית וערבית. הדבר נובע מחוסר מידע שקיים היום בתחום ומחוסר מחקרים שעוסקים בתחום של שפות דו כיווניות (כלומר כאלו שכיוון הכתיבה העיקרי שלהן הוא מימין לשמאל).
המערכת שאנחנו בונים היא כלי לביצוע מחקרים בשפות עם כיווני כתיבה שונים. נכון להיום לא קיימת מערכת דומה בשוק. המערכת שלנו תשמש את החוקרים לצורך בניית והרצת ניסויים) על נבדקים), כאשר המערכת תומכת ב: שמירת מדדים על ביצועי המשתמשים השונים, מספקת ניתוחים סטטיסטים לחוקרים, גמישות במניפולציה על כיוון הצגת הפקדים השונים ועקביות בהצגת התוכן של הניסוי בשפות שונות ובשני כיווני הכתיבה – משמאל לימין ומימין לשמאל.
המערכת שלנו מספקת לחוקרים את כל הנ"ל על מנת לשפר את חווית המשתמש וגם על מנת לחדד את הסטנדרטים הקיימים היום, דבר שיעזור למפתחי אתרים ואפליקציות.
הלקוחות של המערכת הם החוקרים שישתמשו במערכת שנבנה לצורך בנייה נוחה של מחקרים, ביצוע שלהם, וניתוח תוצאותיהם.
המערכת תומכת ב-4 שפות: עברית, ערבית, רוסית ואנגלית. ריבוי השפות במערכת יאפשר לחוקרים לקבל תמונה יותר כללית על העדפות המשתמשים באופן הצגת תוכן במנשקים או בהצגת פקדים מצד אחד, ומצד שני יאפשר לקבל תמונה יותר ספציפית כאשר יתייחסו לשפה מסוימת.
לבסוף, אנחנו מאמינים כי המערכת שלנו תתרום רבות בנושא של הצגת תוכן או אופן הצגת פקדים שונים באתרים המשתמשים בריבוי שפות. והיא תהיה מערכת מחקרית שיכולה להתפתח בהמשך ולהוביל לשינוי חיובי בתחום של חווית המשתמש.
|
|
חיזוי של החמרה במחלה בקרב חולי טרשת נפוצה
|
סטודנטים
גיא זמוסטיאנו
|
איתי כץ
|
שירה ורטהיים
|
|
מנחים
|
תקציר
טרשת נפוצה הינה המחלה הדלקתית הכרונית הנפוצה ביותר של מערכת העצבים המרכזית, המשפיעה על יותר משני מיליון אנשים בעולם. אופן התפתחות המחלה מגון ובלתי צפוי, כאשר ברוב החולים המחלה מאופיינת תחילה על ידי אפיזודות של גירעונות נוירולוגיים הפיכים.
חולי טרשת נפוצה לרוב מחולקים לתת קבוצות המבוססות על פי חומרת מצבם הרפואי. המחקר שלנו מתמקד בשתי קבוצות: Relapsing-remitting MS (RRMS) ו-Secondary Progressive MS (SPMS). חולי RRMS לרוב חווים את המחלה בצורה קלה שלא משפיעה על שגרת חייהם, בעוד ומצבם הרפואי של חולי SPMS נוטה להתדרדר באופן קבוע.
המחקר שלנו מתמקד באתגר זיהוי חולי טרשת נפוצה בקבוצת חולי RRMS, אשר קיים סיכוי גבוה שמצבם הרפואי יחמיר בשנים הבאות עד כדי הגדרתם כחולי SPMS. מאמצינו מתמקדים בניסיון לפתח מודל המשתמש במידע קליני של מטופל מהרגע שבו הוא אובחן בכדי להתמודד עם אתגר זה. על מנת לפתח מודל מסוג זה, אנו משתמשים בשיטות ואלגוריתמים של למידת מכונה.
על מנת להשיג את מטרות המחקר, השתמשנו במגוון של שיטות למידת מכונה כגון Logistic Regression
ו-Random Forest. בנוסף, הפתרון שלנו נעזר בכלים מתקדמים, כגון Lasso Regression ו-SHAP על מנת לבחור את הפיצ'רים המשפיעים ביותר ובארכיטקטורת GAN על מנת להעשיר את מאגרי הנתונים שברשותנו ובכדי להשיג תוצאות מבטיחות יותר.
כמו כן, עשינו שימוש בשיטת Leave-One-Out Cross-Validation בכדי לשפר את תוצאותינו.
|
|
פיתוח טכנולוגיה אינטרקטיבית לסינכרוניזציה מוטורית בין-אישית מרוחקת
|
סטודנטים
|
מנחים
|
תקציר
שפע של מחקרים בעשור האחרון הוקדשו לסנכרון מוטורי בין-אישי (Interpersinal motor synchronization, IMS): התאום מבוסס-הזמן של תנועת האנשים. באופן כללי, המחקרים מראים כי לביצוע פעולה בסנכרון בין-אישי לפרק זמן קצר עם אדם אחר, ישנן השפעות פרו-חברתיות כמו אמפתיה מוגברת, נכונות לעזור ותחושת דמיון לאדם השני.
במחקר שלנו אנו מפתחים וחוקרים פעילויות של IMS מרוחק באמצעות יישומי טלפון חכם, כדי לבדוק האם סנכרון מוטורי בין אישי מרוחק מוביל להשפעות פרו-חברתיות הדומות לסנכרון שאינו מרחוק. במסגרת זו אנו גם בוחנים את השפעת השהית העברת המידע ברשת התקשורת, וכיצד היבטים שונים של חילופי המידע משפיעים על IMS מרוחק.
לצורך המחקר שלנו פיתחנו אפליקציה מבוססת flutter עם טכנולוגיית תקשורת WebRTC. האפליקציה מכילה פעילויות שנועדו לזוגות של משתמשים. אנו מתמקדים בבחינת מספר תצורות שונות של IMS מרוחק, הנכללות בשתי פעילויות: פעילות הקשה - פעולת סנכרון בפאזה בה המשתמשים צריכים לבצע הקשה בו זמנית, ופעילות מסירות - פעולת סנכרון באנטי-פאזה בה המשתתפים מעבירים דיסקית ביניהם במהירות שונה. הפעילויות שונות זו מזו ברמת דיוק התזמון, בסוג התנועה הנדרשת מהמשתתפים, ובתחלופת המידע השונה בין המשתמשים. אנו מודדים סנכרון פעילויות באמצעות מדדים אובייקטיביים שונים וכמו כן בודקים את השפעת הפעילות על התפישות הפרו-חברתיות של המשתתפים. אנו משערים כי IMS מרוחק מוצלח (כפי שנמדד על ידי מדדי סינכרון סובייקטיביים ואובייקטיביים) יוביל לעמדות פרו-חברתיות יותר. בנוסף, אנו משערים כי השהיית תקשורת ברשת יפחית את מדדי הסינכרון הסובייקטיביים והאובייקטיביים.
|
|
מערכת לאיסוף וניתוח נתונים על מטופלים במחלקה האורתופדית בסורוקה - ModaMedic V2
|
סטודנטים
שי ארץ קדושה
|
גל בוזגלו
|
נוי הררי
|
סהר בן ברוך
|
|
מנחים
|
תקציר
כיום, רופאים מנתחים במחלקה האורתופדית בבית החולים "סורוקה" מבצעים ניתוחים ואין להם כל אינדיקציה אובייקטיבית לגבי הצלחת הניתוח. למעשה, הרופאים מקבלים החלטות על המשך טיפול על סמך שיתופו של המטופל בתחושותיו, שכן אין להם כל יכולת לקבל מידע שאינו סובייקטיבי על השינוי שחל בחיי היום-יום של המטופל בעקבות הניתוח. ד"ר אלכס גפטלר – רופא בכיר במחלקה האורתופדית במרכז הרפואי אוניברסיטאי סורוקה, העלה את הצורך בפתרון לבעיה המתוארת, וכן היווה עבורנו מקור ידע לתהליכים הרפואיים הכרוכים בפיתוח המערכת. בפרויקט זה המשכנו את פיתוח מערכת ModaMedic. המערכת אוספת מידע באמצעות אפליקציה ייעודית וצמיד חכם, ומאפשרת הצגת נתוני תנועתיות אובייקטיבית על המטופלים לפני ואחרי הניתוח. המערכת עוקבת אחר מדדים שיאפשרו ללמוד על מצבו של המטופל ולהסיק מסקנות בנוגע להצלחת הניתוח ולהשפעתו על חיי היום-יום של המטופל, וכן תעזור לרופא בקבלת החלטה על המשך טיפול. המערכת מאפשרת השוואת מדדי מטופל לקבוצת מטופלים בעלי קריטריונים דומים. ההשוואה מאפשרת אינדקציה נוספת למצב החולה ביחס לשאר המטופלים ותורמת לשיעור קצב החלמת המטופל. כמוכן המערכת מאפשרת למטופל לצפות במדדיו, בסרטוני תרגילים פיזיותרפיסטים ביתיים במטרה לסייע להחלמתו, צפייה בהדרכות לקראת או לאחר ניתוח ותקשורת עם הרופא באמצעות הודעות. צוות הפרויקט קיבל אישור מוועדת הלסינקי וביצע הטמעה ניסוי קליני בהשתתפות מטופלים של המחלקה האורתופדית בבית החולים סורוקה, שכללה הדרכה לגבי שימוש במערכת ומתן תמיכה טכנית מצד צוות הפיתוח. ניתן משוב חיובי מרוב המשתמשים והצוות הרפואי. ראינו כי קיים פוטנציאל משמעותי לשיפור השירות במערכת הבריאות הציבורית הן מבחינת האפשרויות שנפתחו לרופא והן מבחינת הכנסת המטופל למעגל הטיפולי. כמוכן, הנתונים שיאספו יספקו מענה עתידי על שאלות מחקריות לצרכים כמו סיווג מטופלים, חיזוי אבחנות והצלחת ניתוחים.
|
|
מערכת להערכת הסברים של תוצאות מודלים לומדים
|
סטודנטים
חן דבי
|
שירן גולזר
|
מיכל טלמור
|
|
מנחים
|
תקציר
בשנים האחרונות נעשה שימוש רחב באלגוריתמי למידת מכונה. ההחלטות המתקבלות מאלגוריתמים אלו, מתקבלות במקרים רבים באופן שאינו שקוף למשתמש. לכן, מתן הסברים לתוצאות חיזוי האלגוריתמים חיוני עבור חוקרים ומשתמשים לצורך קבלת החלטות אחראיות במגוון תחומים.
ההסבר מבוסס על הרעיון שאלגוריתמי למידת מכונה המכונים "קופסה שחורה" יהפכו לאלגוריתמי "קופסה שקופה" ויציגו למשתמשים את התכונות הדומיננטיות שהובילו להחלטה אותה המודל קיבל.
עם התפתחות התחום אין כיום מספיק כלים אשר מעריכים את המהימנות, עקביות ואספקטים נוספים של ההסברים שמתקבלים. במחקר, התמקדנו בצורך זה ובמתן שיטות אבליואציה חדשניות לצורך הערכת נכונות ההסברים, על מנת שהמשתמש יוכל להסתמך עליהם. כחלק מהפרויקט פיתחנו ארבע שיטות חדשניות להערכת מודלי ההסבר לצורך בחינת המהימנות, עקביות וחוסן ההסברים. כל אחת מהשיטות שלנו נבחנה על שני מודלי הסבר קיימים SHAP ו-LIME.
השיטה הראשונה בוחנת כמה רגיש הסבר המודל לרעשים בנתונים. השיטה השנייה, בוחנת את מהימנות ההסברים ומשתמשת בדוגמאות מתוך הדאטה שמסווגות הפוך, בעזרת הרעיון של counterfactual. שתי השיטות האחרונות בוחנות את עקביות המודל ומשתמשות במדד אנטרופיה וחיתוך קלסטרים למדידה.
כחלק מהניסויים במחקר, אנו בוחנים את שיטות הערכת ההסברים שפיתחנו על שלושה דאטה סטים שונים עם מודלי חיזוי מסוג עצים כמו: XGBoost ו- Random Forest. כל הדאטה סטים שביצענו בעזרתם את הניסויים מכילים פיצ'רים רפואיים במטרה לחזות מחלה אצל מטופל.
בנוסף לפיתוח שיטות האבליואציה, פיתחנו ממשק משתמש לחוקרים לצורך הרצת מודלי הסבר עבור מודלי למידת מכונה. וכן, בחינת נכונות ההסברים על ידי שיטות האבליואציה שפיתחנו ותצוגות גרפיות.
|
|
תרמו את זה הלאה
|
סטודנטים
מרב סבינה שקד
|
תאיר כהן
|
גל רוזנטל
|
יובל בן אליעזר
|
|
מנחים
|
תקציר
כיום, בישראל פועלות מגוון פלטפורמות המאפשרות תרומה לקהילה וכן מכירת מוצרי יד שנייה, אך הן אינן מספקות את השילוב הכל כך חזק, שלדעתנו יועיל וישפר את יכולת גיוס התרומות לעמותות, יעלה את המודעות לגבי עמותות קטנות, וגם יעלה את המוטיביציה והערך למכירת מוצרי יד שנייה שיהפוך להרבה יותר מסתם דרך "להפטר מפריט ששוכב במחסן".
DonateItApp הוא אתר אינטרנט ואפליקציית מובייל המשמשת כפלטפורמה חברתית שמטרתה לסייע לעמותות קטנות לגייס כספים בעזרת מכירת מוצרי יד-שניה, בה הכסף עבור המוצרים יועבר לעמותה כתרומה, וכן להגדיל את חשיפתן בקרב הציבור הישראלי. נכון להיום, יצרנו שיתוף פעולה עם מספר עמותות הפועלות במגוון רחב של תחומים, והן: אור למשפחות, פעמונים, בית השנטי, ויצו, לוחמים ללא גבולות, אור לעולם, העמותה לעזרה מידית לניצולי השואה.
התורם מפרסם באפליקציה פריט שאינו זקוק לו ואת פרטיו המלאים. משתמשים אחרים המבקרים באתר יכולים לראות את המוצרים המפורסמים באתר. לאחר בחירת המוצר המבוקש, המשתמש מתבקש לשלם עבורו, בהתאם לשווי שקבע התורם. בהסכמת שני הצדדים, הכסף יועבר לעמותה אשר תבחר והמוצר יעבור בין השניים. בזכות האפליקציה, שני המשתמשים יוצאים מרווחים, האחד על ידי תרומת מוצר והשני על ידי תרומה כספית למטרה טובה. בנוסף, המשתמשים יכולים לראות את חלוקת התרומות שלהם בין העמותות השונות להן תרמו. כמו כן, כל משתמש באתר יכול לחפש מוצרים או עמותות על ידי מסננים רלוונטים.
לאחר צפיה במוצר מסוים המערכת תציע למשתמש מוצרים המומלצים לקניה על פי קריטריונים ידועים מראש. יחד עם זאת, לכל עמותה נוצר משתמש ייעודי ואיתו העמותה יכולה לפרסם אירועים ולערוך את הדף האישי שלה אשר בו מפורטים פרטי העמותה ופעילותה.
המערכת זמינה בכתובת:
https://donateitapp.herokuapp.com
|
|
RepFeed: פיד מייצג ברשתות חברתיות
|
סטודנטים
איתי מרחב
|
מתן ברוקר
|
אבירן גואל
|
דורון שמאי
|
|
מנחים
|
תקציר
בעשורים האחרונים, הקיטוביות הפוליטית כמעט בכל החברות המערביות גדלה באופן משמעותי. רבים רואים ברשתות החברתיות ובפידים המותאמים אישית שהן מספקות גורם לקיטוביות.
עדויות אמפיריות תומכות בטענות אלה בכך שהן מראות כי אלגוריתמי דירוג תורמים ליצירת
filter bubbles ו echo chambers - סביבות שבהן רק צד אחד של הדיון מוצג ונדון יתר על המידה.
RepFeed שואפת להפוך מגמות אלה על ידי מתן אפשרות למשתמשים להיחשף לדעות פוליטיות מגוונות ואותנטיות. RepFeed היא מערכת הכוללת מסד נתונים ושרת המשתלבים עם ממשק האינטרנט של Twitter באמצעות תוסףChrome . המערכת מוסיפה שני פידים בנוסף לפיד הקיים
ב- Twitter.
הפיד הראשון מאפשר למשתמשים לראות את התוכן שמוצג לאנשים הנמצאים במקומות שונים על גבי הקשת הפוליטית. הפיד השני מאפשר למשתמשים להתעמק בנקודת מבט של חתך אוכלוסייה ספציפית, למשל לראות את התוכן אליו נחשפים אנשים על פי קריטריונים של גיל, מגדר, מדינה, גזע והשתייכות למפלגה פוליטית.
RepFeed מבוסס על פאנל ייחודי של מצביעים אמריקאים המשתמשים ב- Twitter. הפאנל מעניק חוויה אורגנית ודינאמית עם תוכן אמיתי ועדכני הזמין ב- RepFeed.
|
|
מערכת המלצה לאילוצים בשפת OCL
|
סטודנטים
עמית וולף
|
אוהד נווה
|
עידן אלביליה
|
|
מנחים
|
תקציר
OCL הינה שפה המשמשת להגדרת אילוצים על אובייקטים ולהגדרת תנאי קדם/סוף על פעולות שונות במידול מערכות תוכנה. השפה פותחה בכדי להתגבר על מגבלות תכנון של מערכות תוכנה שמודלו באמצעות UML והשימוש בה משפר משמעותית את דיוק מפרט המערכת.
למרות התועלת הרבה של OCL ,ברמה המעשית משתמשים שאינם מומחים בשפה מתקשים בכל מה שקשור לכתיבת אילוץ חוקי ונכון. המחקר שלנו מנסה לפתור בעיה זו באמצעות שימוש בטכניקות של למידת מכונה כדי להמליץ ??על אילוצים למודל נתון. בעזרת דאטה-סט גדול של נתונים המכיל כמות מספקת של מודל המתארים מערכות תוכנה שונות ואילוצי ה- OCLהקיימים בהם, אנו מנסים ללמוד אספקטים שונים של אותם מודלים אלה, כאשר העיקר הוא על למידת הדפוסים הקיימים במבנה שלהם וסמנטיקת האילוצים בהם, כדי שבסופו של דבר נוכל לחזות אילוצים חדשים שנבנו עבור מודל שמתקבל כקלט למערכת.
מטרת המחקר העיקרית מורכבת מרמות שונות של פתרון אשר נבנות אחת על גבי השנייה ועקב מורכבות כל אחת מהן, מטרתו הסופית של המחקר תמומש במחקר נוסף כאשר המערכת שלנו והמחקר הנלווה יהוו את רוב הבסיס הדרוש לה.
המערכת כוללת שני רכיבים מרכזיים, הראשון אחראי על הכנת המידע בו נעשה שימוש לתהליך הלמידה והשני אחראי על הליך החיזוי וביצוע הניסויים. בתהליך הכנת המידע המערכת מבצעת פרסור של כל הדאטה-סט, תוך כדי וידוא חוקיות המידע באמצעות התממשקות לכלים חיצוניים שעברו התאמה למערכת שלנו, פירוק כל אילוץ OCL לאבני הבניין שלו והשמת המידע החוקי אל תוך בסיס נתונים סופי. הרכיב השני כולל חילוץ תכונות של כל האובייקטים הקיימים בבסיס הנתונים, כאלו שנגזרו מהמידע הגולמי ותכונות מתקדמות יותר הקשורות לעולם הגרפים ה-Embedding. למערכת תשתית ניסויית שיודעת לבצע חיזוי 3 רמות שונות של פתרון, תוך שימוש במספר גדול של פרמטרים וערכים אפשריים שונים וייצוא נתוני הניסוי לדיסק הקשיח.
|
|
תחזית ההצלחה של קמפיינים שיווקיים ברשתות חברתיות
|
סטודנטים
|
מנחים
|
תקציר
הגודל ושיעור הצמיחה של הרשתות החברתיות הוא עצום עם 4.14 מיליארד משתמשים פעילים ב- 2020. לאור משיכת המשתמשים המשמעותית של הרשתות החברתיות, מתעורר עניין רב מצד חברות וחנויות e-commerce בנוגע לשיווקן ברשתות אלה. כך, מאמצי פרסום רבים מושקעים ברשתות החברתיות על ידי חברות שונות דרך ניהול קמפיינים דיגיטליים. על מנהלי קמפיינים ברשתות אלה להתחשב בעשרות מדדי ביצוע בכל נקודת זמן ולהחליט האם קמפיין יהיה רווחי בעתיד או שלא. על בסיס החלטת מנהל הקמפיינים, מבוצעות פעולות כמו עצירת הקמפיין או הגדלת תקציבו. ישנו מספר גדול של מדדים וסטטיסטיקות (היסטוריית המכירות לדוג') שעל מנהל הקמפיינים להתחשב בהם בזמן ביצוע פעולה, דבר ההופך את המשימה הזו למאתגרת במיוחד. במחקר זה, אנו אוספים נתונים ייחודיים מקמפיינים של חנויות e-commerce אמיתיות שהופעלו ברשתות החברתיות הגדולות ביותר, פייסבוק ואינסטגרם. לאחר מכן, אנו מציעים שיטת למידת מכונה מבוססת נתונים כדי לסייע למנהלי הקמפיינים בהחלטותיהם היום-יומיות. באמצעות שימוש בשיטתנו, מנהלי קמפיינים יוכלו להגדיל את רווחיהם על ידי העלאת תקציב הקמפיינים או על ידי עצירת קמפיינים וחיסכון של הוצאות רבות.
|
|
חיזוי הצלחה של קמפייני שיווק ברשתות חברתיות
|
סטודנטים
עמית וולף
|
אוהד נווה
|
עידן אלביליה
|
|
מנחים
|
תקציר
.
|
|
מעקב וחיזוי שינויים בבחירת תכונות מקוונות
|
סטודנטים
גל אטדגי
|
רועי כהן
|
רועי ניסן
|
|
מנחים
|
תקציר
הפרויקט שלנו הינו פרויקט מחקרי העוסק במימוש אלגוריתמי OFS, אימות תוצאות האלגוריתמים, הערכתם בעזרת היפר-פרמטרים שונים וסקירת האלגוריתמים במאמר סקירה מקיף.
תחילה, מימשנו בשפת python 5 אלגוריתמי Online Feature Selection Alpha-Investing(open-source code), F-OSFS, OSFS, SAOLA, FIRES(open-source code)))
אשר נחשבים ל state-of-the-art בתחום למידת המכונה, כאשר את כל אחד מן האלגוריתמים שחזרנו מהמאמר שהציג אותו.
לאחר תהליך המימוש והשחזור של האלגוריתמים הגיע שלב האימות, כאשר עבור כל אחד מהאלגוריתמים בוצעו הרצות בתנאים דומים לתנאי המאמר, עם היפר-פרמטרים זהים ואותם .Datasets
בתהליך האימות של האלגוריתמים מטרתנו הייתה לקבל תוצאות מדדים דומות לתוצאות אשר התקבלו על ידי כותבי המאמרים בכדי שנוכל להוכיח כי האלגוריתמים אשר שחזרנו מהמאמר אכן מומשו באופן נכון ומדוייק, בדיוק כפי שהוצגו במאמר.
לאחר מכן, אחרי שביצענו בהצלחה את תהליך אימות אלגוריתמי ה,OFS עברנו לתהליך ביצוע הניסויים עבור חמשת האלגוריתמים, כאשר את תהליך זה ביצענו על 10 Time-Stamp Datasets שונים ובעזרת 4 אלגוריתמי למידת מכונה (KNN, Neural Network, Random Forest, Naive Bayes) אשר מותאמים ל Online Learning. בנוסף, ביצענו ניסויים זהים ללא אלגוריתם OFS.
תהליך ביצוע הניסויים בוצע על ידי Setup שהוגדר מראש ובו 5 גדלי חלון שונים (100,200,300,500,1000) והיפר-פרמטרים שונים עבור כל ניסוי (לדוגמא K=3/5 באלגוריתם KNN).
אלגוריתמי ה OFS הוערכו על ידי אלגוריתמי הOL אשר צויינו מעלה ותוצאות המדדים אשר התקבלו על ידי הניסויים שביצענו ונכתבו בדוחות אשר תיעדו את כלל תהליך ביצוע הניסויים ושומשו לכתיבת מאמר הסקירה המקיף.
לבסוף, לאחר ניתוח תוצאות כלל הניסויים, המסקנה הבולטת שהתקבלה הייתה כי שימוש באלגוריתם OFS הוא תלוי Dataset, כלומר, אלגוריתם OFS יכול לשפר את תוצאות הלמידה או לפגוע בהן.
|
|
כלי ויזואליזציה אינטראקטיבי לניתוח מידע ביולוגי
|
סטודנטים
מתן גדסי
|
דוד זלצמן
|
גל בורביע
|
חן ארזי
|
|
מנחים
איסנה וקסלר-לובלינסקי
|
מירב טייב-מימון
|
|
תקציר
הפרויקט שלנו הוא פרויקט פיתוח בתחום הביואינפורמטיקה, הפרויקט עוסק בוויזואליזציה וחקר נתונים ביולוגיים בדגש על נתוני מיקרו רנ"א וגנים.
המחקר של נתוני מיקרו רנ"א תופס תאוצה בשנים האחרונות בזכות טכנולוגיות חדשות המאפשרות למפות את הגנום של יצורים חיים. מיפוי הגנום יוצר כמות עצומה של נתונים שעל החוקרים הביולוגיים לחקור על מנת למצוא קשרים בין מיקרו רנ"א לבין גני המטרה שלהם. הבנה של קשרים אלו יכולה להוביל למציאת דרכי טיפול במחלות רבות, הדוגמה הבולטת ביותר לחשיבות של מיקרו רנ"א הוא החיסון לקורונה שבחלקו מבוסס על טכנולוגיה זו.
בעולם קיימות מספר מערכות לחקר של נתוני מיקרו רנ"א המאפשרות ויזואליזציה אינטראקטיבית של הנתונים לצד שימוש באלגוריתמים סטטיסטיים לחקר הנתונים. אך החיסרון המרכזי של מערכות אלו הוא שהן אינן מאפשרות טעינה במקביל של שתי מפות חום, דבר הפוגע ביכולת המשתמש להבין את הקשרים בין המפות השונות.
המערכת שלנו היא אפליקציית Web, המערכת ייחודית בכך שהיא מאפשרת טעינה של שתי מפות חום והקשרים בין מפות החום במקביל, בצורה כזו למשתמש קל יותר לראות את הקשרים בין המפות ולמצוא תובנות חדשות. המערכת עושה שימוש באלגוריתמי למידת מכונה ואלגוריתמי סטטיסטיקה על מנת למצוא תובנות בנתונים. המערכת עושה שימוש בכלי ויזואליזציה אינטראקטיביים כגון מפות חום אינטראקטיביות על מנת להציג את הנתונים בצורה ידידותית למשתמש.
|
|
מערכת לניהול מידע בנדל"ן
|
סטודנטים
דוד פדידה
|
גל עזריה
|
איתן פלטוק
|
|
מנחים
|
תקציר
מטרת המערכת הינה מתן פתרון לבעיית ניהול המידע שעובר בארגון, מטרת המערכת הינה לאפשר לסוכני נדל"ן לנהל את המידע, נכסים ולקוחות בצורה הטובה והיעילה ביותר. בעזרת פעולות אלו והעבודה לפי המטודולגיה של הלקוח שלנו, היעילות ויכולות של הסוכני נדל"ן תעלה בצורה משמעותית ובכך תייצר יותר כסף עבור המשרד.
על פי מטודולגית העבודה של הלקוח שלנו, על המערכת לתמוך בשיטת עבודה הנקראת Pipeline, ובכך בעצם לגרום לסוכני הנדל"ן לעבוד אך ורק על פי השיטה ולפי הסדר שהמנהל מגדיר להם. שיטה זו ממומשת במערכת בכך שמונעת מהסוכנים את האופציה לצאת מהעמוד עד אשר סיימו את המבוקש.
כחלק מהיכולות המערכת, מתבצעים הפקת דו"חות מתאימים אותם אפיינו יחד עם הלקוח, ובכך לאפשר לסוכן נדל"ן, מנהל משרד ומנהל חברה לעקוב אחר התקדמות, מכירות, למידה, טלפונים וכד'.
בנוסף על כך, המערכת מאפשרת ניהול משרדים וניהול סוכנים על פי מגוון הרשאות מתאימות ובכך מאפשרת למנהל לפקח ולנהל את כלל העובדים תחתיו בצורה יעילה ומדוייקת מבלי להצריך ממנו לבצע פעולות בצורה ידנית.
המערכת הינה מבוססת ענן, שרת הBackend וFrontEnd מאוחסנים בשרת EC2 AWS ושרת ה Database מאוחסן בשרת RDS AWS.
הלקוח -
7Group פתרונות נדל"ן - החברה עבורה המוצר מפותח, החברה מתמחה במתן פתרונות נדל"ן ושיווק נכסים. החברה מונה כ-20 מתווכים ויועצי נדל"ן.
עו"ד ויקטור שמואל - לקוח המוצר ובעלים חברת 7Group.
|
|
הזלגת מידע באמצעות מקלדות מוארות
|
סטודנטים
|
מנחים
|
תקציר
התקפות סייבר מהוות איום גדול עבור קהילת אבטחת המידע. ממשלות ותאגידים משקיעים מאמץ רב בכדי לאבטח ולהגן על הנתונים שלהם מתקיפות זדוניות.
התקפות ערוץ צד צדדי מתמקדות בערוצי תקשורת שלא נועדו להעביר נתונים. באופן זה, להתקפות ערוץ צד צדדי קיים הפוטנציאל להזליג נתונים ממחשבים דרך ערוצי תקשורת שאינם סטנדרטיים. אחד הסוגים של התקפת ערוץ צד שאנו מציגים בפרויקט הגמר שלנו הוא התקפת ערוץ אופטי המשתמשת באור.
בפרויקט המדעי שלנו, "WeKeyLeaks", אנו עוסקים בתחום הסייבר ומדגימים את האפשרות להעביר ולהזליג נתונים בערוץ צד אופטי. על ידי שימוש במקלדת צבעונית ובמצלמה טלפון נייד סטנדרטית, הפרויקט מספק הוכחת היתכנות כי ניתן להעביר / להזליג כמות גדולה של נתונים על ידי שימוש במקלדות צבעונית פוטנציאליות.
במודל התקיפה שלנו, ההנחה הבסיסית היא שבמחשב הקורבן יש תוכנה זדונית שיכולה למצוא נתונים רגישים ולשלוט באורות של מקלדת צבעונית.
המודל מבוסס על שני מודולים עיקריים. הראשון הוא מקלדת צבעונית המשמשת להעברת נתונים או להזלגתם, והשני הוא מצלמה סטנדרטית המשמשת לקליטת הנתונים באמצעות עיבוד תמונה.
במסקנותינו מצאנו שמדד עוצמת החשיפה לאור (lux) הכי אופטימלי להעברת נתונים במדויק בממוצע הוא 500 lux. בעוצמת חשיפה לאור זו הצלחנו להגיע לדיוק (accuracy) של עד 100% ליותר מ -130 תווים בפרק זמן סביר.
|
|
תקשורת מוטה: מעקב ומדידת הטיות של רשתות תקשורת שונות
|
סטודנטים
|
מנחים
|
תקציר
קיומה של הטייה בסיקור התקשורתי נראה אולי ברור מאליו לציבור הרחב, אך סוגיה זו מעסיקה מזה שנים רבות חוקרים בתחומי מדעי החברה ומדעי המחשב. במחקר זה אני מראה כי בהינתן אירוע המסוקר על ידי כלי תקשורת בעלי נטייה פוליטית שונה, בפרט שמרניים וליברליים, טון הסיקור ומיקודו נמצא בהלימה לנושאים, לאנשים ולישויות (TPE) בעלי זיקה להשקפתם הפוליטית של כלי התקשורת. אימנתי רשת נוירונים עמוקה על מאגר כתבות חדשותיות שפורסמו במהלך שנתיים במטרה לחזות אילו היבטים באירועים חדשותיים יודגשו על ידי הליברלים והשמרנים. השתמשתי במודל זה על מנת לחזות את מאפייני הסיקור שלהם בעשרה נושאים שנויים במחלוקת. יתר על כן, באמצעות נתונים מדומים, אני מזהה את TPEs אשר ממזערים ומעצימים את הקיטוב בין ליברלים לשמרנים. בנוסף, אני מציע שימוש ב-Autoencoder, כשיטה לחיזוי שינויים בהצגת אירוע, על מנת לחזות את הדרך שבה אירוע יסוקר בכל בעיניי אלה המחזיקים בהשקפה פוליטית מסוימת.
בעוד שרוב העבודות הקודמות בתחום התמקדו בחיזוי סנטימנט של מאמר או הסתפקו בזיהוי טקסונומיה מוטית, בעבודה שלי אני מציע גישה אשר מהווה מדד ישיר יותר לנטיית תקשורת המתחשבת במאפייני הכתבות. לצורך ביצוע משימות אלה, שפע של מאמרים מתוך מאגר המידע GDELT מנוצלים על ידי ניטור כתבות מ-25 מקורות מדיה שונים.
|
|
שירותי יעוץ השקעות דיגיטלי
|
סטודנטים
נועה גורנגוט
|
עומר שלמה
|
ישראל אביאל פדידה
|
מורן צרי
|
|
מנחים
|
תקציר
בשנים האחרונות יש זינוק במספר הגופים המספקים שירותי יעוץ השקעות דיגיטלי ובסכומי הכסף המנוהלים באמצעות שירות זה. על פי התחזיות, זינוק זה צפוי להמשיך לעלות בשנים הבאות. אולם, אנשים רבים עדיין חוששים להיכנס לעולם ההשקעות, כיוון שהם חסרי ידע בנושא וכן קיים חשש מעלויות השונות הכרוכות בבנייה וניהול תיק ההשקעות.
ישנן הגדרות רבות ל-Robo Advisor , בצורה פשוטה, מדובר על שיטה לאוטומציה של הקצאת הנכסים באמצעות אלגוריתם ממוחשב. בעזרת כלים אוטומטים ניתן להציע דרכי השקעה, לנהל את הכסף המושקע, לאזן את תיק ההשקעות ולייצר תמהיל נכון ומותאם לרמת הסיכון של הלקוח. שימוש בטכנולוגיה הוא דבר חיובי בכל שוק תחרותי. בשימוש טכנולוגי ניתן להפחית משמעותית עלויות כגון : דמי ניהול, עמלות מסחר ועמלות שוטפות, כל זה תוך יצירת תיק, אשר בתקווה מותאם ללקוח.
בפרויקט זה בנינו מערכת Robo advisor, פלטפורמה לבניית תיקי השקעות המשתמשת באלגוריתמים שונים על מנת לבנות ללקוח תיק השקעות המותאם לצרכיו ולאופיו. באמצעות שאלון ייעודי, המערכת תגדיר פרופיל סיכון תואם ללקוח ובאמצעות שימוש באלגוריתמים שונים שנבחרו, המערכת תציג ללקוח את תיק ההשקעות המותאם עבורו.
בנוסף, על מנת לסייע במתן מידע עבור משקיעים פוטנציאליים, בנינו מרכז מידע, אשר מנגיש מידע על תחום ההשקעות עבור הקהל הרחב. כמו כן, בנינו פורום שבו המשתמשים יכולים לדון בתוצאות שקיבלו מהמערכת ולחלוק ידע נוסף.
|
|
ויזואליזציות לשיפור הנגשת תמצות טקסט
|
סטודנטים
יסמין אברהם
|
רותם מיארה
|
מיטל יניב
|
רומן גריג
|
|
מנחים
|
תקציר
הפרויקט שלנו הוא חלק ממחקר לתמצות טקסט הנערך באוניברסיטה. שאלת המחקר שלנו היא באיזה ויזואליזציה הכי כדאי להציג את סיכום הטקסט כך שהסיכום יעזור בצורה הטובה ביותר למשתמש. אנו טוענים כי הצגת הסיכום באופן קריא ונח למשתמש תעזור לו להפיק את המירב ולחסוך זמן יקר. המטרה הסופית היא למנף את נגישות הטקסט באמצעות שיטות הדגשה שונות להצגת סיכומי הטקסט.
אנו נחקור את ההשפעה של טכניקות הדגשה על האפקטיביות, היעילות ושביעות רצון המשתמשים - טכניקות המוצעות בספרות: גודל פונט והדגשת טקסט וכן טכניקות הדגשה נוספות שפיתחנו בפרויקט זה: הגדלת כתב באופן הדרגתי והדגשת רקע באופן הדרגתי. השפעת טכניקות ההדגשה תבחן הן בהשוואה להצגת הטקסט המקורי ללא תמצות או הדגשה ובהשוואה להצגת הסיכום בלבד. לאחר סקירה החלטנו להשתמש במודל Bert, אלגוריתם זה מדרג את המשפטים לפי חשיבותם בטקסט.
על מנת לענות על שאלת המחקר נערוך ניסוי בו נציג לנבדק טקסטים בויזואליזציות שונות ומיד לאחר קריאת כל טקסט הנבדק יתמצת אותו ויענה על שאלות הבנה. עבור כל נבדק נמדוד זמנים לכל פעולה, ואת התשובות הנכונות, נבחן את מידת ההתאמה של התמצות שכתב לתמצות הBert ולבסוף ננתח את התוצאות שהתקבלו ונסיק מסקנות בהתאם.
כדי שנוכל לערוך את הניסוי בצורה הטובה והמסודרת ביותר פיתחנו מערכת לתכנון וביצוע הניסוי. המערכת מאפשרת לבוחן ליצור ולערוך את הניסוי ולנבחן לבצע אותו. הבוחן יכול לתכנן מבחנים לניסוי- בחירת טקסטים, בחירת ויזואליזציות ובחירה באופן רנדומלי. בנוסף, הוא יוכל לצפות בתוצאות המבחנים שבנה ולהוריד אותם למחשבו. הנבחן יוכל לענות על מבחנים שיצר הבוחן. הוא מקבל טקסטים ושאלות ולאחר מענה על כולם מדרג איזו ויזואליזציה הייתה הכי נוחה ויעילה עבורו.
|
|
CAPI - זיהוי רגשות
|
סטודנטים
יובל חורם-יאן
|
רון זיידמן
|
הוד טויטו
|
שהם צרפתי
|
|
מנחים
|
תקציר
בפרויקט זה, חקרנו את האפשרויות של חיזוי רגשות המשתמש על בסיס שיטות שונות של למידת מכונה. במהלך המחקר שלנו הסתכלנו על מחקרים קודמים שהציעו גישות שונות לפתרון בעיה זו, למשל על ידי הסתכלות על מידע מהמקלדת, מהעכבר, מהמצלמה וכן גישות יותר חודרניות כגון לחץ דם, דופק או גלים חשמליים במוח.
על מנת להשיג את המידע הדרוש, יצרנו שתי חבילות תוכנה: יצרנו ספרייה שאוספת את המידע בערוצים שונים, כאשר ערוצי ברירת המחדל הנתונים בספרייה הם המקלדת, העכבר והמצלמה. נוסף על כך, יצרנו ממשק משתמש שמבוסס על הספרייה שיצרנו על מנת לאסוף את המידע מהמשתמש ולתייג את אותו המידע ברגש. נתנו את תוכנת הממשק לקבוצה של נסיינים על מנת לאסוף מהם מידע בערוצים השונים. לאחר מכן, ניתחנו את המידע שאספנו ובנינו מספר מודלים שיכולים לחזות את רגשות המשתמש, וכן את רמת חיוביותו של המשתמש ברמות דיוק שונות. כמו שציפינו, המודלים אשר הסתמכו על המידע מהבעות הפנים הניבו את התוצאות הטובות ביותר, ומודלים אשר הסתמכו על המידע מהמקלדת והעכבר השיגו תוצאות פחותות מכך אך עדיין אלו תוצאות דומות למחקרים הקודמים שסקרנו אשר ניסו דרכים דומות, ואף מתעלות על חלק מהם. כמו כן, לאחר סקירה של הגדרת הרגשות, ניסינו לחזות גם מימדים שונים ומתמשכים של רגשות חוץ מרגשות קטגוריים. מימדים אלה מתארים תמונה יותר מפורטת של רגש המשתמש, שגם פותחת אפיק להמשך מחקר בעניין. במהלך יצירת המודלים, אימנו אותם על ייצוגים שונים של הרגש, השתמשנו במודלים המורכבים מכמה מודלים, וגם ניסינו שימוש של ערוצים שונים ביחד.
|
|
מציאת תבניות חוזרות בסדרת נתונים על צריכה חשמלית
|
סטודנטים
|
מנחים
|
תקציר
במחקר זה אנו בונים אלגוריתם שיכול לזהות תבניות חוזרות בסדרת נתונים מבוססי זמן. על ידי מוניטורים חכמים אשר מותקנים ב-129 בתים שונים בישראל אנו מנטרים .את הצריכה החשמלית הכוללת שלהם בכל דקה נתונה מרגע התקנתם
תחום זה נקרא בספרות - ניתוח צריכה חשמלית בצורה לא פולשנית, כלומר אנו רואים את כלל הצריכה החשמלית של הבית ומנסים לשייך את הערכים הנראים אל מכשירים חשמליים שונים לפי מאפיינים אותם אנו מזהים באותם מכשירים.
למחקר זה יש השפעה על התחום של התייעלות אנרגטית, תחום חשוב בתקופה בה אנו נמצאים. מציאת כמויות הצריכה של מכשירים שונים ותדירות הפעלתם על ידי מוניטור יחיד המותקן בבית יתרום רבות לידע שיוביל את מקבלי ההחלטות בתחום האנרגיה ואף יכול להפחית צריכה חשמלית למשתמש הקצה.
|
|
שיפור איכות תמונות מקרוסקופיות בעזרת למידה עמוקה -ZSSR
|
סטודנטים
ליאור ברוכוביץ
|
דור אלקבץ
|
צליל פוליאק
|
|
מנחים
|
תקציר
תהליך יצירת תמונות מיקרוסקופיות הינו תהליך מורכב המצריך התחשבות בתמורות שונות הפוגעות באיכות התמונה ובאיכות הדגימה ובדרך גם באיכות המחקר. בשביל לפתור בעיה זו, יש ניסיון בעולם הביולוגי לנסות ולשפר תמונות בצורה ממוחשבת ובכך לצמצם את הצורך להתחשב בכלל הפקטורים שפוגעים באיכות התמונה והדגימה. עם זאת, המודלים שפותחו עד כה לשיפור תמונות מיקרוסקופיות מצריכות סטי אימון נרחבים של תמונות מיקרוסקופיות באיכות גבוהה, דבר שיכול לעלות לחוקרים במשאבים רבים. בשביל לפתור בעיה זו ניסינו להוכיח את יעילותו ולהשמיש את אלגוריתם ZSSR- ZERO SHOT SUPER RESOLUTION עבור תמונות מיקרוסקופיות, אלגוריתם אשר נועד במקור לשיפור תמונות טבעיות ויוצר מודלים לשיפור תמונות טבעיות ומאומן בעזרת פאצ'ים שנוצרים מהתמונה המקורית, מה שמייתר את הצורך ביצירת סט אימון מראש. במסגרת המחקר שלנו, מצאנו את השיטה היעילה ביותר לשיפור תמונות מיקרוסקופיות בעזרת ZSSR ובנוסף הראנו בעזרת שיטת הניסויים שלנו כי האלגוריתם יעיל ובר השוואה לאלגוריתמים STOA אחרים כאשר מעמידים אותם בפני אותם תנאים.
|
|
זיהוי והעדפת תמונות
|
סטודנטים
ירדן לוי
|
לירון בן יעקב
|
שיר בן דור
|
טלי שוורץ
|
|
מנחים
|
תקציר
אומרים ש-"תמונה אחת שווה אלף מילים", אז כמה "שווה" תמונה יפה? האם לאנשים שונים יש העדפות דומות לגבי תמונות יפות? האם אנשים עקביים בהערכות היופי שלהם?
מטרתו של פרויקט זה הינה לפתח תשתית סגורה שתאפשר הרצת ניסוי רחב בנושאי המחקר שצוינו לעיל. באופן ספציפי, הפרויקט מיועד לסייע לחוקרים המעוניינים לחקור את ההעדפות האישיות של משתמשים לגבי האסתטיות של תמונות ואת העקביות של ההעדפות הללו.
המערכת שאנו מפתחות במסגרת הפרויקט תכלול בסיס נתונים של מאות תמונות יפות (שנלקחו מאתרי צילום ציבוריים) ותשמש פלטפורמה לשני סוגים מרכזיים של משחקים:
1. עקביות העדפות אישיות. בשלב הראשון, המשתמשים יירשמו למערכת ויתבקשו להעריך לפחות 60 תמונות, שנלקחו מאתרי צילום מקצועיים, באמצעות סולם העדפות בן 10 שלבים. בשלב השני (שלב המשחק), יידגמו תמונות באופן רנדומלי מתוך התמונות שהמשתמש ראה בשלב הראשון, והוא יצטרך לזהות מתוכן את התמונות שקיבלו את ציוני ההעדפות הגבוהים ביותר בשלב הראשון. המשתמשים יקבלו ניקוד בהתאם לביצועיהם במשחק.
2. זיהוי העדפות של משתמשים אחרים. זהו משחק למתקדמים. מטרתו לבדוק האם משתמש רגיל יכול לנחש את ההעדפות האישיות של משתמשים אחרים. כך נוכל לבדוק האם תמונות אשר מועדפות על ידי אדם אחד, מועדפות גם על ידי אנשים אחרים. בכך, ניתן לבדוק האם קיימות תמונות "אידאליות" שמועדפות באופן אוניברסלי.
חשוב לציין כי הרצת הניסוי עם נבדקים אמיתיים הינה חלק מהדרישות וכי אנו מצפים להגיע ליותר מ-100 נבדקים מאוכלוסיות שונות. ניתוח התוצאות ייעשה גם על ידי שימוש באלגוריתמים של למידת מכונה כמו בניית אשכולות של משתמשים על פי ההעדפות האסתטיות שלהם.
|
|
הערכת החסינות של מערכות בינה מלאכותית לזיהוי הונאות
|
סטודנטים
|
מנחים
|
תקציר
בשנים האחרונות, מערכות לגילוי הונאות פיננסיות (FDS) הפכו יעילות מאוד באיתור הונאות מסוג זה. זה כולל אלגוריתמים מבוססי למידת מכונה כגון KNN, SVM ורגרסיה לינארית, שיטות למידה עמוקה כגון רשתות עצביות עמוקות (DNN) או מודלי Autoencoders לזיהוי אנומליות, ואפילו שיטות מסוריתיות מבוססות חוקים. מודלים אלה נועדו לאתר פעילות פיננסית חריגה ולדווח על ההונאות למפעיל (למשל, חברת כרטיסי אשראי, בנק או רשות מדינית).
כתוצאה מכך, תוקפים מתמודדים עם סיכון משמעותי להתגלות על ידי אלגוריתמי זיהוי הונאות שכאלו. הדבר מעלה את הצורך של התוקף לבחור את קורבנותיו בחוכמה: התוקף היה רוצה להתמקד בקורבנות הפגיעים ביותר מבחינת סיכון ורווח. לצורך מטרה זו, תוקף יכול להסתייע ב- Adversarial Machine Learning כדי לנתח את דפוסי ההתנהגות של הקורבנות שלה ולהסיק דירוג נסתר של קורבנותיו.
במחקר זה אנו בוחנים את היישום של טכניקות דירוג מבוססות-יריב על תחום גילוי הונאות. לשם כך אנו מזהים את האתגרים העיקריים ומפתחים גישה חדשה לדירוג שחקנים פיננסיים על סמך רגישותם להתקפות. באמצעות מאגר נתונים פרטי של חנות אינטרנט, אנו מעריכים את הפגיעות של משתמשים בעולם האמיתי להונאות פיננסיות ולבסוף אנו מציגים גישה מבוססת ML לחיזוי דירוג שכזה. כלי זה, כאשר הוא עומד לרשותו של תוקף, משרטט לתוקף את "דרך המלך" - הוא מאפשר לו למזער את הסיכון תוך הגדלת הרווח שלו על ידי תקיפת חשבונות פגיעים להונאות ("highly “fraudable), תוך הימנעות מקורבנות חסינים מפני הונאה (lest “fraudable”). הממצאים שאנו מציגים במחקר זה הם בעלי ערך רב גם למגן: על ידי לימוד הדירוג הנסתר, הצד המגן (כלומר, חברה פיננסית) עשוי לתת הגנה נוספת על משתמשים פגיעים יותר בצורה של 2FA, ניתוח של מומחה אנושי או סף זיהוי (threshold) נמוך יותר.
|
|
קנבסקאש
|
סטודנטים
|
מנחים
|
תקציר
דפדפני אינטרנט כמו פיירפוקס הם יישומי תוכנה לגישה לאינטרנט העולמי. כאשר משתמש מבקש דף אינטרנט באתר מסוים,דפדפן האינטרנט מאחזר את התוכן הדרוש משרת אינטרנט, מעבד אותו בעיקר באמצעות HTML ואז מציג את הדף במכשיר המשתמש.
כדי לחשב ולעבד את הדפים שהושגו מהאינטרנט בצורה המהירה ביותר, רוב המחשבים המוחלט של ימינו נוטים להשתמש ביחידות זיכרון קטנות ומהירות הנקראות מטמון. במחקר זה אנו משתמשים בערוץ צדדי דרך הרמה האחורנה של זיכרון המטמון במעבדי אינטל כדי ליישם התקפת גניבת פיקסל על דפדפן האינטרנט פיירפוקס. כדי לבנות התקפה זו היינו צריכים למצוא את נתיב הביצוע שיגרום לפעילות מטמון שונה בהתבסס על צבע מסך הקורבן, ולמצוא דרך לזהות ביעילות פעילות זו בין כל מערכי המטמון בזמן החישוב.
כדי להוכיח את עוצמת ההתקפה שלנו, אנו מיישמים אותה על ארבעה מחשבים שונים עם מעבדי אינטל מדור שונה, גונבים פיקסלים במגוון מהירויות ומראים כיצד אנו יכולים להשתמש בגניבת פיקסל כדי לקבל תמונות שחזור מלאות של דמויות וטקסט מורכבים בנוסף לביצוע גניבת היסטוריה במהירות גבוהה.
לבסוף, אנו מבצעים גילוי אחראי למתקנים המתאימים.
|
|
מציאת טביעת אצבע דרך מיקרו-ארכיטקטורת המחשב
|
סטודנטים
|
מנחים
|
תקציר
בשנים האחרונות, חוקרים גילו מספר שיטות לזיהוי מחשבים. מחקרים שואפים להשתמש בכל היבט ורכיב במחשב כדי ליצור טביעת אצבע יציבה, חזקה ומדויקת יותר. דוגמאות למקורות טביעת אצבע כוללות תצורות תוכנה שונות והגדרות רשת. בין הטכניקות השונות שהוצגו עד היום, אין טכניקה המשתמשת ישירות ברכיבי המעבד להפקת טביעת אצבע. מחקר זה מדגים דרך להשתמש בהבדלים קלים בייצור חומרה ברכיבים המיקרו-ארכיטקטורים של המעבד כדי לייצר טביעת אצבע, מה שמאפשר להבחין בין מכשירים עם רכיבי תוכנה וחומרה זהים. טביעת האצבע מסתמכת על קונספט ה-PUF. באופן ספציפי, אנו מסתמכים על מאפיין מעבד מיקרו-ארכיטקטוני המכונה port contention, אשר מופעל על ידי יצירת מרוץ בין מיקרו פעולות המשתמשות באותה יציאה באותה ליבה פיזית כאשר אפשרות ה-Hyper-Threading מופעלת. כדי לבצע את המחקר שלנו, נתכנן תחילה אלגוריתם שמסווג מספר קטן של מכשירים, אז נרחיב אותו למאגר מידע גדול יותר ונשפר את הדיוק על ידי שימוש בלמידה עמוקה ולבסוף נמצא דרך להריץ את השיטה מרחוק ב- JavaScript במקום מקוד הנמצא על המחשב.
|
|
מדידת קשרים מרחביים בין אברונים בתא באמצעות רשתות ניורונים ג'נרטיביות לטובת סריקת תרופות בתפוקה גבוהה
|
סטודנטים
|
מנחים
|
תקציר
תאים הם יחידת המבנה והתפקוד הבסיסית של כל האורגניזמים. אברונים תאיים הם המכונות המולקולריות המגדירות את ארכיטקטורת התאים. שיבוש בארגון התאים הנקבע על ידי הרכב האברונים של התא בחלל וארגון אברונים-אברונים לא תקין מוביל לפגיעה בתפקוד התאים במחלות רבות. לפיכך, גילוי תרופות המחזירות את מבנה התא וארגונו למצבו "הבריא" הוא שלב ראשוני בדרכי גילוי תרופות מסוימות. סינון מבוסס-תמונה מתגלה כטכנולוגיה עוצמתית לזיהוי הבדלים פנוטיפיים באוכלוסיות תאים עם מספר יישומים כולל סינון תרופות. בעוד שגישות חישוביות עכשוויות מאגדות תכונות מבוססות תמונה משיטות שונות, כל אחת מאברון בודד, אני מפתח מתודולוגיה חדשה למדידת שינויים בתלות המרחבית בין אברונים שונים ולהחיל אותה על מנת לזהות טיפולים חדשים המפריעים לתלות מרחבית ספציפית בין אברונים. המתודולוגיה מתבססת על מדידת שגיאת השחזור של רשתות נוירונים יוצרות הממפות את השיטות השונות זו לזו. תוצאות ראשוניות מצביעות על כך שגישה זו רגישה יותר, ספציפית ומשלימה יותר ביחס למצב כיום. באופן כללי, המתודולוגיה תאפשר גילוי ופירוש מכניסטי של ההשפעות שיש לכל טיפול על היבטים ספציפיים של ארגון התאים במונחים של "שבירת" היחסים הקיימים בין מבני תאים מרובים, שאינם נגישים כיום.
|
|
עמידות של מודלי למידת חיזוק עמוקה כנגד מתקפות.
|
סטודנטים
|
מנחים
|
תקציר
אלגוריתמי למידה עמוקה ובפרט אלגוריתמי למידת חיזוק עמוקה נהיו פופולאריים מאוד בשנים האחרונות ומהווים סטנדרט במגוון תחומים. אולם, אלגוריתמים אלו חשופים לרעשים ומתקפות אדוורסריות. שיפור העמידות של אלגוריתמי למידת חיזוק עמוקה כנגד מתקפות אלו חשוב במיוחד בסביבות בהן הבטיחות חשובה שכן אפילו שינוי קטן בהתנהגות הסוכן בסביבות אלו עלול לגרום לנזק רב. במחקר זה התמקדנו בשיפור עמידות אלגוריתמי למידת חיזוק עמוקה באמצעות שימוש ברווחי סמך. העבודה שלנו מתמקדת בהתאמה של אלגוריתם בשם PIVEN , אשר מייצר רווחי סמך לבעיות רגרסיה, לבעיות של למידה מבוססת חיזוקים בסביבה רועשת בעוצמות משתנות. אנו משלבים את PIVEN בארכיטקטורות למידת חיזוק עמוקה קיימות (DQN) וחוקרים את הביצועים של המודל בסביבה רועשת. בנוסף אנו בודקים ארכיטקטורות ודרכי אימון שונים אשר יאפשרו לאלגוריתמי למידת חיזוק עמוקה לנצל את רווחי הסמך של אלגוריתם PIVEN בצורה אופטימלית. הניסויים שלנו, שהתבצעו על בעיית CartPole, מראים שהגישה שלנו לשילוב PIVEN בארכיטקטורות של למידת חוזק עמוקה מצליחה לשמור על ביצועים זהים לאלגוריתם DQN רגיל בסביבה ללא רעשים. כאשר מוסיפים למערכת רעש השיטה שלנו משפרת את הביצועים של אלגוריתמי למידת חיזוק סטנדרטים.
|
|
שימוש בתכנות גנטי ליצירת קוד התנהגותי
|
סטודנטים
|
מנחים
|
תקציר
מאז שתכנות גנטי הוצג לראשונה על ידי ג'ון ר. קוזה בשנת 1992, נעשה מספר רב של מחקרים המשתמשים בתכנות גנטי כדי לייצר קוד בצורה אוטומטית. למרות המימושים והשיפורים השונים שהוצעו, כגון להשתמש ב-AST ולעשות אבולוציה ל-bytecode וכו'. ההצלחה בתחום הייתה מוגבלת, וחוקרים הצליחו לייצר רק תוכנות קטנות של לכל היותר 200 שורות קוד.
ישנן מספר סיבות לקושי בהתקדמות התחום, כגון מרחב החיפוש העצום של תוכנות אפשריות, תחביר מסובך של שפות תכנות מודרניות והקושי להעריך ולבדוק את הקוד הנוצר.
כדי להתמודד עם קשיים אלו, אני מציעים להשתמש בתכנות גנטי בשילוב עם תכנות התנהגותי - פרדיגמת תכנות עם תכונות מיוחדות המאפשרות להתגבר על הקשיים שצוינו לעיל.
תכנות התנהגותי ממדל תוכנות כאוסף של חוקים ודרישות של המערכת, כאשר כל תהליכון אחראי על התנהגות מסויימת. תהליכונים יכולים לבקש, לחסום, או לחכות עבר אירועים מסויימים וישנו מסנכרן מרכזי אשר מסנכרן בין התהליכונים. הפשטות של הפרדיגמה, בנוסף לתחביר הפשוט, האפשרות להשתמש ב-validation כדי לבדוק את התוכנות, והעובדה שהתוכניות בנויה מחלקים קטנים ובלת-תלויים, מאפשרת לנו לייצר תוכניות התנהגותיות בצורה אפקטיבית באמצעות תכנות גנטי.
|
|
למידת מדדי מרכזיות על גרפים
|
סטודנטים
|
מנחים
|
תקציר
בתחום הגרפים והרשתות המורכבות יש שימוש במדדי מרכזיות כדי לזהות את הקודקודים הכי חשובים בגרף. האפליקציות של מדדי מרכזיות כוללות שליטה ובקרה על תעבורה ברשתות תקשורת, מציאת האנשים המשפיעים ביותר ברשתות חברתיות ובעולם הסייבר ניתן לזהות באמצעותם בוטים ברשת.
אחת הבעיות העיקריות עם מדדי מרכזיות היא שהם לא גמישים, כלומר מדדי מרכזיות מסוימים מתאימים לגרף עם מבנה מאוד מסוים. עבור הרבה מאוד גרפים מדד מרכזיות ספציפי לא יכול לתאר באופן נאמן את החשיבות האמית של כל קודקוד, ולכן יש צורך במדדים חדשים שיתארו את הגרף.
במחקר זה אנו מציעים מודל שלומד מדדי מרכזיות חדשים על גרפים. המודל שלנו מבוסס על עבודת העבר של Routing Betweenness Centrality שמראה באופן תיאורטי כיצד ניתן ללמוד מדדי מרכזיות חדשים על גרפים, ועל טכניקות של למידת מכונה ולמידה עמוקה כדי לממש את הלמידה בפועל.
לשם הערכת הביצועים של המודל נעשה שימוש במדדי קורלציות כמו Kendall, Pearson, Spearman אשר מודדים קורלציות בין 2 וקטורים כאשר המטרה היא להשיג ניקוד השואף ל 1. במחקר אנחנו משתמשים במדדים כדי למדוד קורלציה בין וקטור המרכזיות החזוי לווקטור המרכזיות האמיתי.
|
|
הקצאת משאבים מוכוונת סיכון בלהק של כלים רובוטים
|
סטודנטים
|
מנחים
|
תקציר
השימוש בלהק רובוטי במשימות צבאיות ואזרחיות שונות הפך להיות פופולארי מאוד. במהלך משימה, חברי הלהק דורשים גישה למשאבים שונים (הן משאבי נתונים והן משאבי יכולות) כדי לבצע ביעילות את משימותיהם. משאבים אלה עשויים להיות בעלי רמות שונות של רגישות, וחלקם עשויים להיות מסווגים ביותר ויש צורך להגן עליהם. מכיוון שרמת הסיכון של כל חבר בלהק עשויה להשתנות במהלך המשימה, ההחלטה כיצד לפרוס את המשאבים בקרב הכלים היא קריטית. במחקר זה אנו מציגים מערכת חדשנית להקצאת משאבים בין חברי הלהק כך ששלוש מטרות עיקריות יושגו: (1) כל כלי יכול לגשת למשאבים הדרושים לו כדי לבצע את משימותיו (גישה באופן מקומי או מרחוק למשאב), (2) הסיכון הכולל למשאבים במהלך המשימה ממוזער, ו (3) ניתן להקצות מחדש את המשאבים במהלך המשימה בתגובה לשינויים ברמת הסיכון של חברי הלהק. ביצענו הערכה עבור הקצאת המשאבים הראשונית שמספקת המערכת במקרים שונים והראינו שהיא עולה על גישת הקצאת משאבים בסיסית מבחינת הסיכון של המשימה. ביצענו הערכה גם עבור היוריסטיקות דינמיות ויעילות והראינו שהן עוזרות לשמור על סיכון משימה נמוך לאחר הקצאה חדשה בעקבות שינויים ברמת הסיכון של חברי הלהק.
|
|
חיזוי הפגנה ע"י רשתות חברתיות
|
סטודנטים
|
מנחים
|
תקציר
הפגנה זוהי זכות אזרחית של חופש הביטוי והתארגנות, המשמשת קבוצה של אנשים כאמצעי להביע באופן פומבי את דעתם ובפרט את מחאתם בנושא מסויים, הפגנות עלולות לשבש את תנועת הרכבים הסדורה בכביש ויתרה מכך לכלול אלימות ונזק סביבתי, על כן חיזוי מוקדם של אירועי מחאה יסייע לרשויות בנקיטת צעדים מוקדמים לדיכוי האנרכיה ושמירה על הסדר וביטחון התושבים. מחקרים הראו כי הרשתות החברתיות משמשות ככלי משמעותי להעברת מידע, לגיוס אנשים והתארגנות למחאה. כמו כן קיים קשר בין אירועים חריגים ומעוררי המחלוקת שהתרחשו לקיום אירוע מחאה. בעקבות התיאוריה הרבה בתחום במהלך יותר מעשור הוצגו גישות שונות מבוססות למידה לחיזוי הפגנות הכוללות שימוש בניתוח מבנה התפשטות המידע ברשתות חברתיות, ניתוח פוסטים בכלי NLP ידועים כגון:ניתוח רגשות. וכן שימוש במאגר מידע המכיל אירועים משמעותיים (GDELT). במחקר שלנו אנו נתמקד בשלוש תקופות בהן התרחשו הפגנות רבות בארה"ב ונרצה לחזות אותן מספר ימים מראש, לצורך כך אנו משתמשים באוסף נרחב של ציוצים מטוויטר מתקופת הזמן בהם אירעו האירועים. השיטה שאנחנו נרצה להציע היא שיטה חדשנית אשר מכילה בתוכה מספר רבדים. ראשית, הערכת כמות המפגינים הפוטנציאלים בכל יום, ע"י ניתוח התוכן שפירסם כל משתמש. שנית, הוצאת רגשות וסמנטיקה מהציוצים, כאשר נשתמש בשיטה שפיתחנו המבוססת על tf-idf, למישקול הציוצים. ולבסוף נשתשמש בשיטות שתיארנו, כפיצרים למודל אשר יציג לנו חיזוי לאירוע הפגנה.
|
|
מידול אינטרפטבילי של מערכות המלצה מודעות להקשר באמצעות אלגוריתמים אבולוציונים
|
סטודנטים
|
מנחים
|
תקציר
מערכות המלצה מודעות להקשר משתמשות בהקשר של המשתמשים כדי לספק שירותים מותאמים אישית. מידע על ההקשר של המשתמשים יכול להילקח מחיישנים כדי לשפר את איכות ודיוק ההמלצה. בעבודה הזו, אנו מתמקדים במערכות המלצה מודעות להקשר עם הקשר ממימדיות גבוהה, דבר אשר משפיע על מודל ההמלצה, לדוגמה ע"י הגדלת המימדיות של המודל והדלילות במידע. יצירת מודל אשר נותן המלצות מדויקות אינו מספק בשביל יצירת מודל שימושי מנקודת המבט של המשתמש, מכיוון שחלק מהמידע ההקשרי שנעשה בו שימוש עלול להיות בעייתי, לדוגמה ניצול רב של בטריה, בעיות פרטיות ועוד.
מחקרים קודמים מציעים לצמצם את את המידע ההקשרי שנעשה בו שימוש במודל ע"י שימוש במומחה תחום כדי לבחור את המידע הנחוץ ביותר. הגישה הזו אפקטיבית רק כאשר סט המידע ההקשרי מספיק קטן לבחינה ידנית ומספיק עשיר כדי למנוע דלילות של מידע.
בעבודה הזו, אנו מציגים גישה רב שלבית לבחירה של תתי קבוצות של מידע הקשרי ושילובו במערכות המלצה מודעות להקשר. בלב הגישה שלנו נמצא אלגוריתם חדש לבחירת מאפיינים המבוסס על אלגוריתמים גנטיים, אשר משיג ביצועים טובים יותר מגישות מובילות לצמצום מימדיות במערכות המלצה מודעות להקשר, ע"י שיפור דיוק ההמלצה והיכולת לפירוש המאפיינים שנעשה בהם שימוש. במהלך האבולוציה, אלפי תת קבוצות ייחודיות נוצרות; מודל עמוק מודע להקשר נוצר עבור כל המאפיינים הנבחרים והמודלים הנוצרים משולבים יחדיו במודל אנסמבל. המודל אנסמבל שנוצר הוא מדויק ומשתמש אך ורק במאפיינים מפורשים הניתנים לפירוש. הגישה שלנו מכילה גם יכולת לכוונן את המרכיבים השונים באלגוריתם המשפיעים על המשתמש, לדוגמה צריכת בטריה ופרטיות.
הערכנו את הגישה שלנו על שני מערכי נתונים אשר מכילים מידע הקשרי רב מימדי אשר נלקח מחיישנים פלאפונים. ניתוח אמפירי של התוצאות מאשר שהשיטה המוצעות שלנו משיגה תוצאות טובות יותר מאשר מודלים מובילים בתחום של מערכות המלצה מודעות להקשר, בנוסף לשיפור הפירוש של המאפיינים אשר נלקחים בחשבון במודל הסופי. בנוסף לתוצאות האמפיריות, אנו מציגים מספר תרחישים, דוגמאות ומתודולוגיות בנוגע לאיך חוקרים ומומחי תחום יכולים לכוונן את אלגוריתם בחירת המאפיינים שלנו לשיפור צרכיו של המשתמש ואת היכולת לפרש את המאפיינים הנלקחים בחשבון.
|
|
ניתוח התנהגות עובדי בריאות הציבור ברשתות חברתיות בזמן מגפת הקורונה
|
סטודנטים
|
מנחים
|
תקציר
מגפת הקורונה השפיעה על אוכלוסיות רבות ברחבי העולם, עם השלכות בריאותיות, כלכליות, חברתיות ופוליטיות קיצוניות. אנשי מקצוע במערכת הבריאות נמצאים בבסיס התגובה למגפה והם מהווים גורם חשוב ועיקרי בשמירה על יכולת ההתמודדות עם המגפה. עם זאת, עובדים אלו חשופים גם להשפעות שונות על בריאות נפשם בעת ניהול חירום ארוך טווח בהיעדר משאבים וכן דאגות אישיות מורכבות.
מטרת המחקר היא לנתח את מצבם הנפשי של עובדי בריאות הציבור כפי שהוא בא לידי ביטוי בדיונים ברשת Twitter לאור COVID-19, החל מתחילת המגפה ועד סוף שנת 2020.
אוכלוסיית המחקר נבחרה מתוך עוקבים של כמה מאות חשבונות טוויטר המייצגים ארגוני בריאות ונקודות עניין נפוצות של עובדי בריאות. אנו משתמשים בלמידה אקטיבית, תהליך חוזר של למידת מכונה ותיוג ידני, במטרה לבחור אוכלוסייה רחבת-היקף של חשבונות טוויטר המייצגים עובדים במערכת הבריאות דוברי אנגלית, ולא ארגונים רשמיים. אנו מחלקים לנושאים את דיוני העובדים באמצעות אלגוריתם Latent Dirichlet Allocation (LDA), מנתחים אותם ואת הרגשות המובעים בדיונים לאורך 2020. אנו מגדירים מדד Cohesion (לכידות) עבורי נושא הדיון ובוחרים את הנושאים הברורים ביותר ע"פ מדד זה. אנו משווים את הרגשות המובעים בציוצים ב-2020 לעומת שנת 2019. כמו כן, אנו בוחנים את רמות הקורלציה בהיסטי זמן שונים בין עוצמות הרגש המובע לבין גלי המגפה על מנת לזהות קשר סיבתי.
|
|
זיהוי אנומליות בעזרת ארכיטקטורה מבוססת קפסולות
|
סטודנטים
|
מנחים
|
תקציר
זיהוי אנומליות הוא תחום העוסק באיתור נתונים שאינם תואמים לדפוס או לשאר הנתונים הקיימים. בשנים האחרונות פורסמו מאמרים רבים אשר עושים שימוש ברשתות קונבולוציה לזיהוי אנומליות. לרשתות מסוג זה קיימות בעיות רבות, העיקרית ביניהן היא חוסר ההתייחסות ליחסים ההיררכיים בין חלקים בקלט. כדי להתמודד עם בעיה זו, אנו משתמשים בארכיטקטורת למידה עמוקה חדשה בשם Capsule Network. ארכיטקטורה זו תוכננה כדי לזהות טוב יותר יחסים היררכיים בין חלקים בקלט ואת האופן בו הם משתלבים לכדי שלם אחד. במחקר שלנו אנו עובדים על התאמת רשת זו לתחום של זיהוי אנומליות במידע תלוי זמן, ובוחנים את ההשפעה של שילוב אלמנטים שונים מהרשת. הניסויים בוצעו על מידע שהתקבל ממערכות סקאדה, סביבה מרובת חיישנים. המודלים הנוכחיים שלנו מתקרבים לתוצאות state-of-the-art, זאת ללא עיבוד מקדים של המידע וללא אופטימיזציות של המודל. בנוסף, אנו מדווחים על תופעות מעניינות הקשורות לפונקציית האקטיבציה החדשנית של המודל והתאמת הארכיטקטורה לאתגרים הקשורים בזיהוי אנומליות.
|
|
סיווג מידע טבלאי באמצעות רשתות קונבולוציוניות
|
סטודנטים
|
מנחים
|
תקציר
רשתות קונבולוציוניות נמצאות בשימוש רחב במשימות של סיווג תמונה ועד היום הוכיחו את יעילותן על ידי השגת תוצאות מרשימות בהשוואה לשיטות מוכרות אחרות. היתרון העיקרי שלהן הוא היכולת לחלץ פיצ'רים נסתרים בצורה אוטומטית בעזרת שימוש בקשרים מקומיים ומרחביים. למרות זאת, שיטות למידת מכונה מוכרות כמו Gradient Boosting Trees, SVM, ו- Random Forest עדיין שולטות בתחום כאשר מדובר במידע טבלאי. אחת הסיבות האפשריות היא החוסר התאמה בין המבנה של המידע הטבלאי לבין הקלט של רשת הקונבולוציה.
אנחנו מציעים שיטה גנרית חדשה לייצוג מידע טבלאי כתמונה שניתן להשתמש בה עבור ויזואליזציה של מידע ומשימות סיווג באמצעות רשתות קונבולוציוניות. השיטה שלנו מבוססת על רעיונות מתחום הוויזואליזציה של מידע אשר מוכוונות משתמש, במיועד על שיטות שהן מבוססות פיקסלים. השיטות הללו מאפשרות להקטין את החוסר הבנה הוויזואלית ובנוסף מאפשרת להציג את הכמות מידע הרבה ביותר. השיטה שלנו מכילה המרה של כל רשומה במידע הטבלאי לייצוג דו ממדי, כאשר פיצ'רים בעלי קורלציה חזקה נמצאים קרובים אחד לשני. על מנת לסדר את הפיצ'רים, אנחנו מחלקים אותם לקלאסטרים לפי הקורלציה ביניהם. לאחר מכן עבור כל קלאסטר אנחנו משתמשים בשיטות לצמצום ממדים, על מנת למצוא את המיקום היחסי על הפיצ'ר בתוך הקלאסטר. לבסוף, אנחנו מסדרים את הקלאסטרים במרחב לפי המידע ההדדי ביניהם. התוצאה היא תמונות דו ממדיות שיכולות לשמש עבור אינטרפטציה של המשתמש, כלומר מה הסיבה לתוצאה שקיבלנו, ובנוסף יכולות לשמש למשימות סיווג בעזרת רשתות קונבולוציוניות.
השתמשנו בשיטה שלנו על דאטה-סט מסוג RNA והשוונו את הביצועים לאחת העבודות הקודמות בתחום ולעוד שורה של מסווגים נוספים שהם אבני התחום במשימות סיווג. התוצאות הראשוניות מראות כי השיטה שלנו עומדת בשורה אחת יחד עם שאר אלגוריתמים מוכרים אשר משמשים לסיווג מידע טבלאי. בצעדים הבאים נרצה לערוך סקר קהל על מנת לבדוק את איכות התמונה שאנחנו יוצרים ולהפעיל את השיטה על מספר דאטה-סטים נוספים.
|
|
חיפוש תרשימי מחלקות
|
סטודנטים
|
מנחים
|
תקציר
מודלים, בפרט מודלי מחלקות משמשים בתפקיד מרכזי וככלי עיצוב במתודולוגית פיתוח מבוססת מודלים. מכיוון שיש קשיים בפיתוח מודלים איכותיים, מאגרים שונים של מודלים הוקמו כדי להתמודד עם האתגר וכתוצאה מכך, מפתחים יכולים להשתמש במודלים קיימים אשר דומים למערכת אותה הם מפתחים. בעקבות קיומם של מאגרים אלה, יש צורך בכלים שיוכלו לאחזר מודלים איכותיים דומים. על מנת לאחזר את אותם מודלים, אנו מציעים אלגוריתם חמדן התואם את כוונת המפתח על ידי בחינות דימיון סמנטי, דמיון מבני ודמיון סוגי. ההערכה הראשונית מצביעה על כך שהאלגוריתם השיג ביצועים גבוהים במציאת תתי מודלים דומים. אף על פי שנדרשת בדיקה נוספת, ניתן להתאים את האלגוריתם המוצע בקלות למודלים אחרים.
|
|
זיהוי של טכניקות וטקטיקות בדוח"ות איומי סייבר
|
סטודנטים
|
מנחים
|
תקציר
מודיעין איומי סייבר )CTI )מתייחס למידע על איומים ותוקפים המסייע במיתון אירועים מזיקים במרחב הסייבר.
דוחו"ות איומי סייבר )CTR )הם סוג של מודיעין איומי סייבר קריאים על ידי בני אדם, בצורה של דוחו"ת
טקסטואליים ללא מבנה מוגדר. כל דו"ח מתמקד במתקפה/בתוכנה זדונית ודן במאפייניה ובדרכי הפעולה
שלה.
מטרת התזה הזו היא לפתח מערכת שתוכל לבצע חילוץ של טקטיקות, טכניקות ופרוצדורות )TTPs )מתוך
דוח"ות איומי סייבר, ולספק הסבר על הסיווג. טקטיקות מתארות את מה שהיריב רוצה להשיג, וטכניקות
מתארות כיצד הוא משיג זאת. סיווג זה הוכח כבעל ערך מיוחד לאפיון התנהגויות תוקפים, ושיפור אמצעי נגד .
עבודות קודמות נעשו בתחום, אך אנו מאמינים שנוכל לשפר את הביצועים ולהשיג תוצאות טובות יותר
מהמתחרים שלנו. ההשערות שלנו כוללות:
• שימוש בשיטות עיבוד שפה טבעית )NLP )מתקדמות כגון transformer-ים יכול להניב תוצאות
טובות יותר מהעבודות הנוכחיות, כמו גם שימוש במודלים של למידה עמוקה שלא בוצע עד כה
• שימוש ביחס בין הטקטיקות לטכניקות יכול לעזור להשיג תוצאות טובות יותר
כחלק מתהליך המחקר אנו מנסים ומתנסים בהרבה מודלי הטבעה )embedding )וטכניקות למידת מכונה.
אלה כוללים רשתות LSTM( זיכון לטווח קצר- ארוך( עם ייצוג משפטים של ברט ) Bert ,)SMOBI( הטמעה
.Word2Vec-ו LogEntropy ,)smoothed binary embedding – חלקה בינארית
מדדי ההערכה שלנו הם דיוק )precision ,)היזכרות )recall )ומדד 5.0 .??עד כה, התוצאות הראשוניות שלנו
מראות שהטכניקות החדשות שלנו עובדות טוב, ואף טוב יותר מכמה מתחרים עיקריים.
|
|
התאמת אלגוריתמי למידת מכונה לסביבות דינאמיות בשימוש מודלים חבויים
|
סטודנטים
|
מנחים
|
תקציר
הצורך להגיב לשינויים ב- analyzed data (כלומר, שינויים בחלוקת ה-classes או תוספת class חדש) מהווה בעיה מאתגרת לכל מודל supervised learning. זיהוי הנסיבות המשתנות הללו בזמן ובחירת מודל הלמידה המתאים לטיפול בהם נותרה בעיה פתוחה. בעיה זו מחמירה כאשר מציגים classes שלא נראו בעבר במהלך חיי המערכת.
הגישה המוצעת שלנו לאתגר זה מורכבת משלושה חלקים:
א) אנו מאמנים מספר מודלים של למידה "ברקע" ואז משתמשים ב-meta-learner כדי לבחור את המודל המתאים ביותר לצעד הבא. במילים פשוטות, ה-meta-learner שלנו מנבא אילו מהמודלים המאומנים כיום יהיו היעילים ביותר בפעם הבאה.
ב) כדי לטפל בכמויות המידע המוגבלות בכל dataset נתון, אנו מאמנים את מטא-מודל שלנו על פני datasets מרובים. בנוסף לשיפור ביצועי המודל שלנו, ניתן להריץ את המודל האמור על כל מערך נתונים חדש ללא אימון נוסף.
ג) כדי להתמודד עם האתגר של גילוי class חדש, נשתמש ב-deep reinforcement learning יחד עם גישה מבוססת embedding חדשנית שפיתחנו.
ההערכה הנוכחית שלנו מתמקדת באיתור שינויים בסביבה, ללא הכללת class חדש. הערכה מקיפה על 50 דאטה סטים מראה כי המודל המוצע שלנו עולה על מספר דגמים פופולריים ויעילים ביותר (למשל, Adaboost, Random Forest, Neural nets).
|
|
איך שימוש ברגרסיה פולינומיאלית משפר דינאטינג
|
סטודנטים
|
מנחים
|
תקציר
הנפיצות של NAT ונקודות חמות ניידות אשר מאגדות כתובות IP של מכשירים אשר מחוברים ל כתובת IP בודדת מקשה על צופה באינטרנט ללמוד משהו על הרשת הפנימית.
שדה הפתיח IP Identification של פאקטות הנשלחות ל- Domain Name System ושדה הפתיח TCP Timestamp של פאקטות ה TCP SYN הם הפיצ׳רים המרכזיים למניית מכשירים ברשת הפנימית ושיוך של פאקטות עבור המכשירים האלו (ידוע כ DeNATing).
במאמר זה אנו נציג שיטה חדשה הנשענת על רגרסיה פולונומיאלית אשר מתאימה ל DeNATing.
האיבלואציה של המודל שלנו מבוצעת על real-world datasets אשר מכילים מכשירי ווינדוס ויוניקס, אשר נמצאים מאחורי נתבי NAT ונקודות חמות.
השיטה המוצעת מציגה ביצועים מתקדמים ביותר עבור כל הdatasets על כל סוגי המכשירים.
DeNATing מוצלח עשוי לסייע באבטחה ברשת, נגד הונאות ובמקרי שימוש אחרים.
|
|
זיהוי תקיפות ברשת מבוסס אנליטיקה של נתונים בזמן
|
סטודנטים
|
מנחים
|
תקציר
הגדילה המתמשכת ברחבי העולם ברשתות מחשב וביישומים מבוססי רשת, הובילה בין היתר לעלייה במספר מתקפות הסייבר, יחד עם עלייה בהופעתן של מתקפות חדשות, אשר דורשות שימוש בשיטות חדשות על מנת לזהותן. אף על פי שעבודה משמעותית נעשתה בתחום של זיהוי חדירות ברשת מבוסס זיהוי אנומליות, העבודה שלנו מתמקדת במימד הזמן הקיים בנתוני תקשורת, אשר לטעמנו טרם נוצל באופן מלא. בעבודתנו, אנחנו מציעים את השימוש ב-Time-Intervals Related Patterns (TIRPs) שכיחים, על מנת לייצג את ההתנהגות והשינויים של הרשת. מאחר שניתן להסתכל על מתקפות סייבר כעל משכי זמן חריגים, תבניות שנחשבות שכיחות על-פני משכי זמן רגילים ברובם, עשויות להיות חסרות, או להופיע עם תכונות שונות מהרגיל, כמו למשל מספר המופעים, המשך של התבנית וכו'. על-מנת להעריך את המערכת, נעשה שימוש ב-CSE-CIC-IDS2018, מאגר מידע חדש אשר נועד לצורכי הערכת ביצועים של מערכת לזיהוי תקיפות המתבססות על זיהוי אנומליות. במאגר המידע קיימים שבעה סוגים של מתקפות, כמו Brute-force, DDoS ועוד. עד כה, מניסויים שנערכו המערכת מראה דיוק גבוה ביכולתה לזהות חלונות זמן חריגים בתעבורת הרשת. הצלחה זו עשויה להטיב עם שיטות קיימות לזיהוי שיחות זדוניות ברשת, מאחר שרק בחלונות זמן שזהו כחריגים, עשויות להתקיים שיחות זדוניות -בכך ניתן יהיה לבצע זיהוי יעיל ואף מדויק יותר של השיחות הזדוניות.
|
|
למידת חיזוק הפוכה עבור פתרונות עלות-תועלת
|
סטודנטים
|
מנחים
|
תקציר
למידה עמוקה ולמידה מבוססת חיזוקים עמוקה, משיגות כיום תוצאות 'state-of-the-art' במגוון תחומים. אחד האתגרים העיקריים בשימוש בגישות אלה הוא לאמן אותם ביעילות לקבלת החלטות מורכבות בסביבות בהן יש אי וודאות גבוהה. גישה אחת להתמודדות עם אתגר זה היא למידת חיזוק הפוכה (IRL). בשיטה זו, האלגוריתם לומד מפעולות של מומחים אנושיים. למידת חיזוק הפוכה יעילה במקרים רבים, אך היא בעייתית בסביבות בהן סגנון והעדפות אישיות של המומחה יכולים לגרום להתנהגות משתנה. במחקר זה אנו מתמקדים בזיהוי וייצוג של "אישיויות" שונות ובדרכים בהם ניתן באופן אסטרטגי להפעיל אותן בדרכים שונות על מנת לשפר את ביצועי האלגוריתם. על ידי קיבוץ מומחים אנושיים על פי "האישיות שלהם" ניצור מספר סוכני DRL, שכל אחד מהם מייצג סוג אישיות אחר. לאחר מכן, בהתבסס על אינטראקציות עם סוכנים אחרים, נבחר סונכים לפי האישיות המתאימה ביותר לסיטואציה כדי למקסם את ביצועי הסוכן שלנו. כדי להעריך את המודל שלנו, בחרנו במשחק פוקר. משחק זה מכיל דרגות גבוהות של אי ודאות בכל מצב במשחק, ובנוסף שחקנים אנושיים עם סגנונות מגוונים מאוד.
|
|
הפעלה אפיזודית של מערכת תומכת החלטה מבוססת קווים מנחים קליניים
|
סטודנטים
|
מנחים
|
תקציר
קו מנחה קליני הוא מסמך המורכב ממכלול הוראות פרוצדורליות, מבוססות מחקר, לאבחון, טיפול וניהול של חולים בתחום ספציפי, כגון סוכרת מסוג 2. קיימים סוגים ספציפיים, בדרך כלל נוקשים יותר, של קווים מנחים המכונים פרוטוקולים, כמו בתחום האונקולוגי, שבו נפוצים פרוטוקולים כימותרפיים.
קווים מנחים קליניים עוזרים לצוותים רפואיים ביניהם רופאים, אחיות ואחרים, לקבל החלטות טובות ואחידות יותר בנוגע לטיפול הרפואי שהם מעניקים לחולים, ועוזרים להפחית את השונות באיכות הטיפול.
במהלך העשורים האחרונים נעשו מאמצים מרובים לפתח מערכות תומכות החלטה להפעלה אוטומטית של קווים מנחים קליניים, תוך שימוש ב- קווים מנחים שנוסחו באופן שבו מחשב יכול לפרש אותם. עם זאת, אף אחד מהמאמצים הקודמים לא התרכז בהפעלה אפיזודית של קווים מנחים קליניים. הפעלה אפיזודית זו אמורה להתאים לצורת העבודה של הרופאים ולהעניק שימוש מציאותי במערכת תומכת החלטה מבוססת קווים מנחים.
במחקר זה, אנו שואפים לפתח מערכת תומכת החלטה שתתמוך בהפעלה אפיזודית של קווים מנחים אלו. תוך שימוש בטכניקות של זיהוי תכניות וייצוג עשיר של קווים מנחים בשפת אסברו, נסיק את מטרות הרופאים, נקבע את הפעולות שעשו על פי הקו המנחה, אלו שלא נעשו, והשלב בקו המנחה בו הם נמצאים. לפיכך, נוכל לבקר את פעולות הרופאים, ובאמצעות פיקארד (מנוע ההפעלה של קווים מנחים), נספק המלצות נוספות לפעולות הבאות.
|
|
פרויקט מחקרי - שתי שיטות לטיפול בסרטן הערמונית
|
סטודנטים
שחר רון
|
אלון גוטמן
|
מתן ענבי
|
|
מנחים
|
תקציר
ישנן שתי דרכי טיפול נהוגות כאשר מטפלים בחולים ברמת סיכון גבוהה בסרטן הערמונית.
הדרך הרווחת שבה פועלים מרבית בתי החולים ברחבי העולם היא לבצע הקרנה לערמונית בלבד. לעומת זאת ישנם בתי חולים אשר מקרינים בנוסף גם את בלוטת הלימפה.
עולם הרפואה טרם הכריע בשאלה איזו שיטה מביאה לתוצאות טובות יותר.
בפרויקט זה, אספנו מידע רב מ-3 בתי חולים ברחבי הארץ – סורוקה, תל השומר ובלינסון, כאשר השניים הראשונים משתמשים בשיטה המוכרת ואילו בבלינסון משתמשים בשיטה השנייה.
בהסתמכות על המידע שהשגנו שכולל נתונים רפואיים ומידע על הישרדותו של כל חולה, פיתחנו ממשק משתמש גרפי אשר מאפשר לרופא להכניס את פרטי החולה ולקבל המלצה לגבי סוג הטיפול המועדף עבור החולה הספציפי.
|
|
מערכת להפגת בדידות בקרב קשישים
|
סטודנטים
ארז שלום
|
נעם טרקטינסקי
|
זיו גורה
|
נדב צ'פניק
|
|
מנחים
|
תקציר
הפרויקט הינו חלק משיתוף פעולה עם עמותת מילב"ת במרכז הרפואי שיבא-תל השומר, הפועלת להתאמת פתרונות טכנולוגים לאנשים מבוגרים ולבעלי מוגבלות. עקב מגפת הקורונה נוצר צורך מצד העמותה במערכת ניהול מתנדבים שתאפשר תקשורת מרוחקת בין המתנדבים שלה לבין האנשים המבוגרים שזקוקים לעזרה שכן לפני תקופת הקורונה דרך התקשורת היחידה של מתנדבי הגופים השונים עם הקשישים היתה בפגישות פנים-אל-פנים.
במהלך מגיפת הקורונה, מתנדבים לא יכלו להגיע אל הקשישים המבודדים, משום שלרוב שני הצדדים נמצאים בקבוצת סיכון והיו עלולים להידבק בנגיף. לכן, הקשישים נשארו לבדם, ללא אנשים לדבר איתם וללא הדרכות חשובות ורלוונטיות להם.
הפתרון המוצע על ידי הפרוייקט שלנו הוא בניית מערכת מבוססת ווב מותאמת ומונגשת לאינטרקציה עם בני הגיל השלישי, שתאפשר הן לקשיש והן למתנדב לנהל אינטראקציה משותפת מרחוק הכוללת שיחת וידאו והעברת הדרכות בנושאים שונים.
ייחודיות המערכת שלנו היא העיצוב המונגש לבני הגיל השלישי והתאמה חכמה בין המתנדב לקשיש, המתבצעת על ידי אלגוריתם שכתבנו שמתבסס על תחומי עניין משותפים, שפה ועוד.
כחלק מניהול המתנדבים, המערכת מאפשרת קביעת פגישות בין מתנדב לקשיש, מילוי משוב על כל פגישה ומעקב אחר הפגישות.
|
|
קיבוץ ע"י שימוש בדפוסי זמן שכיחים
|
סטודנטים
|
מנחים
|
תקציר
מטרת המחקר שלי הוא למצוא את הקשר בין מאפיינים ותכונות של ישויות לבין הבחנות רפואיות, לשם כך אנחנו מפתחים שיטה לקיבוץ ישויות ע"פ ההתנהגות שלהן בזמן. ההתנהגות היא רצף של אירועים/מצבים שיש ביניהם יחס עיתי. השיטה מורכבת משני שלבים עיקריים הראשון הוא אבסטרקציה והשני הוא כרייה של דפוסים שכיחים.
בשלב האבסטרקציה אנחנו לוקחים נתונים עיתיים ובעזרת שיטות דיסקרטיזציה מעבירים את הייצוג שלו מערכים בעלי נקודות זמן לאינטרוולים.
ע"מ לחזק את הקשר והתלות בין הדפוסים לבין המשתנים הפיזיולוגים של הישויות פיתחנו שיטת דיסקרטיזציה חדשה אשר בהינתן חלוקה לקבוצות על פי משתנה פיזיולוגי של הישויות, ובהינתן משתנה עיתי, תחזיר את הספים שיחלקו את המשתנה העיתי כך שההתאמה בין הקבוצות של המשתנה הפיזיולוגי לבין כמות הערכים של המשתנה העיתי בתאים תהיה גבוה ככל שניתן.
החלק השני של השיטה הוא כריית מידע, לאחר ששלב האבסטרקציה הופעל על כל המשתנים והעברנו את הנתונים לייצוג של אינטרוולים, אנחנו משתמשים באלגוריתם למציאת דפוסים שכיחים, הכוונה היא לדפוסים שחוזרים על עצמם בקרב אחוז מסוים של ישויות. הדפוסים עצמם מורכבים מהאינטרוולים ומהיחסים העיתים ביניהם, ע"מ לשמור על רמת גנריות מסוימת אין התייחסות לאורכי האינטרוולים, אלא רק ליחסי הזמנים ביניהם.
הדפוסים השכיחים שאנחנו מוצאים הן הקיבוץ של הישויות, ישות מסוימת שייכת לדפוס מסוים המידה והדפוס הזה מופיע בנתונים העיתיים שלה. בצורה זו אנחנו יכולים למצוא את הקשר בין ההתנהגות של הישות לבין הנתונים הפיזיולוגים שלה והאבחנות בהן אובחנה אותה ישות ולחקור בצורה יותר טובה ומעמיקה את ההשפעות של טיפולים על מטופלים בהתאם למשתים הפיזיולוגים של המטופלים.
|
|
התקפות זמן אמת על מכשירי ריצוף גנטי והגנות מפני התקפות אלו
|
סטודנטים
|
מנחים
|
תקציר
במחקר שלנו אנחנו מתייחסים לבעיות של אבטחת מידע ואבטחת המרחב המקוון במכשירים רפואיים, באופן ספציפי במכשירים לריצוף גנטי. המקרה הבוחן שלנו הוא המכשיר MinION של Oxford Nanopore Technologies. אנחנו דנים בתוצאות האפשריות השונות והסכנות האפשריות השונות של התקפות סייבר על מכשירים מעין אלו, כגון פגיעה בתפקוד של מכשור רפואי ושינוי תוצאות של ריצוף גנטי. לאחר מכן נמשיך ונראה התקפה מעשית וקלה באופן יחסי לביצוע על מכשיר הMinION, ובכך נראה באופן מעשי את הסכנות בתרחיש מעין זה. לאחר מכן אנחנו מתכוונים לדון באפשרויות השונות לפתרון של בעיות אבטחה אלו, וכן לממש ולהעריך לפחות פתרון אחד כזה, כנהוג בתחום של אבטחת המרחב המקוון.
|
|