ממצא ישראלי: דיפסיק הזניחה תחומי אבטחת סייבר במוצריה
כלי ה-GenAI מבית דיפסיק אמנם טלטל את השוק, אבל חוקרי וויז הישראלית שבחנו את גרסת DeepSeek R1 מבחינת הקפדת האבטחה שלה, גילו כי החברה השאירה בסיס נתונים פתוח לרווחה וחשפה יומני צ'אט, מפתחות API ועוד

דיפסיק (DeepSeek), חברת הבינה המלאכותית הסינית, חוללה דרמה גדולה באחרונה בגזרת הבינה המלאכותית היוצרת, עם המודל שפיתחה שהוא, לכאורה, תחרותי וחסכוני בהרבה מההיצע הקיים, והמערבי, בתחום. אבל באבטחת סייבר היא כנראה פחות טובה.
חוקרי וויז (Wiz) הישראלית אמרו כי זמן קצר לאחר שגרסת DeepSeek R1 זכתה לתשומת לב נרחבת, הם החלו לחקור את מצב האבטחה שלה. לפי החוקרים, החברה, שמפתחת ומפיצה מודלים מאומנים וזמינים באופן פתוח, וגם מספקת גישה מקוונת לאותן רשתות עצביות בענן – לא אבטחה את תשתית בסיס הנתונים של שירותים אלה.
Critical vulnerabilities doesn't have to be complex or have a CVE – @deepseek_ai publicly exposed their internal ClickHouse database to the world, without any authentication at all, and leaked sensitive data.
No one is safe from security mistakes, follow along to learn more 🧵 pic.twitter.com/pCsB7x2kwC
— Nagli (@galnagli) January 29, 2025
בסיס נתונים חשוף שהכיל נפח משמעותי של מידע רגיש
המשמעות היא ששיחות עם הצ'אטבוט המקוון של דיפסיק, כמו גם נתונים נוספים – נגישים במרחב הרשת הציבורי, בלא צורך בסיסמה. לדברי חוקרי וויז: "בתוך דקות, מצאנו בסיס נתונים נגיש לציבור של ClickHouse המקושר ל-דיפסיק, פתוח לחלוטין ולא מאומת, החושף נתונים רגישים", כתבו חוקרי החברה אמש (ד'). הם הוסיפו והבהירו: "הוא הכיל נפח משמעותי של היסטוריית צ'אטים, נתונים אחוריים ומידע רגיש, כולל יומני לוגים, סודות API ופרטים תפעוליים".
ClickHouse היא מערכת קוד פתוח, לניהול בסיסי נתונים ושאילתות ניתוח מהירות על מערכי ביג דאטה. היא פותחה על ידי יאנדקס (Yandex) ונמצאת בשימוש נרחב לעיבוד נתונים בזמן אמת, אחסון יומנים וניתוח נתונים גדולים, "מה שמצביע על חשיפה כזו כתגלית בעלת ערך ורגיש מאוד", ציינו החוקרים.
אם לא די בכך, לפי חוקרי וויז, הרי שהחשיפה אפשרה שליטה מלאה על בסיס הנתונים ויכולת הסלמה אפשרית כדי לקבל עוד הרשאות, כולל הרשאות פריבליגיות – בסביבת דיפסיק – בלא כל אימות, וכל זאת בלי חסימת הגישה מול גורם חיצוני.
באמצעות ממשק ה-HTTP של ClickHouse, חוקרי האבטחה הצליחו להגיע לנקודת קצה בה ניתן להריץ שאילתות SQL שרירותיות מהדפדפן. עם השאילתא SHOW TABLES הם השיגו רשימה של מערכי נתונים נגישים.
באחת הטבלאות האלה – log_stream, הכוללת יותר ממיליון רשימות כניסה של לוגים – יש נתונים רגישים לסוגיהם, ציינו החוקרים, ביניהם: חתימות זמן, הפניות לנקודות קצה של API, היסטוריית צ'אטים של אנשים, מפתחות API, פרטים חסויים ונתוני מטה-דטה תפעוליים.
החוקרים כתבו כי הם משערים ש"בהתאם לתצורת ClickHouse של דיפסיק, תוקף עלול לאחזר סיסמאות טקסט רגיל, קבצים מקומיים ונתונים קנייניים – ולעשות זאת באופן פשוט, עם פקודת SQL המתאימה".
"הסכנות האמיתיות מגיעות לעתים קרובות מסיכונים בסיסיים"
"האימוץ המהיר של שירותי בינה מלאכותית, בלא אבטחה הדוקה לצדו – הוא מסוכן מטבעו", אמר גל נגלי, חוקר אבטחת ענן ב-וויז.
לדבריו, "בעוד שרוב תשומת הלב סביב אבטחת AI מתמקדת באיומים עתידיים, הרי שהסכנות האמיתיות מגיעות לעתים קרובות מסיכונים בסיסיים – כמו חשיפה חיצונית מקרית של בסיסי נתונים".
לפי חברת אבטחת הענן הישראלית, צוותי דיפסיק תיקנו את הבעיה מיד כשנודע להם עליה.
וויז פרסמה את תגובת דיפסיק אליה אחרי החשיפה בחשבון ה-X שלה.
Deepseeks' response to the findings 👇 pic.twitter.com/BLvTX2XW3E
— Wiz (@wiz_io) January 30, 2025
"החשיפה שלנו מדגישה את העובדה שסיכוני האבטחה המיידיים ליישומי בינה מלאכותית נובעים מהתשתית והכלים התומכים בהם", סיכם נגלי. "כאשר ארגונים ממהרים לאמץ כלים ושירותים של בינה מלאכותית ממספר גדל והולך של סטארט-אפים וספקים, חשוב לזכור שאנו מפקידים בידי חברות אלה נתונים רגישים. קצב האימוץ המהיר מוביל לעתים קרובות להתעלמות מהאבטחה, אך הגנה על נתוני הלקוחות חייבת להישאר בראש סדר העדיפויות. חיוני שצוותי האבטחה יעבדו בשיתוף פעולה הדוק עם מהנדסי AI, כדי להבטיח נראות של הארכיטקטורה, הכלים והמודלים שבהם נעשה שימוש, על מנת להגן על הנתונים ולמנוע חשיפה. התעשייה חייבת להכיר בסיכונים הכרוכים בטיפול בנתונים רגישים ולאכוף נוהלי אבטחה דומים לאלה הנדרשים עבור ספקיות ענן ציבורי וספקיות תשתית גדולות".
"בקרה ואבטחת תהליכי אימון והטמעה של מודלים – צורך קריטי"
לדברי נמרוד וקס, מייסד שותף ו-CPO של BigID, המתמחה בגילוי וניהול מידע ארגוני לטובת עמידה ברגולציה, "ההתפתחויות האחרונות בשוק הבינה המלאכותית, מדגישות את המגמה העולמית של מעבר למודלים חסכוניים במשאבים, עם עלויות אימון נמוכות יותר. הישגים אלו פותחים דלתות לארגונים נטולי משאבים, לפתח ולאמן מודלים מותאמים אישית, בלא תלות מוחלטת בספקי API יקרים, דוגמת מיקרוסופט, OpenAI או גוגל. ליכולת לאמן מודלים בתוך הארגון יש יתרונות ברורים של חיסכון בעלויות ושליטה רבה יותר בתהליכי האימון".
"עם זאת", אמר, "ההצלחה של חברות סיניות בתחום זה מדגישה את הצורך הקריטי בבקרה ובאבטחת תהליכי האימון וההטמעה של מודלים כאלה. במיוחד כאשר מדובר במודלים שנבנו על ידי חברות במדינות בהן שאלות של פרטיות ושקיפות נתונים עשויות לעורר חששות".
תגובות
(0)