Google Translate מוסיף 24 שפות תוך שימוש בטכנולוגיה חדשה ומדהימה

בשלב של Google I/O 2022 היום, המנכ"ל Sundar Pichai הודיע ​​שהחברה מטעינה את Google Translate ב-24 שפות נוספות.

מכיוון ש-Translate הוא כבר מוצר חזק למדי, כל 24 השפות החדשות שמתווספות היום נמצאות בשימוש על ידי אנשים דמוגרפיים ברחבי העולם שאינם מיוצגים היטב בנוף הטכנולוגי של היום. כבר אז, החברה טוענת כי השפות הללו מדוברות על ידי אוכלוסייה משולבת של כ-300 מיליון איש מדי יום.

על מנת להרחיב את Google Translate בשפות אלו כעת, גוגל משתמשת בטכנולוגיה חדשה יחסית בשם Zero-Shot Machine Translation.

המודל המרשים הזה מיוחד מכיוון שהוא למד לתרגם את השפות החדשות הללו רק על ידי הסתכלות על השפות עצמן - כלומר לא הוצגו לו דוגמאות תרגום ממשיות הקשורות באף אחת מהשפות הללו. גוגל אומרת שתרגום מכונת Zero-Shot הסתכל רק על "טקסט חד-לשוני" - כך שרק על ידי הסתכלות על טקסט בכל אחת מ-24 השפות הללו, נראה שהוא נהייה מספיק שוטף כדי לטפל בתרגומים.

מַרשִׁים! ובכל זאת, גוגל מזהירה אותנו שבעוד שהטכנולוגיה החדשה הזו כבר מספקת תוצאות מדהימות, היא גם עדיין לא מושלמת.

אבל זה בטוח יהיה יותר טוב מכלום. עדיף מלשלם עבור אגוארנימתרגם, זה לשימוש. מה שכן, גוגל מבטיחה שהדגם רק ישתפר עם הזמן. אם אתה מעוניין, כאן אתה יכוללמד עוד על תרגום מכונה Zero-Shot.

לבסוף, הנה הרשימה המלאה של כל 24 השפות החדשות שמתווספות ל-Google Translate:

  • אסאמים, בשימוש על ידי כ-25 מיליון אנשים בצפון מזרח הודו
  • אימרה, בשימוש על ידי כשני מיליון אנשים בבוליביה, צ'ילה ופרו
  • הם לובשים את זה, בשימוש על ידי כ-14 מיליון אנשים במאלי
  • בהוג'פורי, בשימוש על ידי כ-50 מיליון בני אדם בצפון הודו, נפאל ופיג'י
  • דהיווהי, בשימוש על ידי כ-300,000 אנשים באיים המלדיביים
  • דוגרי, בשימוש כשלושה מיליון אנשים בצפון הודו
  • כִּבשָׂה, בשימוש על ידי כשבעה מיליון אנשים בגאנה וטוגו
  • גוארני, בשימוש על ידי כשבעה מיליון אנשים בפרגוואי ובבוליביה, ארגנטינה וברזיל
  • אילוקנו, בשימוש על ידי כ-10 מיליון אנשים בצפון הפיליפינים
  • קונקאני, בשימוש על ידי כשני מיליון אנשים במרכז הודו
  • קריו, בשימוש על ידי כארבעה מיליון אנשים בסיירה לאון
  • כּוּרדִי(סוראני), בשימוש כשמונה מיליון בני אדם, בעיקר בעיראק
  • לינגלה, בשימוש על ידי כ-45 מיליון אנשים ברפובליקה הדמוקרטית של קונגו, הרפובליקה של קונגו, הרפובליקה המרכז אפריקאית, אנגולה והרפובליקה של דרום סודן
  • לוגנדה, בשימוש על ידי כ-20 מיליון אנשים באוגנדה ורואנדה
  • מאיתילי, בשימוש על ידי כ-34 מיליון אנשים בצפון הודו
  • מיטלון(Manipuri), בשימוש על ידי כשני מיליון אנשים בצפון מזרח הודו
  • אַנגְלִית, בשימוש על ידי כ-830,000 אנשים בצפון מזרח הודו
  • אורומו, בשימוש על ידי כ-37 מיליון אנשים באתיופיה ובקניה
  • קצ'ואה, בשימוש על ידי כ-10 מיליון אנשים בפרו, בוליביה, אקוודור ובמדינות הסובבות
  • סנסקריט, בשימוש על ידי כ-20,000 אנשים בהודו
  • Sepedi, בשימוש על ידי כ-14 מיליון אנשים בדרום אפריקה
  • טיגריניה, בשימוש על ידי כשמונה מיליון אנשים באריתריאה ובאתיופיה
  • צונגה, בשימוש על ידי כשבעה מיליון אנשים באסווטיני, מוזמביק, דרום אפריקה וזימבבואה
  • טווי, בשימוש על ידי כ-11 מיליון אנשים בגאנה