Google Gemini פונקציות ותכונות חדשות

ועידת ה-I/O של גוגל התחילה - לאחר חגיגת טכנו קצרה לא כל כך קצרה של Marc Rebillet - עם התמקדות בבינה מלאכותית ובפרט, בינה מלאכותית של גוגל: תאומים.

אם 2023 הייתה השנה שהזניקה את "AI"שם בחוץ, 2024 הולכת להיות השנה להכניס (של גוגל) AIבהיד, הבית והראש של כולם.

מנכ"ל גוגלסונדאר פיצ'איהדגיש כי כיום, כל 2 מיליארד מוצרי המשתמשים של גוגל משתמשים ב-Gemini. זו רק ההתחלה של זה, כפי שפיצ'אי אמר:

אנחנו עדיין בתחילת עידן תאומים שלנו.

אוקיי, בוא נבדוק את זה!

סקירות AI מגיעות כעת

גוגל פתחה את אירוע ה-I/O 2024 עם הודעה חשובה: השקת תכונת מעבדות ה-Search Generative Experience (SGE) שלה למשתמשים בארה"ב, המתוכננת במהלך השבוע.

סקירת AI תענה אוטומטית על חיפושים ספציפיים בארה"ב, ומציעה הסברים תמציתיים בראש דפי תוצאות החיפוש לפני רשימת הקישורים המסורתית. במהלך הימים הקרובים, מאות מיליוני משתמשים בארה"ב יחוו סקירות של AI, עם תוכניות להתרחב ליותר ממיליארד משתמשים ברחבי העולם עד סוף השנה.

בקרוב, תוכל להתאים את סקירת הבינה המלאכותית שלך עם אפשרויות לפשט את השפה או לפרוט אותה ביתר פירוט. זה יכול להיות שימושי במיוחד אם אתה חדש בנושא, או אם אתה מנסה לפשט משהו כדי לספק את הסקרנות של ילדך.

סקירת AI תעזור יותר ויותרשאלות מורכבות. במקום לחלק את השאלה למספר חיפושים, אתה יכול לשאול את השאלות המורכבות ביותר שלך, עם כל הניואנסים והאזהרות שיש לך בראש, הכל במכה אחת.

לדוגמה, אולי אתה מחפש סטודיו חדש ליוגה או פילאטיס, ואתה רוצה אחד שפופולרי בקרב המקומיים, ממוקם בנוחות עבור הנסיעה שלך, וגם מציע הנחה לחברים חדשים. בקרוב, עם חיפוש אחד בלבד, תוכל לשאול משהו כמו "מצא את אולפני היוגה או הפילאטיס הטובים ביותר בבוסטון והראה לי פרטים על הצעות הפתיחה שלהם, וזמן ההליכה מביקון היל."

מעבר למציאת התשובה או המידע הנכונים לשאלה מורכבת, החיפוש יוכל גם לתכנן איתך.

עם יכולות תכנון ישירות בחיפוש, אתה יכול לקבל עזרה ביצירת תוכניות לכל מה שאתה צריך, החל מארוחות וחופשות. חפש משהו כמו "צור תוכנית ארוחות של 3 ימים לקבוצה שקל להכין", ותקבל נקודת התחלה עם מגוון רחב של מתכונים מרחבי האינטרנט.

עם התקדמות בהבנת וידאו, אתה יכול עכשיוחיפוש באמצעות סרטונים. לדוגמה, אם קנית נגן תקליטים בחנות יד שניה וזרוע המחט נסחפת באופן בלתי צפוי, אתה יכול פשוט לחפש עם סרטון של הבעיה. זה חוסך ממך לנסות לתאר את הבעיה במילים ומספק סקירת AI עם שלבים ומשאבים לפתרון בעיות.

חיפוש וידאו יהיה זמין בקרוב עבור משתמשי Search Labs בארה"ב באנגלית, עם תוכניות להתרחב לאזורים נוספים לאורך זמן.

דבר עם הגלריה שלך עם Ask Photos

תאומים מתקדמת יותר לאפליקציית התמונות, שבקרוב תוכל להשלים משימות שאתה אומר לה לעשות.

בחודשים הקרובים, Google Photos תציג הנחיות קוליות וטקסט מודעות להקשר שיעזרו למשתמשים לחפש תמונות או פרטים ספציפיים בתוך תמונות. השאל תמונותהתכונה חורגת מחיפושי תמונות קונבנציונליים על ידי שימוש בתאומים לזיהוי תוכן תמונה. לדוגמה, הוא יכול לזהות לוחית רישוי לרכב ולבקש מהמשתמשים לברר לגבי מספר לוחית ספציפי בדגם רכב מסוים, ולספק זיהוי מדויק.

ההשקה של Ask Photos צפויה להתחיל בחודשים הקרובים, עם מסגרת זמן שחרור טנטטיבית שנקבעה לקיץ.

"תכפיל את האסימונים, בבקשה!"

Pichai גם חשף ש-Gemini 1.5 Pro, האיטרציה החדשה ביותר של דגם ה-AI שלה, תהיה נגישה כעת לכל המשתמשים דרך אפליקציית Gemini Advanced. הגרסה הציבורית מגיעה עם חלון הקשר של מיליון אסימונים. בנוסף, גוגל שדרגה את Gemini 1.5 Pro לטיפול ב-2 מיליון אסימונים, אך תכונה זו תהיה מוגבלת למפתחים בתצוגה מקדימה פרטית.

ב-AI, אסימון הוא כמו אבן בניין או פיסת פאזל. זוהי יחידה קטנה של מידע המייצגת משהו בעל משמעות, כמו מילה או חלק ממשפט. אסימונים עוזרים לבינה מלאכותית להבין ולעבד שפה על ידי פירוקה לחתיכות ניתנות לניהול, מה שמקל על מחשבים לנתח וליצור טקסט.

AI יסרוק את תיבת הדואר הנכנס שלך עם Gemini Pro ב-Workspace Labs

Gemini ב-Gmail אמור לחולל מהפכה בניהול הדוא"ל על ידי הצעת תכונת חיפוש מקיפה המסכמת את כל היסטוריית הדוא"ל שלך בסרגל צד נוח.

החל מהיום, Gemini בחלונית הצד של Gmail, Docs, Drive, Slides ו-Sheets ישתמשו ב-Gemini 1.5 Pro. עם חלון הקשר ארוך יותר והנמקה מתקדמת יותר, תאומים יכולים לענות על מגוון רחב יותר של שאלות ולספק תשובות מלאות תובנות יותר. בנוסף, קל להתחיל עם סיכומים שיופיעו בחלונית הצדדית, הצעות מוצעות ועוד.

פתרון זה מטפל בבעיה הנפוצה של ניפוי הודעות דוא"ל רבות כדי למצוא מידע רלוונטי. עם Gemini, משתמשים יכולים פשוט לבקש סיכום של הודעות דוא"ל מאיש קשר ספציפי, לקבל רשימת תבליטים תמציתית של פרטי מפתח וגישה מהירה למיילים המקוריים. בהדגמה של דקה אחת, גוגל הציגה כיצד משתמשים יכולים להגיב במהירות לאימיילים ישירות מהסרגל הצדדי של תאומים, לייעל את תהליך התקשורת.

עבור אפליקציית Gmail לנייד, ישנם שלושה שדרוגי AI שימושיים:

  • סיכום מיילים: עם תכונה זו, Gemini יכול לנתח שרשורי דוא"ל ולספק תצוגה מסכמת ישירות באפליקציית Gmail. פשוט הקש על כפתור הסיכום בחלק העליון של שרשור האימייל שלך כדי לקבל את הדגשים. זה יהיה זמין למשתמשי Workspace Labs החודש, ולכל לקוחות Gemini for Workspace ולמנויי Google One AI Premium בחודש הבא.
  • תשובה חכמה הקשרית: בקרוב, Gemini ב-Gmail יציע תשובות מוצעות מפורטות וניואנסיות עוד יותר המבוססות על הקשר משרשור האימייל שלך. עם תשובה חכמה הקשרית, אתה יכול לערוך או פשוט לשלוח כפי שהוא. זה יהיה זמין למשתמשי Workspace Labs בנייד ובאינטרנט החל מיולי.
  • שאלות ותשובות של Gmail: בקרוב כשתלחץ על הסמל החדש של Gemini באפליקציה לנייד, Gemini ב-Gmail יציע אפשרויות מועילות, כמו "סיכום הודעת דוא"ל זו", "רשום את השלבים הבאים" או "הצע תשובה". ובדומה ללוח הצד בשולחן העבודה, אתה יכול להשתמש בתיבת ההנחיות הפתוחה כאשר יש לך בקשות ספציפיות יותר. לדוגמה, אתה יכול לבקש מתאומים "למצוא את ההצעה מקבלן הגגות" שקבורה איפשהו בתיבת הדואר הנכנס שלך. שאלות ותשובות של Gmail יהיו זמינות למשתמשי Workspace Labs בנייד ובאינטרנט החל מיולי.

סקירת אודיו

גוגל משפרת את NotebookLM, כלי הבינה המלאכותית שלה להבנת מסמכים, על ידי הוספת "סקירות אודיו" היוצרות שיחה בסגנון פודקאסט בין שני דוברים.

שדרוג זה נהדר עבור אנשים שמעדיפים למידה על ידי האזנה במקום קריאה. בהדגמה, NotebookLM קיבל כמה שיעורי פיזיקה לעבוד איתם. לאחר מכן הוא ערך שיחה בין שני דוברים, והסביר כיצד כדורסל קשור לנושא הפיזיקה, כמו כוח, כאשר נשאל על ידי ג'וש וודוורד של גוגל.

Gemini 1.5 פלאש

גוגל מציגה דגם חדש בשם Gemini 1.5 Flash, שנועד להיות מהיר ויעיל.

Gemini 1.5 Flash הוא "מעולה בסיכום, בצ'אט, בכתוביות של תמונות וסרטונים, חילוץ נתונים ממסמכים וטבלאות ארוכים ועוד", כתב דמיס חסאביס, מנכ"ל Google DeepMind, בפוסט בבלוג. חסאביס הסביר שגוגל יצרה את Gemini 1.5 פלאש מכיוון שהמפתחים רצו דגם קל וזול יותר מגרסת ה-Pro שהוכרזה בפברואר.

Gemini 1.5 Flash נמצא בין Gemini 1.5 Pro ל-Gemini 1.5 Nano, הדגם הקטן ביותר של גוגל שפועל ישירות על מכשירים. למרות שהוא קל יותר מג'מיני פרו, הוא עדיין חזק.

תמונה 3 כאן כדי לפוצץ אותך

כמו כן, גוגל הכריזה על שני כלי AI חדשים ליצירת מדיה: Veo, שיכולה ליצור סרטוני 1080p באיכות גבוהה, ו-Image 3, הגרסה האחרונה של מסגרת הטקסט לתמונה שלה.

גוגל אומרת ש-Veo מבינה שפה טבעית ומושגים חזותיים כדי ליצור את הסרטון שאתה רוצה. סרטונים אלה שנוצרו בינה מלאכותית יכולים להיות באורך של יותר מדקה וכוללים טכניקות קולנועיות מתקדמות כמו Timelapses.

Imagen 3 מתואר כדגם הטקסט לתמונה האיכותי ביותר של גוגל, המפיק תמונות מפורטות ופוטוריאליסטיות עם פחות שגיאות. גוגל טוענת כי Imagen 3 טובה יותר בהבנה ובניהול של הנחיות מפורטות ומטפלת בטקסט בצורה יעילה יותר מאשר בגרסאות קודמות.


היכנסו לטריליום

בשלב הבא, גוגל הציגה את הדור השישי של TPUs של Google Cloud בשם Trillium. יחידות החומרה החדשות הללו, הספציפיות לבינה מלאכותית, תומכות בדגמי הבינה המלאכותית העדכניים של גוגל כמו Gemini 1.5 Flash, Imagen 3 ו-Gemma 2.0.

Trillium מציעה עלייה של פי 4.7 בביצועים לכל שבב בהשוואה ל-TPU v5e הקודם, עם זיכרון ורוחב פס כפולים. הוא כולל מאיץ SparseCore מהדור השלישי לעיבוד מערכי נתונים גדולים במשימות דירוג והמלצה.

גוגל טוענת כי Trillium יכולה לאמן דגמי AI מהר יותר עם זמן אחזור ועלות נמוכים יותר, וזה ה-TPU היעיל ביותר שלהם באנרגיה עד כה, תוך שימוש ב-67% פחות אנרגיה מהגרסה הקודמת.

יכולות מולטי-מודאליות מלאות מגיעות ל-Gemini Nano

אנדרואיד עומדת להפוך למערכת ההפעלה הניידת הראשונה הכוללת דגם בסיס מובנה במכשיר עם הצגתו של Gemini Nano. חידוש זה נועד לספק חוויות מהירות ומאובטחות תוך שמירה על פרטי המשתמש. החל ממכשירי Pixel בהמשך השנה, יושק הדגם האחרון, Gemini Nano עם מולטימודאליות. שדרוג זה יאפשר לטלפונים לעבד לא רק קלט טקסט אלא גם להבין מידע הקשרי כגון מראות, צלילים ושפה מדוברת.

בהמשך השנה, היכולות הרב-מודאליות של Gemini Nano ישולבו ב-TalkBack, ויספקו תיאורים עשירים וברורים יותר לאנשים עם עיוורון או ראייה לקויה. משתמשי TalkBack נתקלים בממוצע ב-90 תמונות ללא תווית מדי יום. עדכון זה יעזור בכך שהוא יציע פרטים נוספים על תמונות ממשפחה או חברים ותיאורים של סגנונות לבוש וגזרות בעת קניות באינטרנט. מכיוון ש-Gemini Nano פועל במכשיר, תיאורים אלה מסופקים במהירות ועובדים גם ללא חיבור לרשת.

תכונה חדשה נבדקת באמצעות Gemini Nano כדי לספק התראות בזמן אמת במהלך שיחות טלפון אם היא מזהה דפוסים הקשורים בדרך כלל להונאות. לדוגמה, תקבל התראה אם ​​"נציג בנק" יבקש ממך בדחיפות להעביר כספים, לשלם באמצעות כרטיס מתנה, או מבקש מידע אישי כמו קוד PIN או סיסמאות - בקשות שהבנקים בדרך כלל לא מבצעים. ההגנה הזו מתרחשת לחלוטין במכשיר, מה שמבטיח שהשיחה שלך תישאר פרטית. פרטים נוספים על תכונת ההצטרפות הזו ישותפו בהמשך השנה.

תן ל-Gemini Advanced לתכנן את החופשה שלך

תכנון טיולים יכול לגזול זמן רב, אז זה המקום שבו Gemini Advanced יגיע בקרוב ויעזור לך.

תארו לכם את התרחיש הזה: אתם אומרים לג'מיני שאתם הולכים למיאמי לרגל יום העבודה עם המשפחה שלכם. בנך אוהב אמנות, ובעלך משתוקק למאכלי ים טריים. האם תאומים יכולים לשלוף פרטי טיסה ומלון מה-Gmail שלך ולסייע בתכנון סוף השבוע?

מזל תאומים עושה יותר מאשר רק לספק הצעות כלליות. זה לוקח בחשבון את לוח הטיסות שלך, העדפות האוכל והאטרקציות המקומיות. על ידי גישה ל-Gmail שלך למידע על טיסה, הקשה על מפות Google להצעות למסעדות ולמוזיאון בקרבת מקום, ושימוש בחיפוש לפעילויות נוספות, Gemini יוצר מסלול טיול מותאם אישית. בין אם זה סיור רגלי ברובע העיצוב או זמן חוף, תאומים מבטיחים שהיום שלך יהיה מלא בפעילויות התואמות את תחומי העניין שלך. בנוסף, המסלול מתעדכן אוטומטית אם אתה מבצע שינויים או מוסיף פרטים נוספים.

חווית תכנון דינמית זו תהיה זמינה ב-Gemini Advanced בחודשים הקרובים.

אבני חן מותאמות אישית ו-Live for Gemini Advanced

למנויי Gemini Advanced תהיה בקרוב אפשרות ליצוראבני חןלחוויה אישית עוד יותר. אבני חן הן גרסאות מותאמות אישית של Gemini המותאמות להעדפותיך. בין אם אתה צריך חבר לחדר כושר, סו שף, שותף לקידוד או מדריך לכתיבה יצירתית, ניתן לעצב את Gems כך שיתאים לצרכים שלך.

יצירת אבן חן היא פשוטה. אתה פשוט מתאר מה אתה רוצה שהג'ם שלך יעשה ואיך אתה רוצה שהוא יגיב. לדוגמה, אתה יכול לבקש ממאמן ריצה לספק תוכניות יומיות עם גישה חיובית ומניעה. לאחר מכן תאומים ייקח את ההוראות שלך ובלחיצה אחת תיצור אבן חן שתענה על הדרישות הספציפיות שלך.

כמו כן, גוגל מציגה דרכים חדשות לאינטראקציה עם תאומים באופן טבעי יותר, בין אם אתה שולח הודעות טקסט או מדבר. עם Gemini ב-Google Messages, כעת תוכל לשוחח איתו בצ'אט באותה אפליקציה שבה אתה משתמש כדי לשלוח הודעות לחברים שלך.

בחודשים הקרובים תשיק ענקית הטכנולוגיהחי עבור Gemini Advancedמנויים, המציעים חווית שיחה חדשה בנייד. תכונה זו משתמשת בטכנולוגיית דיבור חדשנית כדי להפוך את השיחה עם תאומים לאינטואטיבית יותר. עם Gemini Live, אתה יכול להשתתף בשיחה עם Gemini ולבחור מתוך קולות שונים בצלילים טבעיים עבור התגובות שלו. אתה יכול גם לדבר בקצב שלך או להפריע בשאלות הבהרה, לחקות שיחה אמיתית.

לדוגמה, אם אתה מתכונן לראיון עבודה, אתה יכול לעבור בשידור חי ולבקש מ-Gemini לסייע לך. זה יכול לעזור לך לעשות חזרות ואפילו להציע כישורים להדגיש במהלך הראיון. בהמשך השנה, תוכל גם להשתמש במצלמה שלך במהלך הפעלות בשידור חי, מה שיאפשר דיונים על הסביבה שלך.

מעגל לחיפוש ושיעורי הבית (של הבן שלך).

מאז הופעת הבכורה שלה ב-Samsung Unpacked בינואר 2024, Circle to Search שודרגה עם תכונות חדשות כמו תרגום מסך מלא, והזמינות שלו הורחבה ליותר מכשירי Pixel וסמסונג.

מהיום, Circle to Search יכולה לסייע לתלמידים בשיעורי הבית שלהם, ולספק להם הבנה מעמיקה יותר במקום רק לספק תשובות, ישירות מהטלפונים והטאבלטים שלהם. כאשר תלמידים נתקלים בבעיה שהם תקועים בה, הקף את ההנחיה מנחה את Circle to Search להציע הוראות שלב אחר שלב לפתרון מגוון בעיות במילים בפיזיקה ובמתמטיקה, הכל מבלי לעזוב את החומרים הדיגיטליים שלהם. מאוחר יותר השנה, Circle to Search תרחיב את היכולות שלה כדי לפתור בעיות מורכבות עוד יותר הכוללות נוסחאות סמליות, דיאגרמות, גרפים ומעבר לכך.

זמין כעת בלמעלה מ-100 מיליון מכשירים, Circle to Search שואפת להכפיל את טווח ההגעה שלו עד סוף השנה, עם תוכניות להרחיב את החוויה למכשירים נוספים.

SynthID עבור טקסט ווידאו

"ככל שהתפוקות מהדגמים שלנו הופכות מציאותיות יותר, עלינו לשקול גם כיצד ניתן לעשות בהן שימוש לרעה", אומרים בכירים בגוגל. בשנה שעברה הציגה גוגל את SynthID, טכנולוגיה שמוסיפה סימני מים בלתי מורגשים לתמונות ולשמע שנוצרו בינה מלאכותית, כך שיהיה קל יותר לזהות אותם וכדי להגן מפני שימוש לרעה. כיום, SynthID מתרחבת לשני אופנים חדשים: טקסט ווידאו.