خلاصه رویداد Google I/O 2024
روز گذشته رویداد Google I/O 2024 برگزار شد. این رویداد سالانه با هدف اطلاع رسانی و رونمایی از آخرین دستاوردهای گوگل برای توسعه دهندگان برگزار می شود. Google I/O 2024 بیش از هر موضوع دیگری در مورد هوش مصنوعی بود. با توجه به رونمایی از ChatGPT 4o این موضوع اصلا دور از انتظار نبود.
در ادامه خلاصه ای از جذاب ترین محصولات و راهکارهای هوش مصنوعی گوگل را لیست می کنیم:
هوش مصنوعی برای آموزش
گوگل در رویداد Google I/O 2024، از هوش مصنوعی LearnLM رونمایی کرد. این مدل به صورت خاص برای یادگیری و آموزش بهینه شده است. LearnLM می تواند با مکالمه با دانش آموزان آن ها را در موضوعات مختلف آموزش دهد.
این مدل ها هم اکنون در برخی از راهکارهای گوگل در دسترس بوده و از سوی خود گوگل نیز در حال آزمایش های بیشتر هستند. این مدل همچنین امکان پرسیدن سوال از هوش مصنوعی به صورت زنده در هنگام تماشا کردن ویدئوهای یوتیوبی را فراهم می کند. قابلیت پرسیدن سوال در هم اکنون در دسترس برخی از کاربران قرار گرفته است.
مدل بهینه شده Gemma 2
مدل بهینه شده Gemma 2 با قابلیت اجرای بهتر بر روی پردازنده های گرافیکی انویدیا نیز از سوی گوگل رونمایی شد. این مدل با 27 میلیارد پارامتر به صورت خاص برای اجرا بر روی کارت های گرافیکی انویدیا بهینه شده و امکان اجرا در سیستم های تکی تانسوری (TPU) را نیز دارا است.
کاربردهای گسترده Gemini Nano
مدل زبانی کوچک Gemini Nano گوگل قابلیت اجرا در سیستم هایی با توان پردازشی محدود را دارد. به همین دلیل هم گوگل دائما به دنبال کشف کاربردهای جدید برای این مدل است. در رویداد Google I/O 2024 از این قابلیت ها رونمایی شد:
استفاده از Gemini Nano برای کشف کلاه برداری
گوگل از امکان شناسایی کلاه برداری در حین تماس با استفاده از این مدل رونمایی کرد. این قابلیت که در لحظه و در حین تماس عمل می کند، در نسخه های آینده اندروید استفاده خواهد شد.
مثالی که گوگل در این قسمت استفاده کرد، دریافت تماس از سمت نماینده بانکی بود که درخواست رمز عبور کاربری را داشت. با وجود تبلیغات فراوان از سوی بانک ها و نهادهای ذیربط، افراد بسیاری در سراسر جهان نسبت به این نوع حملات آسیب پذیر هستند. هوش مصنوعی می تواند این نوع حملات را تشخیص دهد و از از کاربران حفاظت کند.
Gemini در کروم
از کروم ورژن 126 به بعد، مدل هوش مصنوعی Gemini Nano مستقیما در کروم استفاده خواهد شد. این مدل به توسعه دهندگان امکان استفاده از قابلیت های هوش مصنوعی در خود دستگاه ها را می دهد. نمونه ی قابلیت هایی که گوگل برای این مدل رونمایی کرد، استفاده از Gemini Nano به عنوان دستیار نگارش ایمیل است.
Gemini به جای دستیار هوشمند
گوگل به دنبال جایگزینی دستیار هوشمند خود با Gemini است. طبق گفته های گوگل در Google I/O 2024 آن ها به دنبال استفاده از این مدل در عمده فعالیت هایی هستند که در تلفن های اندرویدی انجام می شود. با ترکیب مدل های هوش مصنوعی توسعه داده شده، کاربران می توانند به سرعت تصاویر تولید شده با هوش مصنوعی را در مکاتبات خود استفاده کنند یا خلاصه یک ویدئو یا متن را دریافت کنند.
ترکیب گسترده تر هوش مصنوعی و سرچ گوگل
مدت هاست که مایکروسافت با استفاده از چت جی پی تی نتایج بهتری را از بینگ می گیرد. گوگل نیز به دنبال گسترش استفاده از هوش مصنوعی است تا از OpenAI و دیگر رقبا عقب نماند. طبق برنامه های رونمایی شده در Google I/O 2024، آن ها به دنبال استفاده از هوش مصنوعی برای مرتب کردن کل صفحه هستند؛ نه فقط ارائه یک خلاصه (مشابه بینگ).
علاوه بر آن، استفاده از قابلیت دورش خط بکش تا بگردد، کاربران اندرویدی امکان جستجوی سریع آنچه را که در صفحه می بینند، خواهند داشت.
رونمایی از مدل تولید عکس Imagen3
در Google I/O 2024، این شرکت از مدل تولید عکس جدید خود نیز رونمایی کرد. رونمایی از این مدل، پس از نتایج فاجعه بار مدل های هوش مصنوعی گوگل در بدو رونماییشان، می تواند فرصتی برای تغییر دیدگاه ها به این مدل ها باشد. بر اساس گفته های گوگل، این مدل قابلیت بسیار بهتری در تولید تصاویر و فهم دستورات دارد.
تصویر زیر از تصاویری است که از سوی خود گوگل ارائه شده و با دستور «A large, colorful bouquet of flowers in an old blue glass vase on the table. In front is one beautiful peony flower surrounded by various other blossoms like roses, lilies, daisies, orchids, fruits, berries, green leaves. The background is dark gray. Oil painting in the style of the Dutch Golden Age.» تولید شده است.
رقابت آلفابت با Google I/o 2024 و OpenAI
آلفابت (گوگل) با رویداد Google I/O 2024 محصولات بسیار جذابی را رونمایی کرد. این محصولات همگی با قدرت های گوگل که سیستم عامل اندروید و موتور جستجوی آن باشد، همخوان هستند. اما کمبود مدل های گوگل به خوبی مشخص است. هیچ کدام از مدل های رونمایی شده در این قسمت با GPT-4o قابل مقایسه نیستند.