در کنفرانس I/O 2025، گوگل اعلام کرد که قابلیت ترجمه صوتی همزمان به سرویس Google Meet اضافه شده؛ قابلیتی که عملکردی مشابه یک مترجم انسانی واقعی در تماس ویدیویی دارد.
ترجمه همزمان گوگل میت
قبلا Google Meet امکان نمایش زیرنویسهای ترجمهشده بهصورت زنده را ارائه میداد؛ اما حالا با Speech Translation، یک قدم جلوتر رفته و صدای کاربر به زبان دلخواه شنونده، ترجمه و بازتولید میشود. بدون از بین رفتن لحن، احساسات یا آهنگ گفتار.
این ویژگی، مانع زبان را از میان برمیدارد؛ چه در مکالمات کاری بینالمللی و چه در تماس با اعضای خانواده در خارج از کشور.
بهعنوان مثال، اگر به زبان اسپانیایی صحبت کنید، طرف مقابل صدای شما را به زبان انگلیسی خواهد شنید؛ با همان تن صدا و حالت احساسی. همزمان، شما هم پاسخ او را به اسپانیایی میشنوید.
این فرایند تقریبا بهصورت آنی و با تاخیر بسیار پایین انجام میشود تا مکالمه روان باقی بماند. ابتدا صدای اصلی با ولوم پایین پخش میشود، و سپس ترجمه وارد میشود. با این حال، گوگل بهطور رسمی هشدار داده که ترجمه باعث ایجاد کمی تاخیر در گفتوگو خواهد شد.
قابلیت مذکور از مدل صوتی مبتنیبر هوش مصنوعی Google DeepMind پشتیبانی میکند. این مدل به نام AudioLM، صدا را مستقیما به صدای دیگر تبدیل میکند و بخش زیادی از ویژگیهای صوتی اصلی را حفظ مینماید.
در نسخه تحت وب Meet، کاربران میتوانند از پنل جدید Speech translation with Gemini استفاده کرده و زبان گفتار و زبان مورد نظر برای شنیدن ترجمه را انتخاب کنند. هنگام فعال بودن، کل تصویر تماس حالتی درخشان با تم Gemini میگیرد و نشانگر «در حال ترجمه از [زبان]» در گوشه تصویر ظاهر میشود.
این ویژگی از امروز بهصورت بتا و از طریق پلنهای جدید Google AI Pro و Ultra در اختیار کاربران شخصی قرار گرفته. برای فعالسازی، تنها یکی از افراد حاضر در تماس نیاز به اشتراک در این پلنها دارد.
در حال حاضر، فقط زبانهای انگلیسی و اسپانیایی پشتیبانی میشوند و گوگل وعده داده که زبانهای ایتالیایی، آلمانی و پرتغالی نیز طی هفتههای آینده اضافه خواهند شد.
در ادامه سال ۲۰۲۵، این قابلیت برای کاربران سازمانی Workspace نیز در مرحله آزمایشی عرضه خواهد شد.