Apple, Google и Meta пытаются усовершенствовать научно-фантастический гаджет: универсальный переводчик

На протяжении десятилетий в таких сериалах, как «Звездный путь», и романах, как «Автостопом по галактике», появлялись вымышленные универсальные переводчики, способные с легкостью переводить любой язык на английский и наоборот.
Теперь гаджеты, когда-то доступные только в научно-фантастических произведениях, постепенно становятся реальностью.
Во время презентации iPhone во вторник компания Apple В видео был показан сценарий, который многие путешественники считают сном. В нём англоговорящий турист покупает цветы в неназванной испаноговорящей стране. Флорист обратился к туристу по-испански, но тот услышал чёткую, связную речь на английском.
«Сегодня на все красные гвоздики скидка 50%», — услышала туристка в наушниках голос на английском языке, практически одновременно с речью продавца.
Видео было маркетинговым материалом для новейших AirPods Pro 3 от Apple, но эта функция — одна из многих подобных функций, предлагаемых технологическими компаниями, среди которых также есть Alphabet, материнская компания Google. и Мета , который делает Facebook и Instagram.
Технологические достижения, вызванные появлением ChatGPT от OpenAI в конце 2022 года, открыли эру генеративного искусственного интеллекта. Почти три года спустя эти достижения привели к появлению переводчиков в режиме реального времени.
Для Apple функция Live Translation — ключевой аргумент в пользу AirPods Pro 3, представленных во вторник. Новые наушники стоимостью 250 долларов поступят в продажу на следующей неделе. Благодаря Live Translation пользователи смогут сразу же услышать перевод с французского, немецкого, португальского и испанского языков на английский. Live Translation также появится в качестве обновления для AirPods 4 и AirPods Pro 2 в понедельник.
А когда два человека разговаривают друг с другом, используя AirPods, их разговор может одновременно переводиться в обе стороны внутри наушников каждого из них. В видеодемонстрации Apple это выглядело так, будто два человека общаются на разных языках.
Аналитики воодушевлены тем, что эта функция может стать шагом вперёд в стратегии Apple в области искусственного интеллекта. Функция перевода должна работать на достаточно новом iPhone, чтобы запустить Apple Intelligence — программный пакет Apple для работы с искусственным интеллектом.
«Если мы действительно сможем использовать AirPods для прямых трансляций, это будет функцией, которая действительно заставит людей обновиться», — заявил аналитик DA Davidson Джил Лурия в интервью CNBC в среду .
Перевод становится ключевым полем битвы в технологической отрасли, поскольку ИИ становится достаточно совершенным, чтобы переводить языки так же быстро, как люди говорят.
Но Apple не одинока.
За последний год Google и Meta также выпустили аппаратные продукты с возможностью перевода в реальном времени.
Смартфон Google Pixel 10 оснащён функцией перевода речи говорящего на язык собеседника во время телефонных звонков. Эта функция, называемая Voice Translate, также предназначена для сохранения интонаций говорящего. Voice Translate начнёт работать на смартфонах пользователей с обновлением программного обеспечения в понедельник.
В ходе демонстрации Google в августе Voice Translate смог перевести предложение артиста Джимми Фэллона на испанский язык, и оно действительно звучало как голос комика. Функция Apple не пытается имитировать голос пользователя.
Тем временем в мае компания Meta объявила, что ее очки Ray-Ban Meta смогут переводить то, что человек говорит на другом языке, с помощью динамиков устройства, а другой участник разговора сможет видеть переведенные ответы, расшифрованные на телефоне пользователя.
В среду Meta проведёт собственную презентацию продукта, на которой, как ожидается, компания представит следующее поколение своих умных очков, в одной из линз которых будет установлен небольшой дисплей, сообщал CNBC в августе. Пока неясно, анонсирует ли Meta новые функции перевода.
А в июне OpenAI представила интеллектуальный режим голосового помощника для ChatGPT , включающего в себя множество функций, включая встроенный перевод. ChatGPT интегрирован с Siri от Apple, но не поддерживает голосовой режим. OpenAI планирует в ближайшие годы выпустить новые аппаратные продукты совместно с бывшим гуру дизайна Apple Джони Айвом.
Рост популярности живого перевода может также изменить целые отрасли. Согласно исследованию Microsoft Research, опубликованному в августе , письменные и устные переводчики — это профессия номер один, находящаяся под угрозой со стороны искусственного интеллекта. 98% рабочих задач переводчиков пересекаются с тем, что может делать ИИ.
За последние несколько лет на рынке появилось множество специализированных гаджетов для перевода, использующих преимущества высокоскоростной сотовой связи по всему миру и улучшающих услуги онлайн-перевода, в результате чего появились устройства в виде шайб или наушников со встроенной функцией перевода стоимостью в пару сотен долларов.
«Что мне нравится в действиях Apple, так это то, что они наглядно демонстрируют, насколько остра эта проблема», — сказал Джо Миллер, генеральный директор японской компании Pocketalk в США, которая производит устройство для перевода стоимостью 299 долларов, которое подключается к двум людям, разговаривающим на разных языках, и переводит их разговор в аудио- и текстовую форму.
По данным Canalys , учитывая огромные масштабы деятельности Apple и тот факт, что только за первый квартал компания поставила около 18 миллионов комплектов беспроводных наушников, выход компании на рынок позволит более широкому кругу клиентов ознакомиться с усовершенствованиями в области технологий перевода, которые были реализованы за последние годы.
Несмотря на выход Apple на рынок, производители специализированных устройств утверждают, что их ориентация на точность и знание лингвистики позволит обеспечить более качественные переводы по сравнению с теми, которые предлагаются бесплатно в составе нового телефона.
«Мы наняли лингвистов», — сказал Александр Альски, глава польской компании Vasco Electronics, которая выпускает наушники-переводчики, имитирующие голос пользователя, подобно функции Google. «Мы объединили ИИ с человеческим вводом, и благодаря этому нам удалось добиться гораздо более высокой точности на всех предлагаемых нами языках».
Есть и преимущество домашнего поля. Крупнейшим рынком для Vasco Electronics является Европа, а функция Apple Live Translation недоступна для пользователей из ЕС, как сообщила Apple на своём сайте.
Некоторые продукты, представленные технологическими компаниями, не универсальны и пока ограничены небольшим количеством языков. Функция Apple доступна только на пяти языках, в то время как у Pocketalk — на 95.
Миллер из Pocketalk считает, что потенциал этой технологии выходит далеко за рамки туриста, заказывающего бокал вина во Франции. Он говорит, что она наиболее эффективна при использовании в таких рабочих местах, как школы и больницы, где требуются функции конфиденциальности и безопасности, превосходящие возможности Apple и Google.
«Речь идёт не о роскошном туризме и путешествиях, — сказал Миллер. — Речь идёт о пересечении языка и противоречий, когда необходимо вести дискуссию».
Apple не ответила на просьбу прокомментировать ситуацию.
CNBC