На прошлой неделе Apple спонсировала крупнейшую конференцию речевых технологий Interspeech 2019. Как участник компания также продемонстрировала свою новую систему машинного обучения, которую назвала Overton.
В рамках своей работы на конференции, команда Apple представила несколько исследовательских статей с детальным анализом технологии обработки речи. Среди них были документы, описывающие методы определения намерений пользователя по интонации его голоса, улучшения распознавания голоса, разработки точных инструментов для понимания нюансов речи, построения взаимоотношений между пользователями и голосовыми помощниками.
В ближайшее время видео от компании Apple должно появиться на ютуб-канале Interspeech, оно расскажет больше об их достижениях в области машинного обучения. То, что инженеры и аналитики Apple взаимодействуют с научным сообществом, уже никого не удивляет. Они с 2017 года эпизодически публикуют статьи по теме машинного обучения на своём собственном сайте.
Apple заявляет, что Овертон стал первым в своём роде решением, направленным на то, чтобы большая часть персонализации моделей машинного обучения управлялась самой машиной, а не человеком. Когда вы задаёте Siri вопрос, то на клиентской стороне происходит лишь голосовое взаимодействие. Затем модели машинного обучения пытаются понять вопрос, контекстуализировать его и найти самый точный ответ.
Предоставить качественный ответ на самом деле сложнее, чем кажется. В ответ на многие вопросы Siri может сообщить лишь энциклопедические данные, например, из Википедии. Хотя в дальнейшем этот помощник должен стать эффективным источником ответов при сложных проблемах. Возможно, он даже научится предсказывать вопросы. Но это будет очень трудно реализовать.
Как специалисты по аналитическим данным могут быть уверены в том, что выдаваемый Siri ответ является самым точным из возможных? Именно такую задачу Apple решает с помощью Овертона, суть которого — «автоматизировать жизненный цикл создания, развёртывания и мониторинга модели». Это означает, что машина сама корректирует модели машинного обучения в ответ на внешние стимулы, делая их более точными и исправляя логические ошибки, которые могли бы привести к неверным выводам.
Идея состоит в том, что люди смогут сосредоточиться на качественном наблюдении за моделями машинного обучения. А когда нужно будет произвести небольшие, но необходимые корректировки, вместо того, чтобы углубляться во всё более сложный код, люди смогут запросить набор изменений, которые Овертон применит сам.
Амбиции компании в отношении Siri простираются дальше, чем применение его в качестве цифрового всезнайки, которого пользователи могут о чём-нибудь спрашивать, причём без стопроцентной уверенности получить полезный ответ. Он всё-таки призван стать реальным помощником, который сможет выдать высокоуровневую информацию, провести контекстуальный анализ и расширить уже выполняемые задачи.
На это направление указывают и «Предложения Siri», хотя их реализация пока остаётся ограниченной. Представители Apple сообщают:
Главным направлением текущей работы являются системы, построенные на основе Овертона. Они помогают улучшать данные, наблюдать за программами и обеспечивать совместную работу.
Скорее всего, новинка повлияет на конфиденциальность пользователей. Инженеры Apple построили модели (по их мнению, очень точные), которые запускаются на устройствах с iOS. Овертон предоставляет данным моделям некоторую независимость, при этом система машинного обучения корректирует модели для достижения точности и актуальности. И всё это без вмешательства исследователя в каждое конкретное действие. Это означает, что аналитики данных будут исполнять стратегическую роль и им не будет доступна информация о каждом пользователе.
Apple создаёт машины и проводит машинное обучение, чтобы они потом сами могли персонализировать используемые модели. Компания утверждает, что Overton — это первая система управления машинным обучением, которая может наблюдать за приложением и улучшать его качество. Наряду с улучшением Siri эта технология также помогает устройствам на iOS 13 определять домашних животных при наведении камеры на питомцев.