Принцип работы основан на достижениях в сфере обработки и распознавания речи, и искусственного интеллекта, чтобы автоматически транскрибировать записи в реальном времени, когда человек говорит. Приложение позволяет пользователям более эффективно использовать функции записи голоса, поскольку может транскрибировать аудио, даже если нет подключения к Интернету.
Транскрибация — перевод информации из аудио или видео в текстовый формат. Проще говоря, это расшифровка записанной речи и создание целостного, логически связанного текста.
Приложение пригодится для записи лекций, интервью или переговоров, с дальнейшей их расшифровкой. Данная технология может быть полезна и для переводчиков, поскольку для перевода аудио требуется его предварительная расшифровка. Если новая разработка Google будет работать безупречно, переводчики смогут сэкономить своё время и больше внимания уделить именно переводу.
Работа приложения была продемонстрирована на презентации, где Recorder представил безошибочную транскрипцию. В реальных условиях подобные приложения зачастую дают сбой из-за посторонних шумов на записи или в связи с низкой скоростью обработки. Пока нельзя однозначно сказать, насколько хорошо будет работать приложение в реальной жизни.
Как объясняют в компании, вся работа выполняется непосредственно на устройстве — это означает, что даже когда телефон переведён в авиарежим, приложение будет вести точные записи. Что позволяет использовать его в любых условиях, независимо от наличия связи.
Приложение также имеет расширенные функции поиска, что позволяет пользователю искать не только отдельные слова, но и фразы и даже звуки.Например, можно найти момент, где в записи звучат аплодисменты или лай собаки.
В настоящее время Recorder поддерживает только английский, но в Google планируют добавить больше языков в будущем.
Технология, которая используется для работы приложения, разрабатывалась долгое время и стала прорывом в области искусственного интеллекта. Хотя Google точно не называет, какие разработки применялись при создании приложения, можно предположить, что они связаны с автоматической транскрибацией на YouTube, а также работой Google над музыкальным искусственным интеллектом.
Стоит отметить, что приложение было разработано специально для нового смартфона от Google ― Pixel 4. Компания не обещает добавить эту технологию на другие устройства.