Жизнь после Siri: что будет с технологией распознавания речи в будущем

Жизнь после Siri: что будет с технологией распознавания речи в будущем
Независимый разработчик Nuance, чьи технологии используются в смартфонах, работает над новым проектом виртуального ассистента и при этом отбивается от Apple, Google и инвестора-активиста Карла Айкана

В сверкающем офисе компании Nuance Communications, специализирующейся на распозновании речи, одна комната переделана в уютную берлогу. Исполнительный директор Шон Браун хвастается следующим большим проектом Nuance — виртуальным ассистентом под названием Wintermute, работа над которым ведется уже больше года.
«Как играет Пол Пирс?» — он задает вопрос Android-смартфону об одном из звездных игроков НБА. Женский голос с компьютерными нотками отвечает: «В сегодняшней игре Пол Пирс принес команде 13 очков и сделал три результативные передачи». Wintermute загрузил все запросы Брауна на серверы Nuance, и когда позже Шон усаживается в гостиной на диван и говорит ТВ, со встроенным Wintermute-сервисом, «включай игру», тот проверяет его профайл и выбирает матч Boston Celtics (летом Пол Пирс стал игроком Brooklyn Nets — Forbes).

Именно таким образом Nuance планирует изменить наш стиль общения с машинами — собирать данные о потребителе на облачном «мозге», чтобы качественнее предугадывать его потребности и передавать их от машины к машине.

Для того, чтобы Wintermute стал по-настоящему успешным проектом, Nuance должна отменить ряд сложных лицензионных сделок с потенциальными конкурентами — это позволит технологии следовать за пользователями повсюду от дома до машины и офиса. «Нам нужно очень тесно работать с производителями смартфонов, планшетов и телевизоров, — говорит генеральный директор Nuance Пол Риччи. — Технология должна раствориться в системе». Он рассчитывает, что на это уйдет пять лет. Будет ли сложно уговорить игроков вроде Samsung или eBay открыть свои системы для Nuance, чтобы она могла использовать их данные? «Нет, — считает креативный директор Nuance Гэри Глэйтон. — Мы — Швейцария. Мы — нейтральны. Мы играем со всеми. Все сядут с нами в одну лодку». В eBay, кажется, в этом не уверены. «Мы не делимся своими данными с третьими сторонами», — заявил представитель компании на вопрос о сотрудничестве с сервисами вроде Wintermute.

Nuance прежде была известна по продуктам марки Dragon Dictation, но теперь ее технологии распознавания речи используются в iPhone (виртуальный ассистент Siri), Samsung S-Voice, автоматизированных колл-центрах и виртуальных онлайн-ассистентах авиалиний и банков. В 2012 финансовом году при выручке в $1,7 млрд компания заработала свыше $200 млн чистой прибыли. Отличный результат? Не совсем.
Проблема в том, что Google и Apple следуют по стопам Nuance. Apple недавно запустил исследовательский центр в Бостоне (это всего 15 миль от основного офиса Nuance в Берлингтоне, штат Массачусетс), где как раз бывшие инженеры Nuance работают над версией Siri, свободной от технологий Nuance. В перспективе их разработка может вытеснить Nuance из iPhone таким же путем, как Google Maps вытеснил все другие картографические сервисы и стал номером один по умолчанию.

Технология Google «речь-плюс-искуственный-интеллект» лучше всего показала себя в Google Now: получился своего рода голосовой серфинг по сети. Если технолология Nuance основана на методах статистического анализа (для распознания слова сервис обращается к фонемам и контексту), то Google движется к так называемой технологии глубокого обучения, за разработку которой отвечает большой энтузиаст «искусственного интеллекта» Джефри Хинтон. Google нанял его в начале 2013 года, и подход Хинтона обещает превосходные результаты. Что еще хуже для Nuance — разработчики приложений на Android получат программное обеспечение Google по распознаванию речи бесплатно, тогда как Nuance берет лицензионную плату. Google также не отстает от Apple в том, что активно рекрутирует сотрудников Nuance.

Генеральный директор Nuance Пол Риччи возглавляет компанию уже 13 лет и готов к предстоящей битве за «управляемую голосом» сеть. Риччи — прирожденный боец, известный в Долине умением закрывать сделки как ему выгодно: «Когда ты управляешь компанией единственное о чем стоит беспокоиться, так это о создании долгосрочных перспектив и стоимости».

Если Wintermute не станет мостом в будущее, как предполагают топ-менеджеры Nuance, то Риччи придется рассуждать не о долгосрочных перспективах, а думать о заключении сделки. «Nuance находится в патовой ситуации, — говорит источник Forbes. — Им нужно продаваться». Ходят слухи, что Apple уже делала попытки инициировать переговоры c Nuance в мае 2011 года, но тогда Риччи дал категорический отпор. Источник в Google утверждает, что перед тем как в компании начали развивать собственную технологию, речь шла о покупке Nuance за $6 млрд.

Инвестор Карл Айкан, известный умением входить в компании и зарабатывать на сделках десятки и сотни процентов, собрал уже 16% акций Nuance. Кроме того, недавно он признался, что держит большую позицию в Apple. Айкан пока никак себя не проявил в Nuance, но аналитики считают, что это вопрос времени — инвестор скорее всего потребует продажи части небольших активов, а Риччи может быть предъявлен ультиматум освободить один из двух его постов (Риччи не только гендиректор, но и председатель совета директоров). Главная же цель Айкана — продажа Nuance, необязательно Apple или Google, покупателем может стать и IBM.

19 августа совет директоров Nuance принял «план о правах акционерах», который усложняет получение контроля над компанией. Более того, он фактически начнет работать против любого крупного акционера, собравшего 20% и более акций, если такая сделка не будет одобрена советом директоров. Хотя в документе не называется имя Айкана, действия совета естественно направлены против него. Nuance не первая компания, пытающаяся отбиться от активного инвестора и его юристов, но у большинства это не получается. В любом случае Риччи и его топ-менеджерам придется вести битву сразу на два фронта: внешний — против Google и Apple и внутренний — против Айкана.
Время пока есть. Риччи считает, что пройдет от 10 до 20 лет прежде чем общение с компьютером распространится в массы, а технология станет настолько хорошей, чтобы предвосхитить наши ожидания. Но готовы ли акционеры Nuance ждать обещанные «долгосрочные перспективы»?

Источник: http://www.forbes.ru/tekhnologii/internet-i-svyaz/244649-zhizn-posle-siri-chto-budet-s-tekhnologiei-raspoznavaniya-rechi

Комментарии

SaStaV  ◊ 26 сентября 2013 г. в 23:44
Монополисты всех подминают под себя, как всегда. Будем надеяться что Пол Риччи сможет выкрутиться, не продавая компанию, и все-таки даст нам кусочек будущего)
0

Для того чтобы оставить комментарий, вам необходимо войти на сайт