О будущем "Майкрософт Офис"
giovanni1313 — 30.10.2022 «Майкрософт» собирается включить в свой офисный пакет первое приложение, базирующееся на ИИ-технологиях — ”Designer”, программу, создающую изображения по текстовому описанию. Буквально «по запросу».Смелый шаг, и одна из самых больших инноваций в области офисных утилит за долгое время. По сути, основной функционал офисного ПО мало изменился со времени его появления в конце 1970-ых — начале 1980-ых. Последним крупным нововведением стала поддержка облачных технологий и многопользовательской коллаборации. Но это скорее эволюция, чем революция.
Однако уже созрели — или созреют в ближайшее время — технологии, которые позволяют действительно пересмотреть основы работы офисных редакторов. Все они так или иначе связаны с темой ИИ. Давайте попробуем представить офисный пакет «нового поколения»:
- графический редактор: то, что уже предложила «Майкрософт». Ключевой элемент — нейросеть, умеющая генерировать изображения по запросу и редактировать их по запросу (убрать фон, поменять один элемент на другой, поменять оттенки и т. д.)
- текстовый редактор: на основе большой языковой модели. Которая умеет сама писать нужный текст по запросу/по образцу, редактировать его согласно пожеланиям в свободной форме, форматировать согласно пожеланиям/по образцу и т. д.
- табличный редактор: на основе нейросети, умеющей в аналитику. Автоматическое дополнение исходных данных сводной аналитикой (подбивка итогов, статистика и т. п.), в том числе по образцу других документов, обработка данных по пожеланиям пользователя в свободной форме. Создание и редактирование графиков по пожеланиям в свободной в форме.
- редактор презентаций: автоматическое создание презентаций на основе заметок и текстовых документов. Умения, пересекающиеся с текстовым редактором: редактирование текста и форматирование по пожеланиям.
- почтовый клиент/планировщик: на основе большой языковой модели. Автоматическое написание писем и ответов на них, «интеллектуальный» семантический поиск. Автоматическое выделение задач и составление расписаний на основе электронных писем и другой корпоративной коммуникации.
- редактор баз данных: автоматическое наполнение базы данных на основе неструктурированных документов, редактирование и выдача данных по запросам пользователя на естественном языке. Для всех вышеперечисленных задач прототипы и готовые продукты на основе ИИ-технологий либо уже созданы, либо не выглядят чем-то невозможным. Меньше всего, пожалуй, разработана «ИИ-аугментация» табличного редактора. Но и здесь непреодолимых препятствий нет. Важно, что с развитием облачной модели у «Майкрософт» появились широчайшие возможности по накоплению датасетов для тренировки машинных моделей, которые могли бы автоматизировать офисную работу пользователей. Этим же преимуществом располагает и «Гугл» — который, теоретически, может составить конкуренцию для «Майкрософт» на данном направлении.
У обоих компаний есть сильные наработки в области генерации изображений и обработки естественного языка. «Майкрософт», в частности, коммерциализует разработки ”OpenAI”, в числе которых лидирующая на рынке языковая модель GPT-3, а также Dall-E 2. И «Майкрософт», и «Гугл» имеют коллосальный опыт в создании успешного офисного ПО. Остаётся только объединить эти компетенции в новом, прорывном продукте.
Описанный выше функционал может ускорить работу пользователей в разы. Не менее важно, что он делает офисное ПО более доступным для пользователей с любым уровнем опыта. На смену «интуитивному интерфейсу» (в котором пользователю предлагалось интуитивно догадаться, что же замыслил разработчик программы) приходит диалог человека и машины. В которой машина сама старается выполнить пожелания пользователя — или активно уточняет, как именно надо выполнить задачу.
Стоит понимать, что новая концепция может потребовать и новой бизнес-модели — а это не всегда простой путь. Так, большие нейросети потребляют немало вычислительных ресурсов. Это стоит денег. На данном этапе невозможно сказать, какими будут аппетиты нейросетей, обеспечивающих новые возможности офисного ПО. Например, для самой мощной версии GPT-3 генерация 1000 токенов (~750 английских слов, 1,5 страницы текста) стоит 2 американских цента.
Расценки на использование GPT-3
Вроде немного — но пара часов работы за компьютером вполне может вылиться в несколько долларов. А за месяц — соответственно $100 или даже больше. Это в 5-10 раз дороже, чем «Майкрософт» берет за свой офисный пакет сейчас. Соответственно, возникает соблазн перехода от фиксированной платы к некоему аналогу “pay-per-use” — нетрадиционной для этого рынка. Без сомнений, выросшая производительность сотрудников оправдает этот высокий ценник — вопрос скорее в психологической готовности как разработчика, так и его клиентов.
Впрочем, тут возможны и обходные пути: например, искать баланс между функционалом модели и ее вычислительными затратами, пытаться задействовать локальную вычислительную мощность или даже ждать, пока стоимость вычислений, следуя закону Мура, снизится до приемлемого уровня.
Самым интересным является вопрос, принесет ли «ИИ-апгрейд» офисного ПО более широкие и значимые изменения. В своё время, в 1980-ых, офисные приложения стали тем ”killer app”, который и превратил персональные компьютеры из хобби для нердов, что-то мастерящих у себя в гараже, в массовый продукт и незаменимый элемент рабочего места. Без табличного редактора компьютерная революция бы не случилось.
Будет ли аналогичный по масштабу эффект от нового поколения офисного ПО? Пока мне сложно представить какие-то иные последствия, кроме выросшей скорости выполнения задач. То, что новые ”killer apps” будут связаны с ИИ-технологиями — несомненно. Но, возможно, эти новые ”killer apps” появятся вне традиционных офисных инструментов. А возможно, моя фантазия тут просто пасует. В любом случае, совсем скоро мы узнаем это наверняка.
________________________________________
Друзья, я начал вести канал в Телеграм: Экономика знаний. Подписывайтесь!
|
</> |