GPT4o для всех и бесплатно
kvisaz — 13.05.2024 Прямо сейчас рассказывают о новой модели GPT4o - Omnimodelhttps://www.youtube.com/watch?v=DQacCB9tDaw
1. Понимает голос, картинки, текст.
2. Обещают сделать бесплатной, то есть доступ к синтезу картинок станет доступным для всех, кто раньше сидел на бесплатной GPT-3.5
3. Потому что оптимизировали расходы и скорость, могут позволить
4. Показывают работу с телефона - выглядит как продвинутая версия Сири-Алисы
5. Может менять тон и эмоциональность своего голоса по запросу - как это было с текстом
6. Показывают ей картинку с камеры, то есть не фотографируя и не заливая отдельно, просят решить уравнения голосом - решает.
Тут конечно большой задел для слабовидящих, такую штуку надо делать как очки с камерой и наушниками, раз она научилась в реал-тайме распознавать изображение с камеры
7. Нарисовали на листке "Я люблю ChatGPT", показали через камеру - нейронка аж застонала от умиления (по умолчанию она довольно эмоциональный голос имеет. Секс индустрия должна сейчас тайно выстроиться в очередь за таким сервисом - очень человеческий голос.
8. Не уверен, но сейчас похоже запустили отдельное приложение ChatGPT на MacBook и показали ей вкладку с открытым кодом на Питоне - и она начала комментировать и рассуждать о нем. Ну это круто конечно, но хотелось бы чтобы это и обратно шло - то есть она хотя бы комменты писала).
Если теперь не надо будет копипастить текст и код, а просто можно будет показывать открытое приложение с текстом - это хороший, удобный прием.
8.1 Я заглянул на сайт https://chatgpt.com/ - не, пока такой функционал недоступен и намеков на GPT-4o нет, кажется в начале стрима говорили, что постепенно раскатают на все страны (ну кроме некоторых) в течение ближайших недель
9. Вернулись к телефону, показывают ей селфи и она комментирует, какие эмоции на лице у человека
Вот и все.
Итоги
1. Самое важное - это раскатка для бесплатных юзеров, если выполнят, более мощной модели с пониманием и синтезом картинок
2. Второе важное - кардинальное ускорение, раньше картинка не просто загружалась, но еще и распознавалась довольно заметное время. Теперь, если сохранится такая же скорость работы как во время презентации - это будет заметный буст, фактически все системы компьютерного зрения можно будет заменить на GPT4o.
|
</> |