Por: David Ferrer • Colombia.com

ChatGPT evoluciona: Ahora más versátil con comunicación por voz y multimodalidad

La última versión de ChatGPT, GPT-4o, marca un hito en la evolución de la IA, ofreciendo capacidades de comunicación por voz y la capacidad de comprender contenido multimedia, lo que lo hace aún más versátil.

Foto: Twitter @OpenAI
Foto: Twitter @OpenAI

La última versión de ChatGPT, GPT-4o, marca un hito en la evolución de la IA, ofreciendo capacidades de comunicación por voz y la capacidad de comprender contenido multimedia, lo que lo hace aún más versátil.

OpenAI ha presentado un nuevo avance en inteligencia artificial que revolucionará la forma en que interactuamos con ChatGPT. Este chatbot ahora puede hablar para responder a las solicitudes de los usuarios y entender tanto contenido en video como en texto.

Según Mira Murati, CTO de OpenAI, esta actualización representa una mejora significativa en las capacidades del modelo en texto, visión y audio. Esta versión, denominada GPT-4o, ofrece una experiencia de usuario más completa y dinámica, disponible de forma gratuita para todos los usuarios de ChatGPT.

Una de las características más destacadas de GPT-4o es su capacidad "nativamente multimodal", lo que significa que puede interactuar en voz, texto o imágenes, abriendo un amplio espectro de posibilidades en la interacción entre humanos y la inteligencia artificial.

Antes del lanzamiento de GPT-4o, se especulaba sobre los planes de OpenAI, incluyendo la posibilidad de competir con Google en un motor de búsqueda de IA o la introducción de un asistente de voz integrado.

Foto: Twitter @OpenAI

Sin embargo, con esta actualización, OpenAI ha priorizado mejorar la experiencia del usuario, manteniendo las capacidades de generación de contenido de la versión tradicional, pero ahora con la capacidad de hacerlo a través de la voz.

La implementación de la voz en ChatGPT amplía enormemente sus capacidades, permitiendo una interacción más intuitiva y natural para los usuarios. Además, GPT-4o puede procesar y generar respuestas en tiempo real, capturando incluso la emoción en la voz del usuario y reproduciéndola en diferentes estilos.

OpenAI ha confirmado que GPT-4o estará disponible de forma gratuita para todos los usuarios de ChatGPT, con usuarios premium disfrutando de capacidades ampliadas hasta cinco veces más que los usuarios gratuitos.

Esta actualización no solo mejora la experiencia del usuario, sino que también expande las capacidades de la plataforma. ChatGPT ahora puede comprender y generar respuestas en función de comandos de voz, así como analizar imágenes y proporcionar información relevante.

Además, los desarrolladores podrán aprovechar la API de OpenAI para integrar la capacidad de voz en sus propias aplicaciones y sistemas, abriendo nuevas posibilidades en el desarrollo de aplicaciones de IA.