OpenAI no para de añadirle nuevas funciones a ChatGPT; la última es un agente de inteligencia artificial que puede navegar por la web y realizar diferentes tareas por ti. Se llama Operator, y ya se encuentra disponible a modo de research preview. Eso sí, solo es accesible para usuarios en Estados Unidos suscriptos a ChatGPT Pro, que cuesta 200 dólares al mes.
Más allá de su acotada disponibilidad, lo que propone Operator en ChatGPT es muy interesante. Lo que hace esta herramienta es tomar las instrucciones de los usuarios, abrir una ventana del navegador web dentro de la propia conversación y ejecutar las acciones que se le encomiendan.
Así, por ejemplo, se le puede pedir a la IA que busque una receta en un sitio web específico, y que añada los ingredientes al carrito de una tienda en línea. Incluso es posible indicarle que omita ciertos ingredientes que ya se tienen y que no hace falta comprar, entre otras posibilidades. También puede buscar hoteles o cabañas para una escapada de descanso, siguiendo ciertas fechas o patrones específicos, y confirmar la reserva por nosotros.
Según explica OpenAI, se ha entrenado a Operator para que reconozca e interactúe con diferentes elementos típicos de la interfaz web de un sitio web. Por ejemplo, campos de texto, botones y menús. Para que la nueva herramienta de ChatGPT vea lo que hay en pantalla, utiliza las capacidades de visión de GPT-4o para tomar capturas y analizarlas, y luego replica las acciones disponibles a través de un teclado y ratón.
Operator es lo nuevo de ChatGPT que puede navegar la web por ti
OpenAI aclara que la nueva función de ChatGPT está recién en una fase inicial, por lo que sus capacidades todavía son limitadas. Eso explica su acotada disponibilidad, tanto a nivel territorial como de suscripciones. De todos modos, la compañía indica que planea ampliar su alcance a los usuarios de ChatGPT Plus, Team y Enterprise en el futuro, aunque no brindó posibles fechas para concretarlo.


Un punto interesante de Operator es que puede autocorregirse si comete un error o encuentra dificultades. En tanto que si se atasca en alguna tarea, le entrega el control de las acciones al usuario. Vale remarcar que, además, las personas pueden tomar las riendas de las acciones en todo momento. Y el agente de ChatGPT también solicita interacción humana cuando se tienen que concretar acciones como la resolución de un CAPTCHA, el inicio de sesión con usuario y contraseña, el ingreso de información de pago o la confirmación del envío de un correo electrónico.


La herramienta tampoco puede usarse para concretar transacciones bancarias, ni para determinar si se debe aceptar o rechazar una oferta de trabajo. OpenAI las considera «decisiones de alto riesgo» y están fuera de los límites de lo que Operator y ChatGPT pueden hacer.
Asimismo, la empresa se ha aliado con múltiples compañías como Booking, eBay, TripAdvisor, Instacart, Uber y DoorDash, por solo mencionar algunas. Esto permite que Operator use «filtros» correspondientes a los sitios en cuestión para realizar acciones, y que durante su funcionamiento no viole los términos de uso de cada uno de esos servicios.
Los usuarios estadounidenses de ChatGPT Pro ya pueden acceder a este nuevo agente de IA a través de operator.chatgpt.com. En el futuro, OpenAI aspira a brindar una integración todavía mayor entre esta utilidad y su chatbot de inteligencia artificial.