Anthropic, acaba de anunciar el lanzamiento de una versión mejorada de su modelo
Claude 3,5
Sonnet que puede interactuar con cualquier aplicación del ordenador de un cliente.
A través de una nueva API de «uso de ordenador», ahora accesible en versión beta abierta, el modelo es capaz de emular pulsaciones de teclas, clics de botones y gestos del ratón o del trackpad, emulando esencialmente a un cliente sentado frente a un ordenador.
El entrenamiento del algoritmo incluye que pueda ver los procesos que tienen lugar en una pantalla, y que posteriormente pueda utilizar las herramientas disponibles para llevar a cabo tareas, de manera que cuando un desarrollador pide a
Claude que utilice un programa determinado y le otorga el acceso necesario,
Claude puede recurrir a capturas de pantalla de lo que es visible para el cliente, contar cuántos píxeles necesita mover vertical u horizontalmente el cursor, y hacer clic en el lugar adecuado.
El algoritmo pasa a ser así un agente para el cliente capaz de emular prácticamente cualquier tarea, aunque se lleve a cabo utilizando distintas herramientas.