La startup de Singapur Acti lanzó recientemente una aplicación de "teclado de agente inteligente" para iOS y Android, tratando de integrar directamente asistentes de IA en la interfaz que los usuarios usan con más frecuencia todos los días: los teclados de los teléfonos inteligentes. Este teclado no solo puede predecir la siguiente palabra, sino que también realiza operaciones activamente en diversas aplicaciones como correo electrónico, mensajería, redes sociales, etc., incorporando una variedad de herramientas de inteligencia artificial directamente a escenarios de aplicaciones existentes.

El fundador y director ejecutivo de Acti, Wang Yang, dijo que cuando usan IA, los usuarios a menudo necesitan cambiar con frecuencia entre múltiples aplicaciones: chatear o escribir correos electrónicos mientras abren una aplicación de IA separada para obtener ayuda. En su opinión, esta experiencia fragmentada limita la eficiencia real del agente de IA. La idea de Acti es hacer que el teclado "abarque todas las aplicaciones" y crear una capa de contexto que realmente pertenezca al usuario y no a la plataforma. Esto es lo que él cree que es "la base de toda la era de los agentes de IA".

A diferencia del modelo tradicional que se basa en chatbots independientes o aplicaciones de IA, Acti demuestra otra forma para que los usuarios adopten la IA: integrando profundamente la IA en las interfaces existentes en lugar de agregar una nueva interfaz. Por ejemplo, cuando un amigo pregunta sobre un lugar cercano para comer en un chat, Acti puede llamar y enviar recomendaciones locales directamente desde el teclado; Cuando alguien menciona una acción en la conversación, el usuario puede usar directamente el teclado para compartir los precios de las acciones en tiempo real sin tener que salir de la aplicación de chat para buscar.

En términos de tecnología subyacente, Acti cuenta con el respaldo del modelo Gemini de Google. Wang Yang dijo que eligió este modelo por su equilibrio entre nivel de inteligencia, velocidad de respuesta, confiabilidad, rendimiento multilingüe y rentabilidad. Gemini también está adaptado a una de las funciones principales de Acti, "Skills", que es un mecanismo similar a la personalización de teclas de acceso directo. Los usuarios pueden configurar tareas de varios pasos para una determinada clave, como traducir mensajes con un solo clic o compartir enlaces de reuniones con un solo clic. El proceso automatizado correspondiente se puede generar mediante descripción en lenguaje natural.


Acti enfatiza que su diseño sigue el principio de "primero lo local" y el contexto personal del usuario se guarda en el dispositivo local de forma predeterminada para proteger la privacidad. Los funcionarios declararon que la aplicación no accederá ni almacenará la información privada, las conversaciones o el contexto personal del usuario, a menos que el usuario llame activamente a una función que requiera procesamiento en la nube, momento en el cual los datos relevantes se cargarán y procesarán dentro del alcance necesario.

Wang Yang trabajó anteriormente en Baidu durante diez años, participando y promoviendo el desarrollo del teclado Facemoji, haciendo que sus usuarios activos diarios superen los 300 millones. Esta experiencia también lo llevó a repensar el papel del teclado en la era de la IA. Él cree que la aparición de grandes modelos significa que "el texto ya no es sólo un contenido de entrada, sino un portador de intenciones". En muchos escenarios cotidianos, estas intenciones pueden traducirse directamente en acciones. Por tanto, es hora de "reinventar" este producto básico que los usuarios de todo el mundo utilizan a diario: el teclado.


En términos de modelo de negocio, Acti aún se encuentra en la etapa de formación. La compañía planea generar ingresos a través de tarifas de suscripción y brindar a los usuarios de pago un soporte de modelo más potente, un límite de uso diario más alto y otras funciones avanzadas. Actualmente, algunas habilidades básicas están preestablecidas en la aplicación. Por ejemplo, presionar prolongadamente la letra "T" puede traducir el mensaje actual a otro idioma, presionar prolongadamente "C" puede enviar rápidamente un enlace de reunión, etc., lo que reduce el umbral para que los usuarios comunes utilicen funciones de automatización complejas.

Vale la pena señalar que los usuarios no necesitan tener conocimientos de programación para crear sus propias habilidades. Solo necesitan usar lenguaje natural para describir las operaciones que desean que complete el teclado, y Acti puede crear automáticamente las tareas de varios pasos correspondientes. Durante la fase beta cerrada antes del lanzamiento oficial, los primeros usuarios crearon más de 1000 habilidades en menos de dos semanas. Estas habilidades se pueden usar solo para uso personal o se pueden compartir públicamente en Acti's Skill Market para que otros usuarios las encuentren y las utilicen, como acceder a datos de la Copa Mundial en tiempo real, obtener enlaces de Polymarket, etc.