El control predictivo basado en videos de Rhoda AI podría cerrar la brecha entre la realidad de los robots y las expectativas de los usuarios. Los inversores están apostando mucho por esto.
El principal desafío para la robótica es el “gap de realidad”. Los robots industriales tradicionales son excelentes en tareas rígidas y programadas de antemano, pero no funcionan bien en entornos reales, fuera de los laboratorios controlados. Los modelos de IA más recientes muestran cierta promesa, pero tienen dificultades para manejar el mundo caótico e impredecible de las fábricas y almacenes reales. El problema radica en los datos. La mayoría de los sistemas dependen de la teleoperación, donde los humanos guían a los robots mediante dispositivos especializados. Esto crea un conjunto de datos limitado, que no es suficiente para enseñar a los robots cómo adaptarse a nuevos objetos, cambios en el diseño de los espacios o fallas inesperadas.
La solución de Rhoda AI representa un cambio fundamental en los enfoques utilizados para el procesamiento de datos. En lugar de comenzar desde cero, con el uso de telemetría de robots, Rhoda entrena previamente sus modelos.Vídeos a escala de internet: cientos de millones de vídeos.Este enorme conjunto de datos proporciona una información valiosa y naturalista sobre el movimiento, la física y las interacciones físicas. La arquitectura de la empresa, llamada Direct Video Action (DVA), aprende a predecir los estados futuros del video a partir de su vista actual. Luego, estas predicciones se transforman directamente en acciones del robot, en un proceso continuo y de bucle cerrado. Este es un paso hacia un control basado en datos, en lugar de un control que depende únicamente de señales teleoperativas limitadas en cantidad de datos.

El resultado es un sistema diseñado para ser generalizable. Como señala el CEO Jagdeep Singh, un modelo de teleoperación podría fallar si la orientación del teléfono cambia. Pero un modelo entrenado mediante video puede manejar innumerables variantes del mismo objeto. Ha aprendido los principios subyacentes sobre cómo las cosas se mueven e interactúan entre sí. Este conocimiento previo sobre el movimiento permite que los modelos de Rhoda aprendan nuevas tareas de manera eficiente. A menudo, basta con solo diez horas de datos obtenidos durante la teleoperación para que el modelo se haya entrenado completamente. Basado en esta base, FutureVision funciona como un modelo de referencia: una capa de inteligencia cuyo objetivo es permitir que los robots puedan funcionar de forma autónoma, y que eventualmente pueda ser utilizado en diferentes plataformas de hardware.
Este enfoque se centra en la capa de infraestructura, que es importante para los robots de uso general. Al enseñar a las máquinas a comprender la física del mundo a partir de la vasta biblioteca de datos relacionados con las actividades humanas, Rhoda busca crear las bases para una nueva generación de robots adaptables y capaces de operar en el mundo real. La apuesta de 450 millones de dólares por parte de inversores como Premji Invest y Khosla Ventures indica que existe confianza en que este paradigma predictivo podría finalmente cerrar la brecha entre las demostraciones en el laboratorio y la implementación en entornos industriales.
La apuesta por la infraestructura: Financiamiento y enfoque técnico
La magnitud de la inversión en sí misma es un indicio importante. Rhoda AI ha logrado recaudar…450 millones de dólares en financiación de la serie A.Una apuesta masiva que valora a la startup en…1.7 mil millonesEsto no es simplemente una inversión inicial; se trata de capital que sirve para construir la infraestructura necesaria para un nuevo paradigma en el campo de la robótica. Esta ronda de financiación, liderada por Premji Invest y respaldada por Khosla Ventures y otras empresas, demuestra una profunda convicción de que el enfoque basado en la predicción por vídeo puede finalmente cerrar la brecha entre la realidad y lo que se espera lograr.
El camino técnico que se sigue es un híbrido deliberado. El núcleo de Rhoda es un sistema de Acción por Vídeo Directo (Direct Video Action o DVA), que se entrena con los vastos datos naturalistas de cientos de millones de vídeos en Internet. Esto proporciona una comprensión amplia sobre cómo los objetos se mueven, interactúan y fallan. La teleoperación, por sí sola, no puede ofrecer tal conocimiento. Luego, el modelo utiliza una cantidad reducida de datos de telemetría del robot para su ajuste fino. De esta manera, el sistema aprende de la realidad compleja del mundo, mientras que también está calibrado para funcionar con hardware específico. Como explica Jagdeep Singh, como director ejecutivo, esto permite que el modelo pueda generalizar en diferentes orientaciones y casos especiales, algo que los datos sintéticos no pueden replicar.
La señal de liderazgo es clara: Singh fue exdirector ejecutivo de QuantumScape, una empresa que logró desarrollar una tecnología de baterías compleja y avanzada. Sus resultados anteriores indican que se centra en los desafíos operativos e ingenieriles relacionados con la introducción de un producto físico en el mercado, no solo de algoritmos. Sin embargo, la información pública sobre la empresa sigue siendo escasa. A pesar de los fondos recibidos y de la demostración reciente de una plataforma para manipulación manual, Rhoda no ha revelado datos específicos sobre sus métricas de rendimiento, especificaciones del hardware ni un plan detallado para su desarrollo. La empresa menciona que planea licenciar su modelo de IA y desarrollar su propio hardware, pero los plazos para estos procesos son inciertos. La empresa dice que “pronto habrá más información”. Esto crea una tensión típica de las etapas iniciales: los grandes fondos invertidos financiarán el desarrollo a largo plazo, pero la falta de metas a corto plazo significa que los inversores están apostando mucho en un futuro que aún está por definirse.
Pruebas operativas y el “flywheel de datos”
La promesa teórica del control predictivo por video ahora ha superado su primer test operativo. Rhoda AI ha demostrado cómo los robots pueden operar de manera autónoma en entornos de producción, donde es necesario que los robots se desplachen entre materiales y procesos de trabajo en constante cambio. En una reciente evaluación de la fabricación de alta volumen, el sistema logró completar el proceso de elaboración de un componente de manera eficiente.Menos de dos minutos por ciclo.Sin intervención humana, se superan los objetivos de rendimiento de los clientes. Este es un hito importante. Demuestra que la arquitectura DVA puede manejar las variaciones y las presiones propias de la producción en el mundo real. Se pasa así de las demostraciones en laboratorio a una situación real y repetible.
La eficiencia de este método de aprendizaje es igualmente impresionante. El sistema cuenta con una gran capacidad para predecir los movimientos del robot, lo que le permite aprender nuevas tareas con una economía de datos notable. A menudo, basta con solo diez horas de datos obtenidos durante la teleoperación después del entrenamiento. Esto representa un marcado contraste con los enfoques que requieren grandes conjuntos de datos sobre las trayectorias específicas del robot. Esto indica que el modelo base de Rhoda no solo es inteligente, sino también práctico para su rápida implementación en diversas tareas industriales.
Esto conduce al principal beneficio estratégico: un “flywheel de datos”. Premji Invest señala que la primera empresa que implemente este modelo a gran escala iniciará un ciclo poderoso. Cada implementación real captura todos los casos excepcionales, objetos insólitos, fallas inesperadas e interacciones imposibles de simular o predecir en el laboratorio. Cada nueva implementación envía más datos al modelo, mejorando su capacidad de análisis y haciéndolo más robusto para las próximas tareas. Esto crea una ventaja acumulativa, donde la escala genera una mayor inteligencia, lo que a su vez permite una mayor escalabilidad. La arquitectura de Rhoda está diseñada específicamente para capturar este ciclo de retroalimentación, convirtiendo la experiencia operativa en una fuente de ventajas duraderas.
En resumen, Rhoda ha pasado de la fase de concepto a la fase de pruebas. Los primeros resultados indican que el sistema funciona bien en la producción y aprende de manera eficiente. La próxima fase será la escalación de estas implementaciones, con el objetivo de activar el “giroscopio de datos” y verificar si este enfoque de predicción por video puede convertirse en la infraestructura necesaria para una nueva generación de robots adaptables.
Modelo de negocio y factores que impulsan el mercado
El modelo de negocio emergente de Rhoda AI indica una cambio fundamental en la forma en que se adquiere e implementa la automatización industrial. Sandesh Patnam, de Premji Invest, ve potencial en esto.Modelo de negocio de robots como servicioEn este modelo, los clientes pueden alquilar el hardware y el software, en lugar de incurrir en una gran inversión inicial. Este modelo de gastos operativos reduce la barrera de entrada para los fabricantes, lo que facilita la adopción de robots adaptables para tareas específicas, sin el riesgo de quedarse con capital no utilizado. Esto también se alinea con el objetivo de la empresa de licenciar su modelo base de IA, generando así una fuente de ingresos recurrentes a medida que más clientes utilizan estos robots.
El catalizador de este modelo es una poderosa tendencia geopolítica y económica: el esfuerzo de los Estados Unidos por llevar la fabricación sofisticada a territorio nacional. Como señala Patnam, tal oferta tecnológica es cada vez más importante, ya que los Estados Unidos intentan llevar más actividades de fabricación al interior de su territorio. Esta demanda impulsada por políticas crea una clara necesidad en el mercado de robots capaces de manejar tareas complejas y variables en entornos nuevos y poco predecibles. El sistema de control predictivo de Rhoda, diseñado para funcionar en condiciones desconocidas, aborda directamente el principal desafío de la implementación de robots en estos entornos. El desarrollo de hardware por parte de la empresa constituye una estrategia para controlar esta implementación y así capturar los datos necesarios.
Esta oportunidad existe dentro de un contexto más amplio de auge en el sector de la tecnología de inteligencia artificial, lo que está fomentando las inversiones en este campo. Rhoda se une a una serie de empresas humanoides bien financiadas, como Genesis AI y Figure AI. Todas ellas luchan por desarrollar la próxima generación de sistemas de inteligencia artificial. El auge de la tecnología de inteligencia artificial también ha influido en este ámbito tan complejo. Empresas como Rhoda y Genesis han logrado obtener recursos necesarios para seguir avanzando en su trabajo.Cientos de millones de dólares en financiamiento nuevo.Se trata de desarrollar seres humanoides. Este flujo de capital valida el cambio de paradigma que Rhoda está buscando implementar. Pero, al mismo tiempo, también intensifica la competencia por los talentos y por los socios que puedan colaborar en la implementación de este concepto en el mundo real.
En resumen, Rhoda se encuentra en el punto de intersección entre tres fuerzas poderosas: un nuevo modelo de negocio basado en software; una demanda de la parte política para que las operaciones se realicen en otros países; y una ola de capital que busca inversiones en tecnologías relacionadas con la inteligencia artificial física. El éxito de Rhoda dependerá de cómo logre pasar de las pruebas conceptuales a implementaciones escalables que generen datos útiles, y que puedan demostrar la viabilidad económica de su modelo de negocio de robots como servicio.
Valoración y trayectoria de adopción exponencial
La valoración de 1.700 millones de dólares se basa en un cambio paradigmático exitoso. Se asume que el sistema de control predictivo por video de Rhoda AI puede realmente superar la brecha entre la realidad y los sistemas artificiales, convirtiéndose así en una infraestructura fundamental para los robots adaptables. Sin embargo, el verdadero indicador es la tasa de adopción de esta plataforma una vez que sea implementada. El éxito depende de lograr una “tasa de generalización” suficientemente alta, desde las tareas realizadas con video hasta las tareas del mundo real. Esto justifica el costo enorme que implica el entrenamiento y la implementación de estos sistemas. Lo importante es la velocidad con la que se implementan estas soluciones en el mundo real. Si no se logra superar las demostraciones en laboratorio, entonces la hipótesis de que existe una brecha entre la realidad y los sistemas artificiales se verá confirmada, lo que haría que la valoración de este proyecto sea algo costoso desde el punto de vista teórico.
El caso de inversión se basa en la adopción exponencial del modelo. La arquitectura de Rhoda está diseñada para funcionar como un “giroscopio de datos”: cada implementación en el mundo real captura los detalles de los casos especiales que refinan el modelo, lo que lo hace más robusto para las próximas tareas. Esto crea una ventaja acumulativa: al aumentar la escala, se obtiene una mayor inteligencia, lo que a su vez permite una mayor escalabilidad. La empresa tiene planes de licenciar su modelo de IA, lo cual podría acelerar su adopción por parte de los partners, quienes podrán utilizarlo en su propio hardware. Los 450 millones de dólares destinados a este fin sirven para financiar este proceso, pero la prueba está en las prácticas operativas.
Los primeros resultados son prometedores, pero aún no se han obtenido resultados exponenciales. La capacidad del sistema para aprender nuevas tareas es…Menos de dos minutos por ciclo.Con tan solo diez horas de datos obtenidos durante la teleoperación, se puede observar una alta eficiencia en el uso de dichos datos. Este es un requisito previo para una escalabilidad rápida. Sin embargo, la empresa no ha revelado métricas específicas ni un plan detallado para la escalabilidad de las implementaciones. La falta de objetivos a corto plazo significa que el mercado está valorando el éxito futuro, no la ejecución actual.
En resumen, Rhoda está trabajando en el desarrollo de soluciones para una adopción generalizada de la robótica. La valoración de la empresa refleja la creencia de que el control predictivo por medio de videos eventualmente se convertirá en el estándar. Pero ese cambio requiere pasar de un modelo basado en pruebas conceptuales a un modelo de implementación con alto volumen de datos generados. Los próximos trimestres serán un test para ver si la empresa puede activar rápidamente su sistema de generación de datos, lo cual justificará su lugar en la capa de infraestructura. Por ahora, la trayectoria del precio de las acciones está relacionada con la velocidad con la que se producirá ese cambio en el mundo real.



Comentarios
Aún no hay comentarios