SHARP de Apple puede convertir fotos en escenas 3D en un segundo

manzanaEl desarrollo de la inteligencia artificial ha sido muy ridiculizado, pero ¿podrá el gigante de Cupertino convertirse inesperadamente en líder en 3D impulsado por IA? Muchas empresas de tecnología están trabajando en herramientas que hacen que sea más fácil y rápido crear escenas, entornos y gemelos digitales en 3D, y Apple acaba de dar un gran salto adelante.
SHARP es un modelo experimental de IA que convierte rápidamente imágenes 2D en mapas gaussianos 3D, que luego se pueden ver en Vision Pro. Algunos ahora creen que a través de una combinación de hardware y software, Apple puede tener una ventaja en el desarrollo de flujos de trabajo 3D impulsados por IA.
La gente subestima a @Apple en IA. Simplemente ejecuté el nuevo modelo SHARP de Apple localmente, vi mis fotos convertirse en manchas gaussianas 3D en segundos y luego las encontré en Vision Pro. Se sintió como el comienzo de algo especial. Realmente tienes que probarlo. pic.twitter.com/cEVYAsZyzd17 de diciembre de 2025
En lugar de los polígonos tradicionales, Gaussian Spray representa y renderiza escenas 3D complejas en tiempo real utilizando millones de elipsoides 3D difusos con posiciones, tamaños, orientaciones, colores y transparencia definidos para que parezcan muy precisos desde una perspectiva específica.
La mayoría de las técnicas requieren una gran cantidad (a veces cientos) de imágenes de una escena tomadas desde diferentes ángulos (consulte nuestra selección de El mejor escáner 3D). Pero SHARP de Apple utiliza inteligencia artificial para predecir una escena a partir de una fotografía en un segundo en una GPU estándar.
Apple entrenó a SHARP utilizando grandes cantidades de datos sintéticos y reales, enseñándole a reconocer patrones geométricos y de profundidad frecuentes para que pudiera predecir la posición y apariencia de gaussianos 3D en un solo paso hacia adelante de la red neuronal.
de acuerdo a trabajo de investigaciónla distancia y la escala siguen siendo consistentes en el mundo real. La representación es métrica, tiene escala absoluta y admite movimientos de cámara métricos.
El compromiso es que SHARP sólo representa con precisión puntos de vista cercanos, no partes invisibles de la escena, lo que significa que el usuario no puede aventurarse lejos de ese punto de vista.
El código se puede encontrar en GitHubla gente ha estado probando la herramienta y compartiendo los resultados en las redes sociales (ver más abajo). Otros se preguntaron por qué Apple optó por ilustrar el modelo con una imagen de un caballo que aparecía
La generación de símbolos gaussianos comienza en 2 segundos (más rápido en GPU de alta gama), utilizando el código “Sharp Monocular View Synthesis in Sub-Second” de Apple, que se ejecuta de forma nativa en mi sistema. Importado a Octane Render 2026, que presenta una representación totalmente trazada con símbolos gaussianos. Similar a… pic.twitter.com/YhTXHb4Wpm18 de diciembre de 2025
La generación de símbolos gaussianos comienza en 2 segundos (más rápido en GPU de alta gama), utilizando el código “Sharp Monocular View Synthesis in Sub-Second” de Apple, que se ejecuta de forma nativa en mi sistema. Importado a Octane Render 2026, que presenta una representación totalmente trazada con símbolos gaussianos. Similar a… pic.twitter.com/YhTXHb4Wpm18 de diciembre de 2025
El modelo SHARP de Apple genera representaciones gaussianas 3D realistas a partir de una sola imagen en segundos. GitHub: https://t.co/wU6yTWRdClPaper: https://t.co/xUtr40pEJ9SHARP NVS realista a partir de una sola foto mediante la regresión de parámetros gaussianos 3D con un solo paso NN fwd (<1 s en GPU estándar). pic.twitter.com/Wo6EyZIPvL17 de diciembre de 2025
También lanzado esta semana El eco de la IA espacialque convierte imágenes 2D en mundos 3D editables donde los usuarios pueden aplicar diferentes estilos. La compañía espera agregar manipulación de escena completa basada en indicaciones, permitiendo a los usuarios agregar, eliminar, reorganizar o rediseñar objetos.