Prefacio
D5 Render ha lanzado una nueva función, «D5 SR Image Rendering», en la última versión 2.5. «SR» son las siglas de «Super Resolution», una tecnología de desarrollo propio de la D5 que transforma imágenes de baja resolución en imágenes de alta resolución.
Basado en el algoritmo de generación de imágenes de superresolución de redes neuronales, el D5 SR se combina con mapas de funciones de renderizado multicanal para acelerar significativamente el procesamiento de imágenes.
La tecnología Super Resolution se puede utilizar en una amplia gama de aplicaciones. Por ejemplo, puede mejorar los detalles y la resolución en la renderización de video y, en la renderización en tiempo real, puede aumentar la velocidad de fotogramas para mejorar la experiencia del usuario.
Pero seamos honestos, amplificar la resolución de las imágenes renderizadas sin distorsión siempre ha sido un hueso duro de roer.
Aspectos destacados de la D5 SR
Reconstrucción más realista
Real-SERGAN es un algoritmo de superresolución ciego que no se ha entrenado específicamente para imágenes de renderizado en 3D. Por lo tanto, al duplicar la resolución de las imágenes renderizadas, el sergan real puede tener algunos artefactos obvios, como materiales no naturales.
Sin embargo, este problema está bien abordado con la D5 SR, como se puede ver en las siguientes imágenes de prueba. Esto se debe a que la D5 SR añadió la geometría, el material, la textura y otros datos de este objeto para mejorar la calidad de las imágenes reconstruidas en alta resolución.
Amplíe para comprobar los detalles. Puedes ver que el algoritmo SR sin entrenamiento produce distorsiones graves, como borrones, manchas o texturas anormales, mientras que el D5 SR no lo hace.
Optimizado Reflexiones
Al probar la D5 SR al principio, las imágenes expandidas dos veces perdieron algunos detalles de reflexión.
Tras importar la información de los canales y materiales de reflexión, el D5 SR puede reproducir mejor los reflejos.
Puedes ver la diferencia que se muestra en estas dos escenas.
Eficiencia de renderizado mejorada
Tras activar la D5 SR, observará una velocidad de renderizado mejorada para imágenes de gran resolución.
Tomemos esta escena como ejemplo.
Si renderiza una imagen con una resolución de 16 K (15360 x 8640), necesitará 1 hora y 17 minutos 13 segundos cuando la D5 SR esté apagada y solo 27 minutos después de encenderla, lo que supone un ahorro del 65% del tiempo total.
Cómo usar la D5 SR
Ve a Menú > Preferencias > Widget y activa la «versión beta de renderizado de imágenes D5 SR». Funcionará automáticamente cuando el D5 renderice imágenes sin necesidad de ningún otro ajuste.
Tenga en cuenta que el algoritmo D5 SR solo se activa en imágenes con un tamaño superior a una resolución de 1440 x 1440.
Cómo nació la D5 SR
El equipo de D5 entrena el algoritmo SR con una amplia colección de imágenes generadas por D5. La red neuronal puede utilizar eficazmente la información previa obtenida a partir de estos datos de entrenamiento para proporcionarnos una mejor reconstrucción en alta resolución.
Sin embargo, al principio no teníamos suficiente información sobre escenas 3D, como la geometría, los materiales y las texturas, lo que provocó una brecha entre la reconstrucción y los resultados del renderizado físico. Por lo tanto, introdujimos esta información 3D como funciones de entrada para obtener un mejor resultado.
Técnicamente, el equipo de I+D del D5 ha hecho lo siguiente:
En primer lugar, utilizamos información normal y de albedo de alta resolución para reconstruir la textura y las características geométricas.
Luego incluimos información sobre reflexión, transparencia, metal y rugosidad para optimizar los efectos de reflexión y resaltado.
Para mejorar aún más el resultado de la reconstrucción, utilizamos un nuevo algoritmo. Mejora la red neuronal ESRGAN original y utiliza una red de doble flujo para procesar imágenes originales de baja resolución y gráficos de información de canales de alta resolución, respectivamente. Hemos utilizado la pérdida L1 relativa para mejorar la supervisión de los errores de píxeles y la pérdida de percepción, e introdujimos la pérdida adversa para mejorar el resultado de la superresolución.
Finalmente, utilizamos una estructura de red en forma de U para reemplazar algunos bloques densos residuales en la ESRGAN, a fin de ampliar el rango del campo de detección de la extracción de características de los mapas de información de canales de alta resolución y mejorar aún más la velocidad de inferencia.