La herramienta de generación de videos SORA de Openai produce salidas tan buenas que podría cuestionar la realidad, pero la mayor parte de lo que genera es tan antinatural que puede detectarlo fácilmente. Entonces, si desea mejores videos de Sora AI, pruebe estos consejos y técnicas de suministro de Sora para una mejora instantánea.
3
Centrarse en el estilo y la estética
Sora es una de las muchas herramientas de texto a video de IA, pero proviene del jugador más grande en el mercado de IA, OpenAi.
Sora parece comprender el «ambiente» de sus indicaciones mejor que los detalles altamente específicos. Escribí un aviso bastante específico para obtener una foto dramática de un vaquero, «Muestre a un vaquero dramático dando una sonrisa coqueta mientras levantaba sus botas», y la sonrisa y el levantamiento de botas nunca se materializaron, pero la toma fue dramática y limpia.
Del mismo modo, di otro aviso con una dirección estilística específica: «Al estilo de una película de terror de imágenes encontradas, muestre a un lindo gatito que se acerca al espectador en un callejón oscuro». Este aviso capturó la estética de una película de terror encontrada, pero el gatito en cuestión se alejaba de la cámara, y su cabeza seguía girando para mirar la cámara.
Por último, intenté un aviso más tonto de algo que no puede suceder en la vida real: «T-Rex caminando por el cruce de ondas de Shibuya en Tokio». He pasado una cantidad considerable de tiempo en este lugar específico, y la salida de este aviso tiene algunos defectos. Por ejemplo, captura el «ambiente» de Shibuya con una estética incorrecta, y el T-Rex es de dibujos animados y estacionarios.
Incluso cuando solicitó que el T-Rex se vea más fotorrealista y realmente caminara, permaneció estacionario, y Shibuya permaneció en el Valle extraño.
2
Limitar la complejidad para los resultados más limpios
Evidentemente, Sora y otras herramientas de video AI (algunas de las cuales son gratuitas) no manejan bien el movimiento o acción compleja. Es posible que haya visto videos curados, aparentemente de alta calidad, generados por IA que hacen olas en las redes sociales, como el video «Egipto 3099» realizado con Kling AI. En casi todos estos casos, mientras que la estética generalmente es limpia e impresionante, el movimiento y la complejidad suelen ser extremadamente limitados.
El ejemplo de «Egipto 3099» es particularmente impresionante, pero solo porque, ya sea intencionalmente o no, cualquier indicación del Creador limitó el movimiento e interacciones complejas. En consecuencia, cualquier complejidad en su aviso debe dedicarse a describir el estilo estético de su video Sora, y el movimiento, las acciones y la interacción del objeto deben mantenerse simples.
1
Sora no maneja bien las interacciones de los objetos
Un área de complejidad que SORA maneja particularmente mal es la interacción del objeto. La física de casi cualquier objeto en movimiento en un video SORA se ve muy antinatural, aunque cómico. Inicié el clásico indicador de «Will Smith comiendo espagueti», y en la mayoría de los casos, las interacciones de los objetos son altamente antinaturales. En el ejemplo de Will Smith, la persona no se parece a Will Smith en absoluto, y el espagueti aparentemente es absorbido por la bifurcación.
Hice varios intentos de diseñar algo en movimiento mientras se veía pasablemente bien. Trabajando dentro de las limitaciones de centrarme en el estilo y limitar la complejidad de la acción, finalmente recibí un resultado decente. El aviso fue «crear un disparo dramático, ancho y panorámico desde una distancia de un caballero montando un caballo a través de un campo medieval al atardecer». Aparte del galope del caballo que se ve un poco antinatural, los resultados son impresionantes.
De lo que impulsé con Sora, mi mejor producción fue el ejemplo de vaquero. Actualmente, las herramientas de video de IA como SORA producen una salida antinatural de baja calidad sin una solicitud muy específica. E incluso con la ingeniería rápida y calificada, debe trabajar dentro de limitaciones relativamente estrictas para que cualquier cosa se vea más natural. Sin embargo, el texto a video de IA está mejorando exponencialmente, y estos videos probablemente serán indistinguibles del video real en unos pocos años, una realidad que viene con la emoción y el miedo para muchos.