sora, مدل هوش مصنوعی قدرتمند ساخت ویدیو از متن openai
- اخبار فناوری
- مدیر سایت
- 12 دقیقه
هوش مصنوعی یکی از ترندترین موضوعات امروز جهان است.این ابزار امروزه در خیلی از کارها مانند ادیت عکس، تدوین فیلم، طراحی سایت ، سئو و … به کار می رود اما ساختن ویدیو از متن با کمک هوش مصنوعی، از جمله سرگرم کننده ترین کارها برای کاربران عمومیست. شرکت های مختلفی مانند ،open ai ,runway ، pika ، stable difussion، و تیک تاک و علی بابا نیز در این رقابت حضور دارند و همه آنها در تلاش برای توسعه بهترین هوش مصنوعی ساخت ویدیو با استفاده از ورودی های مختلف مانند متن و عکس و ویدیو هستند.
شرکت openai که در یک سال گذشته با معرفی gpt4 و پلاگین ها و قابلیت استفاده همزمان از چندین پلاگین ،معرفی dall-e3 با قدرت ساخت تصاویر خارق العاده که در بینگ و کوپایلت ماکروسافت نیز به کار گرفته شد.روز گذشته این شرکت مدل ساخت ویدیو خود با نام sora را معرفی کرد که قادر به ساخت ویدیوهایی به طول یک دقیقه با دقت و جزئیات بی نظیر است.
کیفیت ویدیوهای ساخته شده با استفاده از sora به حدی زیاد که سخت است باور کنیم کمتر یک سال قبل بود که خروجی ابزارهای ساخت ویدیو چیزی شبیه به این ویدیو بود!
نمونه ویدیوهای ساخته شده با sora
در ابتدا بگذارید باهم برخی از ویدیوهای ساخته شده با کمک این مدل خارق العاده را تماشا کنیم
prompt: Prompt: A drone camera circles around a beautiful historic church built on a rocky outcropping along the Amalfi Coast, the view showcases historic and magnificent architectural details and tiered pathways and patios, waves are seen crashing against the rocks below as the view overlooks the horizon of the coastal waters and hilly landscapes of the Amalfi Coast Italy, several distant people are seen walking and enjoying vistas on patios of the dramatic ocean views, the warm glow of the afternoon sun creates a magical and romantic feeling to the scene, the view is stunning captured with beautiful photography.
Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.
Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.
Prompt: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.
Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.
Prompt: The camera rotates around a large stack of vintage televisions all showing different programs — 1950s sci-fi movies, horror movies, news, static, a 1970s sitcom, etc, set inside a large New York museum gallery.
Prompt: A cartoon kangaroo disco dances.
Prompt: Extreme close up of a 24 year old woman’s eye blinking, standing in Marrakech during magic hour, cinematic film shot in 70mm, depth of field, vivid colors, cinematic
Prompt: The story of a robot’s life in a cyberpunk setting.
Prompt: New York City submerged like Atlantis. Fish, whales, sea turtles and sharks swim through the streets of New York.
Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.
Prompt: Step-printing scene of a person running, cinematic film shot in 35mm.
Prompt: Tour of an art gallery with many beautiful works of art in different styles.
Prompt: 3D animation of a small, round, fluffy creature with big, expressive eyes explores a vibrant, enchanted forest. The creature, a whimsical blend of a rabbit and a squirrel, has soft blue fur and a bushy, striped tail. It hops along a sparkling stream, its eyes wide with wonder. The forest is alive with magical elements: flowers that glow and change colors, trees with leaves in shades of purple and silver, and small floating lights that resemble fireflies. The creature stops to interact playfully with a group of tiny, fairy-like beings dancing around a mushroom ring. The creature looks up in awe at a large, glowing tree that seems to be the heart of the forest.
Prompt: Borneo wildlife on the Kinabatangan River
البته هوش مصنوعی sora هنوز به صورت عمومی در دسترس قرار نگرفته.
سورا در اختیار گروههای red teamers قرار میگیرد تا به ارزیابی خطرات و آسیبهای احتمالی این فناوری کمک کنند. همچنین دسترسی به این مدل برای تعدادی از هنرمندان، طراحان و فیلمسازان فراهم شده است تا از بازخورد آنها برای پیشرفت و بهبود سورا و تبدیل آن به ابزاری کاربردیتر برای متخصصان حوزههای خلاقانه استفاده شود.
این اقدام، یعنی به اشتراک گذاشتن پیشرفتهای تحقیقاتی در مراحل اولیه، با هدف تعامل و دریافت بازخورد از افراد خارج از اوپنایآی و آگاهیرسانی به عموم مردم در مورد چشمانداز و تواناییهای هوش مصنوعی صورت می گیرد.
مدل هوش مصنوعی سورا، دارای درک عمیقی از زبان است که به آن امکان میدهد دستورهای متنی را با دقت تفسیر و شخصیتهای جذابی با احساسات پویا خلق کند. علاوه بر این، سورا قادر است یک ویدیوی واحد با چندین نما ایجاد کند که در آنها، هم به شخصیتها و هم به سبک بصری پایبند میماند.
دیدن سرعت پیشرفت ابزارهای ساخت ویدیو، نویدبخش این است که تا یک سال آینده، به سادگی میتونیم ویدیوهایی بسیار باکیفیت تولید کنیم و انقلابی در شیوه ساخت بسیار از انیمیشن ها، ویدیوها ، جلوه های ویژه و به صورت کلی فرآیند تولید محتوای ویدیویی اتفاق خواهد افتاد.
سورا از تکنیک دیفیوژن استفاده میکند یعنی با نویز شروع کرده به تدریج جزئیات را اضافه میکند تا زمانی که ویدئویی کامل و باکیفیت خلق شود.
برخی از قابلیتهای سورا:
- تولید ویدئوهای کامل: سورا میتواند ویدئوهایی با طول تقریبی یک دقیقه و در ژانرهای مختلف مانند علمی تخیلی، فانتزی، مستند و … تولید کند.
- حفظ انسجام: سورا میتواند داستانی منسجم و منطقی را در ویدئو روایت کند، حتی اگر متن ورودی کوتاه و مبهم باشد.
- کنترل دقیق: شما میتوانید با استفاده از دستورات متنی، جزئیات مختلف ویدئو مانند زاویه دوربین، حرکت اشیاء و حالات چهره شخصیتها را کنترل کنید.
- خلاقیت بیحد: سورا میتواند ویدئوهایی خلاقانه و بدیع تولید کند که فراتر از تصورات شما باشند.
کاربردهای سورا:
- تولید محتوای ویدئویی: سورا میتواند برای تولید انواع محتوای ویدئویی، از جمله فیلمهای کوتاه، تبلیغات، تیزر، ویدئوهای آموزشی و … استفاده شود.
- سرگرمی: سورا میتواند برای تولید انیمیشن، بازیهای ویدئویی و محتوای سرگرمکننده دیگر استفاده شود.
- آموزش: سورا میتواند برای تولید محتوای آموزشی، مانند ویدئوهای آموزشی، شبیهسازیها و … استفاده شود.
- تحقیق و توسعه: سورا میتواند برای تحقیق و توسعه در زمینههای مختلف، مانند هوش مصنوعی، بینایی کامپیوتر، و … استفاده شود.
آینده سورا:
سورا هنوز در مراحل اولیه توسعه قرار دارد، اما پتانسیلهای فراوانی برای تغییر نحوه تولید محتوای ویدئویی در آینده دارد.
شما چه فکر میکنید؟
آیا سورا میتواند دنیای خلاقیت را متحول کند؟ نظرات و ایدههای خود را با ما در میان بگذارید