شروع کمپین تخفیف های ویژه

| تا 50 درصد تخفیف خدمات و آموزش ها

sora, مدل هوش مصنوعی قدرتمند ساخت ویدیو از متن openai

هوش مصنوعی ساخت ویدیو sora

خواندن این مطلب

12 دقیقه

زمان میبرد!

sora, مدل هوش مصنوعی قدرتمند ساخت ویدیو از متن openai

هوش مصنوعی یکی از ترندترین موضوعات امروز جهان است.این ابزار امروزه در خیلی از کارها مانند ادیت عکس، تدوین فیلم، طراحی سایت ، سئو و … به کار می رود اما ساختن ویدیو از متن با کمک هوش مصنوعی، از جمله سرگرم کننده ترین کارها برای کاربران عمومیست.  شرکت های مختلفی مانند ،open ai ,runway ، pika ، stable difussion، و  تیک تاک و علی بابا نیز در این رقابت حضور دارند و همه آنها در تلاش برای توسعه بهترین هوش مصنوعی ساخت ویدیو با استفاده از ورودی های مختلف مانند متن و عکس و ویدیو هستند.

شرکت openai که در یک سال گذشته با معرفی gpt4 و پلاگین ها و قابلیت استفاده همزمان از چندین پلاگین ،معرفی  dall-e3 با قدرت ساخت تصاویر خارق العاده که در بینگ و کوپایلت ماکروسافت نیز به کار گرفته شد.روز گذشته این شرکت مدل ساخت ویدیو خود با نام sora را معرفی کرد که قادر به ساخت ویدیوهایی به طول یک دقیقه با دقت و جزئیات بی نظیر است. 

کیفیت ویدیوهای ساخته شده با استفاده از sora به حدی زیاد که سخت است باور کنیم کمتر یک سال قبل بود که خروجی ابزارهای ساخت ویدیو چیزی شبیه به این ویدیو بود!

نمونه ویدیوهای ساخته شده با sora

در ابتدا بگذارید باهم برخی از ویدیوهای ساخته شده با کمک این مدل خارق العاده را تماشا کنیم

prompt: Prompt: A drone camera circles around a beautiful historic church built on a rocky outcropping along the Amalfi Coast, the view showcases historic and magnificent architectural details and tiered pathways and patios, waves are seen crashing against the rocks below as the view overlooks the horizon of the coastal waters and hilly landscapes of the Amalfi Coast Italy, several distant people are seen walking and enjoying vistas on patios of the dramatic ocean views, the warm glow of the afternoon sun creates a magical and romantic feeling to the scene, the view is stunning captured with beautiful photography.

Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.

Prompt: Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.

Prompt: A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.

Prompt: Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.

Prompt: The camera rotates around a large stack of vintage televisions all showing different programs — 1950s sci-fi movies, horror movies, news, static, a 1970s sitcom, etc, set inside a large New York museum gallery.

Prompt: A cartoon kangaroo disco dances.

Prompt: Extreme close up of a 24 year old woman’s eye blinking, standing in Marrakech during magic hour, cinematic film shot in 70mm, depth of field, vivid colors, cinematic

Prompt: The story of a robot’s life in a cyberpunk setting.

Prompt: New York City submerged like Atlantis. Fish, whales, sea turtles and sharks swim through the streets of New York.

Prompt: A Chinese Lunar New Year celebration video with Chinese Dragon.

Prompt: Step-printing scene of a person running, cinematic film shot in 35mm.

Prompt: Tour of an art gallery with many beautiful works of art in different styles.

Prompt: 3D animation of a small, round, fluffy creature with big, expressive eyes explores a vibrant, enchanted forest. The creature, a whimsical blend of a rabbit and a squirrel, has soft blue fur and a bushy, striped tail. It hops along a sparkling stream, its eyes wide with wonder. The forest is alive with magical elements: flowers that glow and change colors, trees with leaves in shades of purple and silver, and small floating lights that resemble fireflies. The creature stops to interact playfully with a group of tiny, fairy-like beings dancing around a mushroom ring. The creature looks up in awe at a large, glowing tree that seems to be the heart of the forest.

Prompt: Borneo wildlife on the Kinabatangan River

Prompt: Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.
Prompt: Historical footage of California during the gold rush.
Prompt: A large orange octopus is seen resting on the bottom of the ocean floor, blending in with the sandy and rocky terrain. Its tentacles are spread out around its body, and its eyes are closed. The octopus is unaware of a king crab that is crawling towards it from behind a rock, its claws raised and ready to attack. The crab is brown and spiny, with long legs and antennae. The scene is captured from a wide angle, showing the vastness and depth of the ocean. The water is clear and blue, with rays of sunlight filtering through. The shot is sharp and crisp, with a high dynamic range. The octopus and the crab are in focus, while the background is slightly blurred, creating a depth of field effect.

البته هوش مصنوعی sora هنوز به صورت عمومی در دسترس قرار نگرفته.

سورا در اختیار گروه‌های red teamers قرار می‌گیرد تا به ارزیابی خطرات و آسیب‌های احتمالی این فناوری کمک کنند. همچنین دسترسی به این مدل برای تعدادی از هنرمندان، طراحان و فیلمسازان فراهم شده است تا از بازخورد آن‌ها برای پیشرفت و بهبود سورا و تبدیل آن به ابزاری کاربردی‌تر برای متخصصان حوزه‌های خلاقانه استفاده شود.

این اقدام، یعنی به اشتراک گذاشتن پیشرفت‌های تحقیقاتی در مراحل اولیه، با هدف تعامل و دریافت بازخورد از افراد خارج از اوپن‌ای‌آی و آگاهی‌رسانی به عموم مردم در مورد چشم‌انداز و توانایی‌های هوش مصنوعی صورت می گیرد.

مدل هوش مصنوعی سورا، دارای درک عمیقی از زبان است که به آن امکان می‌دهد دستورهای متنی را با دقت تفسیر و شخصیت‌های جذابی با احساسات پویا خلق کند. علاوه بر این، سورا قادر است یک ویدیوی واحد با چندین نما ایجاد کند که در آن‌ها، هم به شخصیت‌ها و هم به سبک بصری پایبند می‌ماند.

دیدن سرعت پیشرفت ابزارهای ساخت ویدیو، نویدبخش این است که تا یک سال آینده، به سادگی میتونیم ویدیوهایی بسیار باکیفیت تولید کنیم و انقلابی در شیوه ساخت بسیار از انیمیشن ها، ویدیوها ، جلوه های ویژه و به صورت کلی فرآیند تولید محتوای ویدیویی اتفاق خواهد افتاد.

سورا از تکنیک دیفیوژن استفاده میکند یعنی با نویز شروع کرده به تدریج جزئیات را اضافه می‌کند تا زمانی که ویدئویی کامل و باکیفیت خلق شود.

برخی از قابلیت‌های سورا:

  • تولید ویدئوهای کامل: سورا می‌تواند ویدئوهایی با طول تقریبی یک دقیقه و در ژانرهای مختلف مانند علمی تخیلی، فانتزی، مستند و … تولید کند.
  • حفظ انسجام: سورا می‌تواند داستانی منسجم و منطقی را در ویدئو روایت کند، حتی اگر متن ورودی کوتاه و مبهم باشد.
  • کنترل دقیق: شما می‌توانید با استفاده از دستورات متنی، جزئیات مختلف ویدئو مانند زاویه دوربین، حرکت اشیاء و حالات چهره شخصیت‌ها را کنترل کنید.
  • خلاقیت بی‌حد: سورا می‌تواند ویدئوهایی خلاقانه و بدیع تولید کند که فراتر از تصورات شما باشند.

کاربردهای سورا:

  • تولید محتوای ویدئویی: سورا می‌تواند برای تولید انواع محتوای ویدئویی، از جمله فیلم‌های کوتاه، تبلیغات، تیزر، ویدئوهای آموزشی و … استفاده شود.
  • سرگرمی: سورا می‌تواند برای تولید انیمیشن، بازی‌های ویدئویی و محتوای سرگرم‌کننده دیگر استفاده شود.
  • آموزش: سورا می‌تواند برای تولید محتوای آموزشی، مانند ویدئوهای آموزشی، شبیه‌سازی‌ها و … استفاده شود.
  • تحقیق و توسعه: سورا می‌تواند برای تحقیق و توسعه در زمینه‌های مختلف، مانند هوش مصنوعی، بینایی کامپیوتر، و … استفاده شود.

آینده سورا:

سورا هنوز در مراحل اولیه توسعه قرار دارد، اما پتانسیل‌های فراوانی برای تغییر نحوه تولید محتوای ویدئویی در آینده دارد.

شما چه فکر می‌کنید؟

آیا سورا می‌تواند دنیای خلاقیت را متحول کند؟ نظرات و ایده‌های خود را با ما در میان بگذارید

درباره نویسنــده
نویسنده
مدیر سایت
نظرات کاربـــران
فاقد دیدگاه
دیدگاهی برای این مطلب ثبت نشده است. اولین دیدگاه را شما بنویسید.
ثبت دیدگاه
captcha

دسته بندی مطالب

محصولات جدید

جستجو کنید ...

تبلیغات