OpenAI هفته گذشته چیزی کاملاً شگفت انگیز را اعلام کرد و پیامدهای بلندمدت قابل توجهی برای چاپ و طراحی سه بعدی دارد.
چه چیزی را اعلام کردند؟ به یاد بیاورید که OpenAI ChatGPT را ارائه می دهد که پاسخ های متنی شگفت انگیزی ایجاد می کند و DALL-E که تصاویر شگفت انگیزی را از پیام های متنی تولید می کند.
هفته گذشته آنها “Sora” را اعلام کردند، یک راه حل متن به ویدئو. شما یک اعلان متنی را وارد میکنید که توضیح میدهد چه چیزی باید در ویدیو ظاهر شود، و سپس تولید میشود.
این تابعی است که برای مدتی وجود داشته است، اما دو تفاوت عمده در اینجا وجود دارد. اما قبل از پرداختن به آن، لطفا چند لحظه به تماشای این سری از نمونههای Sora از OpenAI اختصاص دهید:
تفاوتها از راهحلهای متن دیگر تا ویدیو بسیار عمیق است. ابتدا متوجه خواهید شد که نماها واضح و ثابت هستند. برای مثال، هیچ نمونهای از شکلگیری چهرهها در پسزمینه وجود ندارد.
ممکن است فکر کنید اینها نمونه های پخته شده ای هستند، اما در یک کنفرانس مطبوعاتی اخیر، OpenAI از درخواست هایی که از مخاطبان فریاد می زدند مثال زد و آنها را در زمان واقعی با نتایج مشابه تولید کرد. به نظر می رسد کار می کند.
تفاوت دوم ظریف تر و بسیار مهم تر است.
اگر ویدیوی بالا را تماشا کردید، متوجه خواهید شد که حرکت زیادی وجود دارد و همه آن حرکت به درستی اجرا شده است. انگار سورا به نوعی فیزیک حرکت را درک می کند. به این ترتیب می تواند حرکت صحیح ایجاد کند.
ناظران حدس می زنند که سورا ممکن است با ورودی مصنوعی (یعنی داده های ویدیویی تولید شده عمدی، به جای “موارد یافت شده در اینترنت”) آموزش دیده باشد. و این داده های ویدئویی مصنوعی ممکن است توسط یک موتور بازی مانند Unreal یا Unity تولید شده باشد که می تواند فیزیک را پیاده سازی کند.
به عبارت دیگر، گمان می رود که سورا با مشاهدات مکرر فیزیک را “یاد گرفته است”.
در ویدئو، یک بخش شامل اعلان خیالی است:
“ویدئوی نزدیک عکاسی از دو کشتی دزدان دریایی که در حال نبرد با یکدیگر در حال حرکت در داخل یک فنجان قهوه هستند.”
تصویر بالا از آنجاست.
اما این را دریافت کنید: حرکت سیال تقریباً کامل است. شبیه سازی نشده بود: بود تصور کرد توسط سورا
حرکت سیال یکی از بسیاری از رشته های مهندسی است که اغلب برای کمک به طراحی مدل های سه بعدی برای چاپ استفاده می شود.
در حالی که Sora برای تولید ویدئو طراحی شده است، اکنون بسیار واضح به نظر میرسد که میتوان از نوعی از این رویکرد برای تولید مدلهای سه بعدی استفاده کرد که طرحهای مکانیکی پیچیده را پیادهسازی میکنند. اگر بتوان یک هوش مصنوعی را برای تجسم حرکت سیال آموزش داد، میتوان آن را برای رشتههای مختلف مهندسی نیز آموزش داد. این شبیه طراحی مولد است، به جز ساده تر – و به منابع محاسباتی بسیار بسیار کمتری نیاز دارد.
پس از دیدن نبرد کشتیهای قهوه، و فکر کردن به آن، اکنون متقاعد شدهام که ظرف چند سال یا کمتر این نوع عملکرد میتواند در دسترس باشد.
اگر این اتفاق بیفتد، ما میتوانیم شاهد انبوهی از طرحهای شگفتانگیز برای بسیاری از برنامهها باشیم.
از طریق OpenAI
منبع: https://www.fabbaloo.com/news/sora-how-openais-latest-innovation-could-transform-3d-design-and-printing