آمازون نسل جدیدی از مدلهای پایه با نام Amazon Nova را معرفی کرده است که میتوانند متن، تصویر و ویدیو را بهعنوان ورودی پردازش کنند. آمازون اعلام کرد که برنامههای کاربردی مبتنی بر این مدلها به کاربران اجازه میدهند تا ویدیوها، نمودارها و اسناد را درک کرده یا محتوای ویدیویی و چندرسانهای دیگر تولید کنند.
مدلهای جدید LLM شامل Nova Micro، مدلی متنمحور است که آمازون ادعا میکند پایینترین تأخیر در پاسخدهی را با هزینه بسیار پایین ارائه میدهد، و Nova Lite، یک مدل چندرسانهای کمهزینه که برای پردازش ورودیهای تصویر، ویدیو و متن “بسیار سریع” است.
علاوه بر این، مدل چندرسانهای Nova Pro “بهترین ترکیب از دقت، سرعت و هزینه” را برای طیف گستردهای از وظایف ارائه میدهد. مدلی دیگر به نام Nova Canvas میتواند برای تولید ویدیو استفاده شود.
این مدلهای جدید در Amazon Bedrock، که انتخابی از مدلهای پایه با عملکرد بالا را ارائه میدهد، در دسترس هستند.
به گفته آمازون، در این پلتفرم، Nova Micro، Nova Lite و Nova Pro حداقل ۷۵ درصد ارزانتر از بهترین مدلهای عملکردی در کلاسهای هوش مربوطه خود هستند و همچنین سریعترین هستند.
همچنین آمازون اعلام کرده است، مدل Nova Premier که تواناترین مدل چندرسانهای برای وظایفی مانند استدلال های پیچیده و بهترین معلم برای تقطیر مدلهای سفارشی است، اوایل سال آینده در دسترس خواهد بود.
هدف آمازون این است که از هوش مصنوعی برای سادهسازی زندگی خریداران، فروشندگان، تبلیغکنندگان، شرکتها و “همه افراد بین این گروهها” استفاده کند. روهیت پراساد، معاون ارشد هوش عمومی مصنوعی آمازون، گفت: “در داخل آمازون، ما حدود ۱۰۰۰ برنامه کاربردی تولیدی هوش مصنوعی در حال اجرا داریم و دید جامعی از چالشهایی که سازندگان برنامهها هنوز با آن روبرو هستند، به دست آوردهایم.”
“مدلهای جدید Amazon Nova ما برای کمک به این چالشها برای سازندگان داخلی و خارجی طراحی شدهاند و هوش و تولید محتوای جذابی را ارائه میدهند در حالی که پیشرفتهای معنیداری در تأخیر، هزینه، سفارشیسازی، پایهگذاری اطلاعات و قابلیتهای عامل ارائه میدهند.”
مدلهای جدید را میتوان به صورت اختصاصی با دادههای خصوصی کاربران سفارشی کرد. این مدل سپس میتواند از دادهها (شامل متن، تصاویر و ویدیوها) یاد بگیرد که چه چیزی برای مشتری اهمیت بیشتری دارد، پس از آن Amazon Bedrock میتواند یک مدل اختصاصی آموزشدیده برای پاسخهای متناسب هر کاربر ایجاد کند.
علاوه بر این، مدلها از “تقطیریا distillation” پشتیبانی میکنند. این قابلیت انتقال دانش خاص از یک “مدل معلم” بزرگ و بسیار توانمند به یک مدل کوچکتر، کارآمدتر و بسیار دقیق را فراهم میکند که در عین حال سریعتر و ارزانتر عمل میکند. به گفته ی شرکت آمازون، این مدلها همچنین میتوانند برای برنامههای عامل استفاده شوند.
در موارد استفاده تبلیغاتی، آمازون اعلام کرد برندهایی که از مدلهای تولید خلاق Nova، Nova Canvas و Nova Reel استفاده میکنند به طور متوسط پنج برابر بیشتر محصولات را تبلیغ کرده و برای هر محصول تبلیغشده دو برابر بیشتر تصویر ارائه میدهند.
آمازون اعلام کرد که دو مدل Nova جدید در سال ۲۰۲۵ معرفی خواهد کرد که شامل یک مدل تبدیل گفتار به گفتار و یک مدل چندرسانهای بومی یا مدلی با قابلیت تبدیل از هر قالب به هر قالب دیگر خواهد بود.
به عنوان بخشی از تلاشهای خود برای افزایش هوش مصنوعی، این شرکت همچنین اخیراً چیپهای Trainium2 را که به طور خاص برای تقاضای محاسبات هوش مصنوعی طراحی شدهاند، معرفی کرده است.

