تیتر۲۰- دانشمندان و متخصصان اپل به همراه محققان دانشگاه کلمبیا در ماه اکتبر امسال یک مدل زبانی بزرگ چند وجهی به نام Ferret را بهصورت متنباز منتشر کردند. البته این مدل زبانی بزرگ تنها برای کاربردهای تحقیقاتی منتشر شده است و نمیتوان برای امور تجاری از آن استفاده کرد. با این حال انتشار یک مدل زبانی بزرگ متنباز توسط اپل که بهعنوان شرکتی با سیستمهای بسته شناخته میشود، اتفاقی هر چند عجیب اما خوشایند است.
Ferret میآید
حالا اخباری منتشر شدهاند که نشان میدهد محققان اپل و دانشگاه کلمبیا یک مدل زبانی بزرگ (LLM) متن باز چندوجهی به نام Ferret را در ماه اکتبر منتشر کردند. انتشار Ferret نشاندهنده تعهد اپل به تحقیقات اثرگذار در زمینه هوش مصنوعی و تثبیت جایگاهش در این حوزه است. البته این مدل زبانی بزرگ تنها برای کاربردهای تحقیقاتی منتشر شده است و نمیتوان برای امور تجاری از آن استفاده کرد. با این حال به نظر میرسد که این شرایط تغییر کند، چرا که اخیرا مدلهای منبع باز Mistral عناوین جدید را میسازند و مدل جمنای گوگل قرار است که در پیکسل پرو و اندروید استفاده شود؛ در نتیجه حدس و گمانها در مورد پتانسیل مدلهای زبانی بزرگ محلی برای قدرت بخشیدن به دستگاههای کوچک افزایش یافته است.
دلیل افزایش اظهارنظرها در این مدت این است که اپل به تازگی اعلام کرد در بهکارگیری مدلهای زبانی بزرگ در آیفونها به پیشرفتی کلیدی دست یافته است. این شرکت دو مقاله تحقیقاتی جدید منتشر کرد که تکنیکهای جدیدی را برای آواتارهای سهبعدی و استنتاج مدل زبانی کارآمد معرفی میکنند. این پیشرفتها به صورت بالقوه قادر به ایجاد تجربههای بصری فراگیرتر و امکان اجرای سیستمهای هوش مصنوعی پیچیده در دستگاههای مصرفی مانند آیفون و آیپد هستند. بسیاری از فعالان عرصه هوش مصنوعی که با تاخیر متوجه انتشار Ferret شدند، ورود غیرمنتظره اپل را به عرصه مدل زبانی بزرگ منبع باز جشن گرفتهاند؛ بهخصوص اینکه اپل از قدیم به عنوان یک باغ محصور شناخته میشود. بارت دوایت که یک سازمان غیرانتفاعی اروپایی متمرکز بر هوش مصنوعی منبع باز در زمینه پزشکی را اداره میکند، با انتشار پستی در پلتفرم ایکس نوشت: «من به نوعی این اتفاق را از دست دادهام. اپل در ماه اکتبر به جامعه هوش مصنوعی منبع باز پیوسته است. معرفی Ferret گواهی بر تعهد اپل به تحقیقات تاثیرگذار هوش مصنوعی است و جایگاه خود را به عنوان یک رهبر در فضای هوش مصنوعی چندوجهی مستحکم میکند.» او در ادامه اضافه کرد: «من مشتاقانه منتظر روزی هستم که مدلهای بزرگ زبانی محلی روی آیفون من به صورت یکپارچه اجرا شوند.» تریستان بهرنس، هنرمند و مشاور آلمانی موسیقی مبتنی بر هوش مصنوعی، نیز در این باره در لینکدین خود نوشت: «آیا متوجه شدید که اپل (بله اپل!) به تازگی یک مدل زبان بزرگ چند وجهی منتشر کرده که شامل کد و وزن است؟»
بن دیکسون، وبلاگ نویس حوزه فناوری و یکی از نویسندگان سایتVentureBeat نیز در لینکدین خود در این باره نوشته است: «توسعه هوش مصنوعی در سال ۲۰۲۳ چیست که کمترین انتظار را از آن داشتهاید؟ برای من این اتفاق به این معنا بود که اپل مدلهای بزرگ زبانی منبع باز (البته با مجوز غیرتجاری) را منتشر کرده است.» او در ادامه آورد: «اپل مدتهاست که مشغول الگویی از سیستمهای بسته، توسعه باغی محصور، پنهانکاری، NDAهای امن و مقاوم، عدمانتشار جزئیات و ثبت حق اختراع تک تک قطعات محصولات خود بوده است.» او ادامه داد: «اما با نگاهی به گذشته ورود اپل به بازار مدل بزرگ زبانی منبع باز(مانند متا) منطقی به نظر میرسد، چرا که برای رقابت با مدلهایی مانند ChatGPT، یا باید یک سرور ابری عظیم در اختیار داشته باشید یا با یکی از شرکتهای بزرگ مانند مایکروسافت یا گوگل همکاری کنید. اپل ممکن است منابع زیادی داشته باشد، اما زیرساختهای آن برای سرویسدهی در مقیاس مدلهای زبانی بزرگ ساخته نشده است. در نتیجه راه چاره این است که به یک ارائهدهنده فضای ابری مانند مایکروسافت یا گوگل وابسته شود یا مدلهای منبع باز خودش را منتشر کند.»
یک رقیب قدرتمند
با توجه به اینکه اپل نسبتا دیر وارد حوزه هوش مصنوعی مولد شده است، عرضه یک مدل زبانی بزرگ بهصورت متنباز برای آنها منطقی بهنظر میرسد. این اقدام به کوپرتینوییها اجازه خواهد داد که خیلی سریعتر مسیر رشد را طی کنند.پیشتر متا عمدتا از طریق انتشار متنباز مدلهای خود در این مسیر قدم گذاشته و به موفقیتهایی دست یافته بود. مقالهای که در صفحه گیتهاب مدل Ferret منتشر شده است، نشان میدهد که این مدل میتواند ارجاع فضایی (Spatial Referring) اشیا در تصاویر را بفهمد و بهدقت اطلاعاتی را درباره آنها ارائه کند که حتی شاید در میان دادههای آموزشی خود نیز وجود نداشته باشد. همچنین یکی از محققان اپل در ایکس مدعی شده است که این مدل میتواند در تشخیص بخشهای کوچکی از یک تصویر حتی بهتر از GPT-۴V عمل کند. با این همه نکته جالب توجه این است که اخبار در مورد برنامههای اپل و توسعه مدل زبانی بزرگ محلی در حالی منتشر شده است که گفته میشود هر دو شرکت آنتروپیک و اوپن ایآی در حال مذاکره جهت افزایش بودجه توسعه مدل زبانی بزرگ اختصاصی خود هستند. رویترز روز چهارشنبه گزارش داد که آنتروپیک در حال مذاکره برای جذب سرمایه ۷۵۰ میلیون دلاری از منلو ونچرز است. بلومبرگ نیز روز گذشته گزارش داد که شرکت اوپنایآی نیز در حال مذاکرات اولیه برای جمعآوری دور تازهای از سرمایه با ارزش بیش از ۱۰۰ میلیارد دلار است./دنیای اقتصاد