در سالهای اخیر، هوش مصنوعی به سرعت در حال پیشرفت است و شرکتهای بزرگ تکنولوژی مانند OpenAI نقش مهمی در این مسیر داشتهاند. سال گذشته، OpenAI با معرفی هوش مصنوعی ChatGPT 4، گام بزرگی در توسعه مدلهای زبانی برداشت و این بار مدل هوش مصنوعی جدید OpenAI به نام مدل OpenAI o1 که پیشتر با کد Strawberry شناخته میشد، یک تحول اساسی دیگر را رقم زده است.
این مدل جدید، برخلاف مدلهای قبلی، بر استدلال منطقی و حل مسائل پیچیده تمرکز دارد و میتواند مشکلاتی را حل کند که مدلهای قبلی قادر به انجام آن نبودند.
در این مقاله، به بررسی جزئیات این مدل جدید، رویکردهای نوین OpenAI و رقابتهای موجود در این حوزه خواهیم پرداخت.
برتری مدل هوش مصنوعی جدید OpenAI چیست؟
OpenAI سال گذشته با معرفی هوش مصنوعی ChatGPT 4 تحولی بزرگ در حوزه هوش مصنوعی ایجاد کرد. این مدل با ابعاد بسیار بزرگتری نسبت به انواع قبلی طراحی شده بود و توانست تواناییهای بینظیری در پردازش زبان طبیعی و حل مسائل پیچیده از خود نشان دهد. اکنون OpenAI یک پیشرفت جدید را اعلام کرده که نشان از تغییر رویکرد این شرکت دارد. مدل جدیدی که معرفی شده، پیش از انتشار اولیه با کد توت فرنگی (strawberry) شناخته میشد و اکنون این مدل به طور رسمی مدل OpenAI o1 نام گزاری شده است که ممکن است برخی آن را به اشتباه مدل ChatGPT o1 بنویسند.
این مدل قادر است به طور منطقی استدلال کرده و مسائل پیچیدهتری را نسبت به هوش مصنوعیهای فعلی حل کند، بدون اینکه نیاز به افزایش زیاد در ابعاد مدل داشته باشد.
مدل OpenAI o1 که بخشی از سری تازهای از مدلهای هوش مصنوعی است، زمان بیشتری را صرف فکر کردن قبل از ارائه پاسخ میکند و میتواند مسائل دشوار علمی، برنامهنویسی و ریاضی را بهتر از مدلهای قبلی حل کند. نسخه اولیه این مدل در ChatGPT و APIهای مرتبط با آن عرضه شده و قرار است بهروزرسانیها و بهبودهای بیشتری در آینده منتشر شود. هدف این رویکرد جدید، ایجاد مدلهایی است که با دقت بیشتر و هوشمندی بالاتر به مسائل پاسخ دهند و کاربردهای گستردهتری در زمینههای مختلف علمی پیدا کنند.
مدل OpenAI o1: تغییر در شیوه استدلال هوش مصنوعی
مدل هوش مصنوعی جدید OpenAI با نام OpenAI o1 طراحی شده است تا بتواند مسائلی را حل کند که حتی مدلهای پیشرفتهای مانند GPT-4o از حل آن عاجز هستند. برخلاف مدلهای زبانی بزرگ که معمولا در یک مرحله پاسخ میدهند، این مدل به طور تدریجی و با استدلال منطقی به حل مسئله میپردازد، درست مانند یک انسان که ممکن است با صدای بلند فکر کند و سپس به نتیجه درست برسد.
میره موراتی، مدیر ارشد فناوری OpenAI، میگوید: «این مدل نمایانگر یک پارادایم جدید در هوش مصنوعی است و در مواجهه با مسائل پیچیدهتر بسیار بهتر عمل میکند.» کد اولیه این مدل OpenAI Strawberry بوده و شرکت میگوید که این مدل جایگزین هوش مصنوعی ChatGPT 4 نیست، بلکه به عنوان مکملی برای آن عمل میکند. هدف از این مدل جدید بهبود تواناییهای استدلالی و حل مسئله است که بتواند در کاربردهای علمی، فناوری و روزمره کمک بیشتری کند. به همین دلیل، مدل OpenAI o1 قدمی مهم به سمت هوش مصنوعی است که بتواند مسائل پیچیدهتری را به شیوهای منطقیتر و هوشمندانهتر حل کند.
یادگیری تقویتی و بهبود استدلال هوش مصنوعی
بهبود تواناییهای استدلال در مدلهای زبانی بزرگ (LLMs) مدتهاست که موضوع مهمی در محافل پژوهشی بوده است. در واقع، شرکتهای رقیب نیز تحقیقاتی مشابه را انجام میدهند. برای مثال، در ماه ژوئیه، گوگل پروژهای به نام AlphaProof را معرفی کرد که ترکیبی از مدلهای زبانی و یادگیری تقویتی برای حل مسائل پیچیده ریاضی بود.
یون کیم، استاد دانشگاه MIT، میگوید که نحوه حل مسائل توسط LLMها هنوز کاملا شفاف نیست و حتی اگر این مدلها به صورت مرحلهبهمرحله استدلال کنند، ممکن است تفاوتهای مهمی با هوش انسانی وجود داشته باشد. این مسئله زمانی اهمیت بیشتری پیدا میکند که این فناوری بهطور گستردهتر مورد استفاده قرار گیرد. او میگوید: «این سیستمها ممکن است تصمیماتی بگیرند که روی تعداد زیادی از مردم تاثیر بگذارد.» سوال مهمتر این است که آیا باید این اطمینان وجود داشته باشد که مدلها چگونه به جواب میرسند؟
مدل جدید GPT یعنی مدل GPT 5 در حال توسعه
موراتی میگوید که OpenAI در حال ساخت مدل اصلی جدید خود به نام مدل GPT 5 است که بسیار بزرگتر از نسخه قبلی خواهد بود. اگرچه این شرکت همچنان معتقد است که افزایش مقیاس به بهبود تواناییهای هوش مصنوعی کمک میکند، مدل GPT 5 احتمالا شامل فناوری استدلالی خواهد بود که اکنون معرفی شده است. او توضیح میدهد که دو روش اصلی وجود دارد: یکی افزایش مقیاس و دیگری روش جدیدی که OpenAI آن را دنبال میکند و انتظار میرود این دو رویکرد با هم ترکیب شوند.
مدلهای زبانی بزرگ (LLMs) معمولا پاسخهای خود را از شبکههای عصبی عظیمی میگیرند که با دادههای آموزشی زیادی تغذیه شدهاند. این مدلها بر خلاف مدل هوش مصنوعی جدید OpenAI میتوانند تواناییهای زبانی و منطقی فوقالعادهای نشان دهند، اما گاهی اوقات در حل مسائل ساده مثل محاسبات ابتدایی که به استدلال نیاز دارند، مشکل دارند.
موراتی میگوید OpenAI از یادگیری تقویتی استفاده میکند که شامل ارائه بازخورد مثبت به مدل هنگام پاسخهای درست و بازخورد منفی برای پاسخهای نادرست است. این کار به مدل کمک میکند تا فرآیند استدلال خود را بهبود بخشد. این روش به کامپیوترها کمک کرده تا بازیهای پیچیده را با مهارت فوقالعاده انجام دهند و وظایف مفیدی مانند طراحی تراشههای کامپیوتری را حتی انجام دهند.
سخن پایانی
تکنیکی که OpenAI امروز معرفی کرده است، ممکن است به اطمینان از رفتار صحیح مدلهای هوش مصنوعی کمک کند. موراتی میگوید مدل هوش مصنوعی جدید OpenAI توانایی بهتری در جلوگیری از تولید محتوای نامناسب یا مضر دارد، زیرا میتواند درباره پیامدهای اقدامات خود استدلال کند.
او این موضوع را با آموزش کودکان مقایسه میکند و میگوید: «وقتی کودکان میتوانند درباره دلیل انجام یک کار فکر کنند، بهتر میآموزند که با هنجارها، رفتارها و ارزشهای خاصی هماهنگ شوند.» چن از OpenAI توضیح میدهد که رویکرد جدید استدلال نشان میدهد که پیشرفت در هوش مصنوعی نیاز به استفاده از قدرت پردازشی بسیار زیاد ندارد. او میگوید: «یکی از نکات هیجانانگیز این روش این است که ما معتقدیم این امکان را فراهم خواهد شد تا هوش را با هزینه کمتری ارائه دهیم.» و اضافه میکند که این مسئله واقعا هسته اصلی ماموریت شرکت است.