از زمانی که هوش مصنوعی تولیدکننده در اواخر سال 2022 به جریان اصلی اتفاقات وارد شد، بسیاری از ما درک اساسی از این فناوری و نحوه استفاده از زبان طبیعی برای کمک به تعامل آسانتر با رایانهها به دست آوردهایم. برخی از ما حتی میتوانیم اصطلاحات پرکاربرد مانند “prompts” و “machine learning” را در هنگام قهوه خوردن با دوستان به زبان بیاوریم. (اگر هنوز به این مرحله نرسیدهاید، میتوانید با این مقاله مقدماتی شروع کنید) اما با ادامه تکامل هوش مصنوعی، واژگان آن نیز در حال تغییر است. آیا تفاوت بین مدلهای زبان بزرگ و کوچک را میدانید؟ یا اینکه “GPT” در ChatGPT مخفف چیست؟ یا اینکه RAG چه ارتباطی با تمیز کردن ساختگیها دارد؟ ما اینجا هستیم تا با یک تجزیه و تحلیل سطح بعدی از اصطلاحات هوش مصنوعی به شما کمک کنیم تا به روز باشید.
استدلال و برنامهریزی (Reasoning/planning)
رایانههای مبتنی بر هوش مصنوعی اکنون میتوانند با استفاده از الگوهایی که از دادههای تاریخی آموختهاند، مشکلات را حل کرده و وظایف را انجام دهند تا معنای اطلاعات را درک کنند، که چیزی شبیه استدلال است. پیشرفتهترین سیستمها توانایی رفتن یک گام جلوتر را نشان میدهند و با ایجاد برنامهها و تدوین یک دنباله از اقدامات برای رسیدن به یک هدف، مشکلات پیچیدهتری را برطرف میکنند. تصور کنید که از یک برنامه هوش مصنوعی بخواهید در برنامهریزی یک سفر به یک پارک تفریحی کمک کند. این سیستم میتواند این هدف را (بازدیدی که در آن شش سواری مختلف انجام میدهید، از جمله اطمینان از اینکه ماجراجویی آبی در گرمترین قسمت روز انجام میشود) به مراحل مختلف برای یک برنامه تقسیم کند و با استفاده از استدلال اطمینان حاصل کند که هیچ جا برگشت نخواهید خورد و در ساعت بین ظهر و 3 بعد از ظهر بر روی غلتک آببازی خواهید بود.
آموزش و استنتاج (Training/inference)
برای ایجاد و استفاده از یک سیستم هوش مصنوعی، دو مرحله وجود دارد: آموزش و استنتاج. آموزش نوعی آموزش برای سیستم هوش مصنوعی است، زمانی که یک مجموعه داده به آن داده میشود و یاد میگیرد که بر اساس آن دادهها وظایف را انجام دهد یا پیشبینی کند. به عنوان مثال، ممکن است یک لیست از قیمتهای خانههای اخیراً فروخته شده در یک محله، همراه با تعداد اتاق خوابها و حمامها در هر خانه و بسیاری از متغیرهای دیگر به آن داده شود. در طول آموزش، سیستم پارامترهای داخلی خود را تنظیم میکند که مقادیری هستند که تعیین میکنند چه مقدار وزن به هر یک از این عوامل در تأثیرگذاری بر قیمتگذاری داده شود. استنتاج زمانی است که از این الگوها و پارامترهای آموخته شده برای پیشبینی قیمت یک خانه جدید که قرار است به بازار عرضه شود، استفاده میکند.
مدلهای زبان کوچک SLM/small language model (SLM)
مدلهای زبان کوچک (SLM)، نسخههای جیبی مدلهای زبان بزرگ (LLM) هستند. هر دو از تکنیکهای یادگیری ماشین برای کمک به تشخیص الگوها و روابط استفاده میکنند تا بتوانند پاسخهای طبیعی و واقعی به زبان تولید کنند. اما در حالی که LLMها بسیار بزرگ هستند و به یک دوز سنگین قدرت محاسباتی و حافظه نیاز دارند، SLMها مانند Phi-3 بر روی مجموعه دادههای کوچکتر و دستهبندی شده آموزش داده میشوند و پارامترهای کمتری دارند، بنابراین فشردهتر هستند و حتی میتوانند بدون اتصال به اینترنت، به صورت آفلاین استفاده شوند. این آنها را برای برنامههای کاربردی روی دستگاههایی مانند لپتاپ یا تلفن مناسب میکند، جایی که ممکن است بخواهید سوالات اساسی در مورد مراقبت از حیوانات خانگی بپرسید اما نیازی به بررسی عمیق استدلال چند مرحلهای در مورد نحوه آموزش سگهای راهنمای نابینایان ندارید.
زمینهسازی (Grounding)
سیستمهای هوش مصنوعی تولیدکننده میتوانند داستانها، شعرها و جوکها را بسازند و همچنین به سوالات تحقیقاتی پاسخ دهند. اما گاهی اوقات آنها با چالش تفکیک واقعیت از خیال روبرو میشوند یا دادههای آموزشی آنها قدیمی است و سپس میتوانند پاسخهای نادرستی ارائه دهند که به عنوان توهمات شناخته میشوند. توسعهدهندگان برای کمک به هوش مصنوعی در تعامل دقیق با دنیای واقعی از طریق فرآیند زمینهسازی تلاش میکنند که در آن مدل خود را با دادهها و مثالهای ملموس مرتبط و لنگر میاندازند تا دقت را بهبود بخشند و خروجیهای مرتبطتر و شخصیسازی شده بیشتری تولید کنند.
تولید تقویتشده با بازیابی Retrieval Augmented Generation (RAG)
هنگامی که توسعهدهندگان به یک سیستم هوش مصنوعی دسترسی به یک منبع زمینهسازی میدهند تا به آن کمک کند دقیقتر و بهروزتر باشد، از روشی به نام تولید تقویتشده با بازیابی یا RAG استفاده میکنند. الگوی RAG با افزودن دانش اضافی بدون نیاز به آموزش مجدد برنامه هوش مصنوعی، در زمان و منابع صرفهجویی میکند. این مانند زمانی است که شما شرلوک هولمز هستید و تمام کتابهای کتابخانه را خواندهاید اما هنوز پرونده را حل نکردهاید، بنابراین به اتاق زیر شیروانی میروید، برخی از طومارهای باستانی را باز میکنید و قطعه گمشده پازل را پیدا میکنید. به طور مشابه، اگر یک شرکت پوشاک دارید و میخواهید یک چتبات ایجاد کنید که بتواند به سوالات خاص در مورد محصولات شما پاسخ دهد، میتوانید از الگوی RAG بر روی کاتالوگ محصولات خود استفاده کنید تا به مشتریان کمک کنید سویتر سبز کامل را از فروشگاه خود پیدا کنند.
هماهنگی (Orchestration)
برنامههای هوش مصنوعی کارهای زیادی روی دوش خود دارند زیرا درخواستهای مختلف افراد را پردازش میکنند. لایه هماهنگی چیزی است که آنها را در تمام وظایف خود به ترتیب درست برای رسیدن به بهترین پاسخ هدایت میکند. به عنوان مثال، اگر از Microsoft Copilot بپرسید که آدا لاولیس کیست و سپس از آن بپرسید که چه زمانی به دنیا آمده است، هماهنگکننده هوش مصنوعی است که تاریخچه چت را ذخیره میکند تا ببیند که “او” در سوال بعدی شما به لاولیس اشاره دارد. لایه هماهنگی همچنین میتواند از الگوی RAG با جستجوی اطلاعات تازه در اینترنت برای افزودن به زمینه و کمک به مدل برای ارائه پاسخ بهتر پیروی کند. این مانند یک رهبر ارکستر است که ویولنها و سپس فلوتها و اُبوها را به ترتیب فراخوانی میکند تا همه آنها با دنبال کردن نتها، صدایی را که آهنگساز در نظر داشت تولید کنند.
حافظه (Memory)
مدلهای هوش مصنوعی امروزی از نظر فنی حافظه ندارند. اما برنامههای هوش مصنوعی میتوانند دستورالعملهای هماهنگ شدهای داشته باشند که با پیروی از مراحل خاص در هر تراکنش، به آنها کمک میکند اطلاعات را “به خاطر بسپارند” – مانند ذخیره موقت سوالات و پاسخهای قبلی در یک چت و سپس گنجاندن آن زمینه در درخواست فعلی مدل، یا استفاده از دادههای زمینهسازی از الگوی RAG برای اطمینان از اینکه پاسخ جدیدترین اطلاعات را دارد. توسعهدهندگان در حال آزمایش لایه هماهنگی برای کمک به سیستمهای هوش مصنوعی هستند تا بدانند آیا نیاز دارند به طور موقت یک تجزیه مراحل را به خاطر بسپارند، به عنوان مثال حافظه کوتاه مدت، مانند نوشتن یک یادآوری روی یک یادداشت.
مدلهای ترانسفورماتور و انتشار (Transformer models and diffusion models)
مردم دههها است که به سیستمهای هوش مصنوعی آموزش میدهند تا زبان را درک و تولید کنند، اما یکی از پیشرفتهایی که پیشرفتهای اخیر را تسریع کرد، مدل ترانسفورماتور بود. در میان مدلهای هوش مصنوعی تولیدکننده، ترانسفورماتورها جزو بهترین و سریعترین هستند. آنها داستانگویان فصیحی هستند که به الگوهای موجود در دادهها توجه میکنند و اهمیت ورودیهای مختلف را برای کمک به پیشبینی سریع آنچه در ادامه میآید، وزن میکنند که این امکان را برای آنها فراهم میکند تا متن های مناسبی تولید کنند. شهرت ترانسفورماتور حرف T در ChatGPT است.
مدلهای مرزی (Frontier models)
مدلهای مرزی سیستمهای بزرگ مقیاسی هستند که مرزهای هوش مصنوعی را گسترش میدهند و میتوانند طیف گستردهای از وظایف را با قابلیتهای جدید و گستردهتر انجام دهند. آنها میتوانند بسیار پیشرفته باشند که گاهی ما را با آنچه قادر به انجام آن هستند شگفتزده میکنند. شرکتهای فناوری از جمله مایکروسافت یک انجمن مدل مرزی تشکیل دادند تا دانش را به اشتراک بگذارند، استانداردهای ایمنی را تعیین کنند و به همه کمک کنند تا این برنامههای قدرتمند هوش مصنوعی را درک کنند تا توسعه ایمن و مسئولانه را تضمین کنند.
GPU
GPU که مخفف Graphics Processing Unit است، اساساً یک ماشین حساب تقویتشده است. GPUها در ابتدا برای روان کردن گرافیکهای فانتزی در بازیهای ویدیویی طراحی شده بودند ولی اکنون ماشینهای قدرتمند محاسباتی هستند. این تراشهها دارای تعداد زیادی هسته کوچک یا شبکههای مدار و ترانزیستور هستند که با هم مسائل ریاضی را حل میکنند، که به آن پردازش موازی میگویند. از آنجایی که این اساساً همان هوش مصنوعی است، حل انبوهی از محاسبات در مقیاس عظیم برای توانایی برقراری ارتباط به زبان انسانی و تشخیص تصاویر یا صداها را انجام میدهد. GPUها برای ابزارهای هوش مصنوعی آموزشی و استنتاج ضروری هستند. در واقع، پیشرفتهترین مدلهای امروزی با استفاده از خوشههای عظیم از GPUهای متصل به هم که گاهی اوقات دهها هزار عدد در مراکز داده غولپیکر پخش میشوند، مانند آنهایی که مایکروسافت در Azure دارد، که قدرتمندترین رایانههای ساخته شده تا به امروز هستند، آموزش داده میشوند.