مدل‌های قابل دسترس

مدل‌های قابل دسترس

لیست مدل‌های قابل دسترس از طریق Gilas API در جدول‌ زیر آمده است.

مدلتوضیحات
Text Generationمجموعه‌ای از مدل‌ها که قابلیت بسیار بالایی در درک و تولید زبان‌های طبیعی و کد را دارا هستند. همچنین این مدل‌ها توانایی بالایی در استنتاج منطقی از خود نشان می‌دهند.
Code Generationمجموعه‌ای از مدل‌ها که قابلیت بسیار بالایی در درک٬ تولید و تکمیل کدهای کامپیوتری دارند.
Embeddingsمجموعه‌ای از مدل‌ها که قابلیت نمایش برداری متن را دارند. از این بردارها می‌توان برای انجام عملیات‌هایی مانند جستجوی شباهت میان متون و کلاسترینگ استفاده کرد.
Audioمجموعه‌ای از مدل‌ها که برای تبدیل صوت به متن و برعکس قابل استفاده هستند و از زبان فارسی پیشتیبانی می‌کنند.
Moderationsمجموعه‌ای از مدل‌ها که سازگار بودن متن ورودی با قوانین و اصول اخلاقی را بررسی می‌کنند.
لطفا مستندات مربوط به Rate limit را جهت آگاهی از پیش‌ نیاز استفاده از برخی مدل‌ها را مطالعه کنید.

Text Generation #

مجموعه‌ای از مدل‌ها که قابلیت بسیار بالایی در درک و تولید زبان‌های طبیعی و کد را دارا هستند. همچنین این مدل‌ها توانایی بالایی در استنتاج منطقی از خود نشان می‌دهند و قابلیت حل مسایل بسیار پیچیده را دارند و از طریق Chat Completions API قابل دسترسی هستند. لیست مدل‌های تولید متن در زیر آمده است.

مدلارایه دهندهتوضیحاتطول کانتکست
o1-previewOpenAIقدرتمندترین مدل از لحاظ درک و پردازش وظایف بسیار پیچیده که قبل از تولید خروجی سعی در بررسی صحت و درستی آن می‌کند. این مدل هنوز قادر به دریافت پیغام system٬ تصویر و مقدار tools در ورودی درخواست‌ها نیست.۱۲۸.۰۰۰ توکن
o1-miniOpenAIاین مدل از لحاظ هزینه مرقوم به صرفه‌تر از مدل o1-previewبوده ولی همچنان برای حل مسایل بسیار پیچیده مخصوصا تولید کد کامپیوتری و مسایل علمی بسیار قدرتمند می‌باشد. این مدل نیز محدودیت‌های ذکر شده برای مدل o1-preview را دارد.۱۲۸.۰۰۰ توکن
gpt-4oOpenAIقدرتمندترین مدل از خانواده GPT4 با قابلیت های چندگانه از جمله فراخوانی تابع (function call) و تولید خروجی JSON و قدرت دیدن (vision) بهتر و سریع‌تر از مدل gpt-4-turbo با ۵۰٪ هزینه‌ی کمتر ازین مدل و دارای عملکرد بهتر در زبان‌های غیر انگلیسی۱۲۸.۰۰۰ توکن
gpt-4o-miniOpenAIمرقوم به صرفه‌ترین مدل از خانواده GPT4 که از لحاظ هزینه ارزانتر از مدل GPT-3.5-Turbo بوده و در عین حال از تمام قابلیت‌های مدل gpt-4o برخوردار است.۱۲۸.۰۰۰ توکن
gpt-4-turboOpenAIبا قابلیت دیدن (vision) و فراخوانی تابع (function call) و تولید خروجی JSON.۱۲۸.۰۰۰ توکن
gpt-3.5-turboOpenAIقدرتمندترین مدل از خانواده GPT3.5 با قابلیت فراخوانی تابع (function call) و تولید خروجی JSON.۱۶.۳۸۵ توکن
mistral-large-latestMistralقدرتمندترین مدل از خانواده Mistral با قابلیت های چندگانه از جمله فراخوانی تابع (function call) و تولید خروجی JSON و دارای عملکرد بسیار خوب در زبان‌های غیر انگلیسی۱۲۸.۰۰۰ توکن
mistral-small-latestMistralقدرتمندترین مدل کوچک در خانواده Mistral با قابلیت های چندگانه از جمله فراخوانی تابع (function call) و تولید خروجی JSON و دارای عملکرد بسیار خوب در ترجمه٬ خلاصه‌سازی و درک مطلب متون۱۲۸.۰۰۰ توکن
pixtral-large-latestMistralتنها مدل از خانواده‌ی Mistral با قابلیت دیدن (vision) که از قدرت بسیار بالایی در تحلیل تصاویر و نمودارها و همچنین OCR برخوردار است.۱۲۸.۰۰۰ توکن
codestral-latestMistralقدرتمندترین مدل تولید و تکمیل کدهای کامپیوتری که در بسیاری از ابزارهای تکمیل کد مورد استفاده قرار می‌گیرد. این مدل برای تولید سریع کد بهینه شده است و از ۸۰ زبان برنامه‌نویسی مختلفی از جمله پایتون٬ جاوا٬ C++, PHP, JS, غیره پشتیبانی می‌کند.۳۲.۰۰۰ توکن

*مدل codestral هم برای تولید متن و هم برای تکمیل کد قابل استفاده است. اما برای تکمیل کد بهترین انتخاب است.

Code Generation #

مجموعه‌ای از مدل‌ها که قابلیت بسیار بالایی در درک٬ تولید و تکمیل کدهای کامپیوتری دارند و از طریق FIM Completions API قابل دسترسی هستند. لیست مدل‌های تولید کد در زیر آمده است.

مدلارایه دهندهتوضیحاتطول کانتکست
codestral-latestMistralقدرتمندترین مدل تولید و تکمیل کدهای کامپیوتری که در بسیاری از ابزارهای تکمیل کد مورد استفاده قرار می‌گیرد. این مدل برای تولید سریع کد بهینه شده است و از ۸۰ زبان برنامه‌نویسی مختلفی از جمله پایتون٬ جاوا٬ C++, PHP, JS, غیره پشتیبانی می‌کند.۳۲.۰۰۰ توکن

Embeddings #

یک Embeddings نمایش برداری داده ها (مثلاً متن) است که قصد دارد جنبه‌هایی از محتوا و/یا معنای آن را حفظ کند. داده هایی که به نحوی مشابه هستند، تمایل دارند که Embeddingهایی داشته باشند که نزدیکتر از داده‌های بی‌ربط به هم هستند. مدل‌های Embeddings متنی یک رشته متنی را به عنوان ورودی دریافت می کنند و خروجی آنها یک بردار Embeddings است. Embedding‌s برای جستجو، خوشه‌بندی، سیستم های توصیه، تشخیص ناهنجاری، طبقه‌بندی و غیره مفید هستند و از طریق Embeddings API قابل دسترسی است.

مدلارایه دهندهتوضیحاتطول بردار خروجی
text-embedding-3-largeOpenAIقابل استفاده برای زبان انگلیسی و دیگر زبان‌ها۳.۰۷۲
text-embedding-3-smallOpenAIدارای پرفورمنس بالاتر از مدل‌های نسل دوم ada۱.۵۳۶
text-embedding-ada-002OpenAIبا قابلیت‌ترین مدل نسل دوم ada۱.۵۳۶

Audio #

مدل‌های صوتی برای تبدیل صوت به متن و همچنین متن به صوت قابل استفاده هستند. این مدل‌های از دقت بسیار بالاتری نسبت به سرویس‌های مشابه برخوردار بوده و همچنین صوت تولید شده شباهت زیادی به صدای انسان دارد. مدل Whisper قادر به تبدیل صوت به متن است و می‌توانند زبان‌های مختلف را به یکدیگر ترجمه کند. مدل TTS (Text-to-Speech) هم قادر به تبدیل متن به صوت به زبان‌های مختلف است. این مدل‌ها زبان فارسی را پشتیبانی می‌کنند و از طریق Audio API قابل دسترسی است.

مدلارایه دهندهتوضیحات
whisper-1OpenAIفایل ورودی می‌تواند یکی از فرمت‌های .mp3 یا .wav باشد.
tts-1OpenAIفایل خروجی می‌تواند یکی از فرمت‌های .opus, .acc, .flac, .wav و .pcm باشد.

Moderations #

مدل‌های Moderation وظیفه بررسی متن ورودی و مشخص کردن اینکه آیا متن دارای محتوای نامناسب است را دارند. اگر متن ورودی نامناسب تضخیص داده شود, فراخوانی‌های بعدی به مدل‌های دیگر برای این متن رد خواهند شد. نحوه استفاده از این اندپوینت در Moderations API شرح داده شده است.

مدلارایه دهندهتوضیحات
omni-moderation-latestOpenAIاین مدل نماینده آخرین مدل پایدار توسعه‌یافته است.