Posts

Posts

Post Cover Image

اتصال ادیتور Cursor به Gilas API

ادیتور Cursor یک ویرایشگر کد یا code editor است که قابلیت‌های پیشرفته هوش مصنوعی را به جریان کاری توسعه‌دهندگان اضافه می‌کند. این ویرایشگر که به عنوان یک fork از Visual Studio Code ساخته شده، محیطی بسیار شبیه به محیط VS code را ارائه می‌دهد و در عین حال ویژگی‌های هوش مصنوعی قدرتمندی را که می‌تواند به طور قابل توجهی بهره‌وری را افزایش دهد، در خود جای داده است. ویژگی‌های کلیدی # پشتیبانی از مدل سفارشی ...

Post Cover Image

معرفی مدل Codestral برای تولید کد

مدل Codestral یک مدل AI مولد با وزن‌های باز است که به طور خاص برای وظایف تولید کد طراحی شده است. این مدل به توسعه‌دهندگان کمک می‌کند تا با کد به راحتی تعامل کنند و از طریق یک API مشترک عملیات تولید و تکمیل کد را انجام دهند. برای استفاده ازین مدل به مستندات FIM Completions مراجعه کنید. مدلی مسلط به بیش از 80 زبان برنامه‌نویسی # مدل Codestral بر روی مجموعه‌داده‌ای متنوع از بیش از ۸۰ زبان برنامه‌نویسی آموزش دیده است که شامل زبان‌های محبوب مانند Python، Java، C، C++، JavaScript و Bash می‌شود. ...

Post Cover Image

 اتصال افزونه‌ی Continue.dev به Gilas API برای تکمیل خودکار کد

درین پست نحوه تنظیم ابزار محبوب Continue.dev برای تکمیل خودکار کد code auto-completion که گاهی از آن به عنوان Tab completion هم یاد می‌شود را با استفاده از مدل Codestral از طریق Gilas API بررسی میکنیم. ابزارهای تکمیل خودکار کد برای تکمیل خطوط کد باز یا ناقص طراحی شده است و به شما امکان می‌دهد به سرعت و با دقت بیشتری کد خود را تکمیل کنید. مدل Codestral که توسط Gilas API در دسترس است٬ یک مدل پیشرفته تولید کد است که به طور خاص برای وظایف تولید کد مانند تکمیل و تولید کد در بین خطوط بهینه‌سازی شده است. ...

Post Cover Image

تولید روایت صوتی برای ویدیو

پردازش ویدیو با استفاده از GPT-4-Vision برای تولید متن مناسب و صداگذاری روی آن # این Notebook نشان می‌دهد چگونه می‌توان از توانایی‌های بصری GPT-4 برای درک محتوای یک ویدیو و تولید متن متناسب با آن و نهایتا تبدیل متن تولید شده به صدا استفاده کرد. GPT-4 به طور مستقیم ویدیوها را به عنوان ورودی قبول نمی‌کند، اما می‌توانیم از قابلیت vision و طول کانتکست 128K برای توصیف فریم‌های ثابت یک ویدیو در هر زمان استفاده کنیم. ...

Post Cover Image

ترکیب GPT-4o با RAG - ساخت اپلیکیشن تطبیق لباس

به اپلیکیشن تطبیق لباس خوش آمدید! این پروژه قدرت مدل GPT-4o را در تحلیل تصاویر لباس‌ها و استخراج ویژگی‌های کلیدی مانند رنگ، سبک و نوع نشان می‌دهد. هسته اصلی اپلیکیشن ما بر اساس این مدل پیشرفته تحلیل تصویر که توسط OpenAI توسعه یافته است، استوار است که به ما امکان می‌دهد ویژگی‌های لباس ورودی را به دقت شناسایی کنیم. با استفاده از قابلیت‌های مدل GPT-4o، ما از یک الگوریتم تطبیق سفارشی و تکنیک RAG برای جستجو در پایگاه دانش خود برای آیتم‌هایی که با ویژگی‌های شناسایی شده مطابقت دارند، استفاده می‌کنیم. ...

Post Cover Image

تگ زدن تصاویر و تولید کپشن برای آنها

تولید خودکار برچسب برای تصاویر و توضیح محتوای آنها با استفاده از GPT-4-Vision # این Notebook توضیح می‌دهد که چگونه می‌توان از GPT-4-Vision برای برچسب زدن و توضیح تصاویر بهره برد. ما می‌توانیم از توانایی‌های GPT-4V استفاده کنیم تا تصاویر ورودی را همراه با اطلاعات تکمیلی در مورد آنها پردازش کند و برچسب‌ها یا توضیحات مربوط به را خروجی دهد. سپس می‌توان توضیحات تصویر را با استفاده از یک مدل زبانی (در این نوت‌بوک، ما از GPT-4-turbo استفاده خواهیم کرد) برای تولید توضیحات بیشتر اصلاح کرد. ...

Post Cover Image

ساخت چت‌ بات با استفاده از LangChain

در این پست یک مثال از نحوه طراحی و پیاده‌سازی یک چت‌بات با استفاده از یک LLM را بررسی خواهیم کرد. این چت‌بات قادر به انجام مکالمه و به خاطر سپاری تعاملات قبلی است. در نظر داشته باشید که برای تولید مکالمات پیچیده تر میتوانید از قابلیت های عامل (Agent) و RAG که از طریق پکیج LangChain قابل دسترس هستند استفاده کنید. آماده سازی محیط # برای این آموزش به langchain-core و langgraph نیاز خواهیم داشت: ...

Post Cover Image

مقدمه‌ای بر GPT-4o

مدل GPT-4o (“o” به معنای “omni”) برای پردازش ترکیبی از ورودی‌های متن، صوت و ویدیو طراحی شده است و می‌تواند خروجی‌هایی در قالب متن، صوت و تصویر تولید کند. قبل از GPT-4o، کاربران می‌توانستند با استفاده از حالت صوتی ChatGPT که با سه مدل جداگانه کار می‌کرد، تعامل داشته باشند. GPT-4o این قابلیت‌ها را در یک مدل واحد که بر روی متن، تصویر و صوت آموزش دیده است، یکپارچه می‌کند. ...

Post Cover Image

سیستم سوال و جواب با embeddings

مدل‌های GPT با درکی که از زبان طبیعی دارند قدرت فهم سوالات و جواب دادن به آنها را دارند. ولی اگر بخواهیم که GPT به سوالات در مورد موضوعات ناآشنا پاسخ دهد، باید چه کار کنید؟ مثال‌هایی از موضوعات ناآشنا: رویدادهای اخیر پس از سپتامبر 2021 اسناد شخصی شما اطلاعات مربوط به محصولات فروشگاه شما پاسخگویی به سوالات مشتریان در مورد خدمات شرکت شما و غیره. این notebook نشان می‌دهد که چگونه با استفاده از روش دو مرحله‌ای جستجو-پرسش، GPT را قادر به پاسخگویی به سوالات با استفاده از دیتابیس اطلاعات متنی که غالبا در حالت عادی در دسترس مدل قرار ندارد کنیم. ...

Post Cover Image

ساخت چت‌ بات مبتنی بر RAG با استفاده از LangChain

در این پست یک مثال از نحوه طراحی و پیاده‌سازی یک چت‌بات با استفاده از یک RAG را بررسی خواهیم کرد. این چت‌بات قادر به انجام مکالمه و به خاطر سپاری تعاملات قبلی است. در این مثال می‌خواهیم از قابلیت های عامل (Agent) و Chains که از طریق پکیج LangChain قابل دسترس هستند استفاده کنیم. آماده سازی محیط # برای این آموزش به langchain-core و langgraph نیاز خواهیم داشت: ...

Post Cover Image

فراخوانی توابع توسط مدل

این notebook نحوه استفاده از API Chat Completions را در ترکیب با توابع خارجی برای گسترش قابلیت های مدل های GPT را نشان می دهد. پارامتر tools یک پارامتر اختیاری در API Chat Completion است که می تواند برای ارائه مشخصات تابع استفاده شود. هدف از این امر فراهم کردن امکان تولید آرگومان های تابعی است که با مشخصات ارائه شده مطابقت دارند. توجه داشته باشید که API هیچ تابعی را اجرا نمی کند٬ بلکه مشخصات تابعی که متناسب با متن ورودی است را تعیین می‌کند و این بر عهده توسعه دهندگان است که با استفاده از خروجی های مدل توابع را اجرا کنند. ...

Post Cover Image

ساخت یک Chatbot Agent با Node.js

قابلیت فراخوانی تابع در مدل‌های GPT به برنامه شما اجازه می دهد توابع داخلی برنامه را بر اساس ورودی های کاربر فراخوانی کند. این به این معنی است که برنامه می تواند عملیات مختلفی از جمله، جستجو در وب، ارسال ایمیل، یا رزرو بلیط از طرف کاربران را انجام دهد، که این امر برنامه شما را قدرتمندتر از یک چت بات معمولی می کند. در این پست، شما برنامه‌ای می سازید که از آخرین نسخه از OpenAI SDK Node. ...