Posts
تولید خودکار برچسب برای تصاویر و توضیح محتوای آنها با استفاده از GPT-4-Vision # این Notebook توضیح میدهد که چگونه میتوان از GPT-4-Vision برای برچسب زدن و توضیح تصاویر بهره برد. ما میتوانیم از تواناییهای GPT-4V استفاده کنیم تا تصاویر ورودی را همراه با اطلاعات تکمیلی در مورد آنها پردازش کند و برچسبها یا توضیحات مربوط به را خروجی دهد. سپس میتوان توضیحات تصویر را با استفاده از یک مدل زبانی (در این نوتبوک، ما از GPT-4-turbo استفاده خواهیم کرد) برای تولید توضیحات بیشتر اصلاح کرد.
...
پردازش ویدیو با استفاده از GPT-4-Vision برای تولید متن مناسب و صداگذاری روی آن # این Notebook نشان میدهد چگونه میتوان از تواناییهای بصری GPT-4 برای درک محتوای یک ویدیو و تولید متن متناسب با آن و نهایتا تبدیل متن تولید شده به صدا استفاده کرد. GPT-4 به طور مستقیم ویدیوها را به عنوان ورودی قبول نمیکند، اما میتوانیم از قابلیت vision و طول کانتکست 128K برای توصیف فریمهای ثابت یک ویدیو در هر زمان استفاده کنیم.
...
مدلهای GPT با درکی که از زبان طبیعی دارند قدرت فهم سوالات و جواب دادن به آنها را دارند. ولی اگر بخواهیم که GPT به سوالات در مورد موضوعات ناآشنا پاسخ دهد، باید چه کار کنید؟
مثالهایی از موضوعات ناآشنا:
رویدادهای اخیر پس از سپتامبر 2021 اسناد شخصی شما اطلاعات مربوط به محصولات فروشگاه شما پاسخگویی به سوالات مشتریان در مورد خدمات شرکت شما و غیره.
این notebook نشان میدهد که چگونه با استفاده از روش دو مرحلهای جستجو-پرسش، GPT را قادر به پاسخگویی به سوالات با استفاده از دیتابیس اطلاعات متنی که غالبا در حالت عادی در دسترس مدل قرار ندارد کنیم.
...
این notebook نحوه استفاده از API Chat Completions را در ترکیب با توابع خارجی برای گسترش قابلیت های مدل های GPT را نشان می دهد.
پارامتر tools یک پارامتر اختیاری در API Chat Completion است که می تواند برای ارائه مشخصات تابع استفاده شود. هدف از این امر فراهم کردن امکان تولید آرگومان های تابعی است که با مشخصات ارائه شده مطابقت دارند.
توجه داشته باشید که API هیچ تابعی را اجرا نمی کند٬ بلکه مشخصات تابعی که متناسب با متن ورودی است را تعیین میکند و این بر عهده توسعه دهندگان است که با استفاده از خروجی های مدل توابع را اجرا کنند.
...
قابلیت فراخوانی تابع در مدلهای GPT به برنامه شما اجازه می دهد توابع داخلی برنامه را بر اساس ورودی های کاربر فراخوانی کند. این به این معنی است که برنامه می تواند عملیات مختلفی از جمله، جستجو در وب، ارسال ایمیل، یا رزرو بلیط از طرف کاربران را انجام دهد، که این امر برنامه شما را قدرتمندتر از یک چت بات معمولی می کند.
در این پست، شما برنامهای می سازید که از آخرین نسخه از OpenAI SDK Node.
...
پکیج tiktoken یک توکن ساز سریع و open source است که توسط OpenAI توسعه پیدا کرده است. با دادن یک رشته متن (مثلاً، “tiktoken is great!”) و یک encoding (مثلاً، “cl100k_base”)، یک توکن ساز می تواند رشته متن را به یک لیست از توکن ها تقسیم کند (مثلاً، [“t”, “ik”, “token”, " is", " great", “!”]).
تقسیم کردن رشته های متن به توکن ها مفید است زیرا مدل های GPT متن را به صورت توکن می بینند.
...
به طور پیش فرض، هنگامی که شما از Gilas API درخواست تولید متن می کنید، کل متن تولید شده در یک رسپانس به کلاینت برگردانده می شود. اگر قصد تولید خروجیهای طولانی را دارید٬ تولید متن می تواند چندین ثانیه طول بکشد. برای دریافت سریعتر پاسخ ها٬ می توانید متن را در حالی که تولید می شود ‘stream’ کنید. در این صورت پاسخ های ناتمام را به صورت استریم از سمت سرور دریافت خواهید کرد.
...
مدلهای چت، یگ سری از پیامها را به عنوان ورودی میپذیرند و یک پیام نوشته شده توسط AI را به عنوان خروجی برمیگردانند. این راهنما با چند نمونه فراخوانی API فرمت چت را نشان میدهد.
برای اجرای کدهای زیر ابتدا باید یک کلید API را از طریق پنل کاربری گیلاس تولید کنید. برای این کار ابتدا یک حساب کاربری جدید بسازید یا اگر صاحب حساب کاربری هستید وارد پنل کاربری خود شوید.
...