Rate limit

محدودیت‌های Rate limit به منظور حفظ کیفیت خدمات ما برای همه کاربران است. Rate limit بر روی تعداد دفعاتی که یک کاربر می‌تواند در یک دوره زمانی مشخص به خدمات ما دسترسی پیدا کند، محدودیت اعمال می‌کند.

Rate limit چگونه کار می‌کند؟ #

محدودیت‌های Rate limit به سه روش اندازه‌گیری می‌شوند:

RPM (تعداد درخواست‌ها - API request - در هر دقیقه)
TPM (تعداد توکن‌ها در هر دقیقه)
TPD (تعداد توکن‌ها در هر روز)

محدودیت‌های Rate limit می‌توانند بر اساس هر یک از گزینه‌ها تحت تأثیر قرار بگیرند، بسته به اینکه کدام‌یک اول اتفاق می‌افتد. به عنوان مثال، اگر RPM=20 و TPM=1000 باشد و شما در کمتر از یک دقیقه بیش از ۲۰ درخواست که کمتر از ۱۰۰۰ توکن مصرف می‌کنند را ارسال کنید, درین صورت درخواست‌های ارسالی بعدی در بازه یک دقیقه از سمت سرور رد می‌شوند.

توجه داشته باشید که محدودیت‌های Rate limit به اکانت اعمال می‌شوند و نه به کلیدهای API. بنابراین تولید چندین کلید API مختلف به معنای افزایش محدودیت‌های Rate limit برای آن اکانت نیست.

محدودیت‌های Rate limit بر اساس میزان استفاده #

محدودیت‌های Rate limit بر اساس میزان مصرف شما از APIهای گیلاس تعیین می‌شود. هر چه مصرف شما از APIهای گیلاس بیشتر شود اکانت شما به طور خودکار به طرح‌ بالاتر انتقال پیدا می‌کند و میزان محدودیت‌های استفاده از APIها به طور خودکار کاهش می‌یابد.

اگر قصد کاهش سریع‌تر محدودیت‌های Rate limit روی اکانت خود را دارید می‌توانید با پرداخت هزینه‌ی طرح مورد نظر اکانت خود را به آن طرح ارتقاء دهید.

طرح	حداقل مصرف
طرح رایگان	—
طرح برنزی	معادل 20$
طرح نقره‌ای	معادل 50$
طرح طلایی	معادل 200$

طرح مورد نظر خود را انتخاب کنید تا از میزان محدودیت‌های Rate limit آن مطلع شوید.

طرح رایگان

مدل	RPM	TPM	TPD
gpt-4-turbo	100	5.000	100.000
gpt-3.5-turbo	100	10.000	200.000
text-embedding-*	100	10.000	200.000
whisper-1	5	—	—
tts-1	5	—	—
moderations-*	100	—	—

طرح برنزی

مدل	RPM	TPM	TPD
gpt-4-turbo	500	15.000	300.000
gpt-3.5-turbo	500	50.000	500.000
text-embedding-*	500	50.000	500.000
whisper-1	25	—	—
tts-1	25	—	—
moderations-*	500	—	—

طرح نقره‌ای

مدل	RPM	TPM	TPD
gpt-4-turbo	1.000	50.000	800.000
gpt-3.5-turbo	1.000	200.000	1.000.000
text-embedding-*	1.000	200.000	1.000.000
whisper-1	50	—	—
tts-1	50	—	—
moderations-*	10.000	—	—

طرح طلایی

مدل	RPM	TPM	TPD
gpt-4-turbo	5.000	300.000	—
gpt-3.5-turbo	5.000	700.000	—
text-embedding-*	5.000	1.000.000	—
whisper-1	250	—	—
tts-1	250	—	—
moderations-*	100.000	—	—

اطلاعات مربوط به محدودیت‌های Rate limit در هدرهای HTTP Response #

هدر تمام HTTP Responseهایی که از سمت سرور برای شما ارسال می‌شوند شامل اطلاعات مربوط به محدودیت‌های باقی مانده بر روی آن مدل در است.

لیست هدرهای مربوطه در جدول زیر آمده است:

Header Name	Sample Value	توضیحات
X-RateLimit-Limit-Requests	100	حداکثر تعداد درخواستی که می‌توانید در یک دقیقه ارسال کنید.
X-RateLimit-Remaining-Requests	50	تعداد درخواست‌های باقی مانده.
X-RateLimit-Reset-Requests	1707958989	زمان باقی‌مانده تا ریست شدن تعداد درخواست‌های باقی مانده. (واحد Unix time)
X-RateLimit-Limit-Tokens-Per-Day	1.000	حداکثر تعداد توکنی که می‌توانید در یک روز مصرف کنید.
X-RateLimit-Remaining-Tokens-Per-Day	700	تعداد توکن‌های باقی مانده.
X-RateLimit-Reset-Tokens-Per-Day	1707958989	زمان باقی‌مانده تا ریست شدن تعداد توکن‌های باقی مانده. (واحد Unix time)
X-RateLimit-Limit-Tokens-Per-Minute	100	حداکثر تعداد توکنی که می‌توانید در یک دقیقه مصرف کنید.
X-RateLimit-Remaining-Tokens-Per-Minute	40	تعداد توکن‌های باقی مانده.
X-RateLimit-Reset-Tokens-Per-Minute	1707958989	زمان باقی‌مانده تا ریست شدن تعداد توکن‌های باقی مانده. (واحد Unix time)