Rate limit

Rate limit

محدودیت‌های Rate limit به منظور حفظ کیفیت خدمات ما برای همه کاربران است. Rate limit بر روی تعداد دفعاتی که یک کاربر می‌تواند در یک دوره زمانی مشخص به خدمات ما دسترسی پیدا کند، محدودیت اعمال می‌کند.

Rate limit چگونه کار می‌کند؟ #

محدودیت‌های Rate limit به سه روش اندازه‌گیری می‌شوند:

  • RPM (تعداد درخواست‌ها - API request - در هر دقیقه)
  • TPM (تعداد توکن‌ها در هر دقیقه)
  • TPD (تعداد توکن‌ها در هر روز)

محدودیت‌های Rate limit می‌توانند بر اساس هر یک از گزینه‌ها تحت تأثیر قرار بگیرند، بسته به اینکه کدام‌یک اول اتفاق می‌افتد. به عنوان مثال، اگر RPM=20 و TPM=1000 باشد و شما در کمتر از یک دقیقه بیش از ۲۰ درخواست که کمتر از ۱۰۰۰ توکن مصرف می‌کنند را ارسال کنید, درین صورت درخواست‌های ارسالی بعدی در بازه یک دقیقه از سمت سرور رد می‌شوند.

توجه داشته باشید که محدودیت‌های Rate limit به اکانت اعمال می‌شوند و نه به کلیدهای API. بنابراین تولید چندین کلید API مختلف به معنای افزایش محدودیت‌های Rate limit برای آن اکانت نیست.

محدودیت‌های Rate limit بر اساس میزان استفاده #

محدودیت‌های Rate limit بر اساس میزان مصرف شما از APIهای گیلاس تعیین می‌شود. هر چه مصرف شما از APIهای گیلاس بیشتر شود اکانت شما به طور خودکار به طرح‌ بالاتر انتقال پیدا می‌کند و میزان محدودیت‌های استفاده از APIها به طور خودکار کاهش می‌یابد.

اگر قصد کاهش سریع‌تر محدودیت‌های Rate limit روی اکانت خود را دارید می‌توانید با پرداخت هزینه‌ی طرح مورد نظر اکانت خود را به آن طرح ارتقاء دهید.

طرححداقل مصرف
طرح رایگان
طرح برنزیمعادل 20$
طرح نقره‌ایمعادل 50$
طرح طلاییمعادل 200$

طرح مورد نظر خود را انتخاب کنید تا از میزان محدودیت‌های Rate limit آن مطلع شوید.

مدلRPMTPMTPD
gpt-4-turbo1005.000100.000
gpt-3.5-turbo10010.000200.000
text-embedding-*10010.000200.000
whisper-15
tts-15
moderations-*100
مدلRPMTPMTPD
gpt-4-turbo50015.000300.000
gpt-3.5-turbo50050.000500.000
text-embedding-*50050.000500.000
whisper-125
tts-125
moderations-*500
مدلRPMTPMTPD
gpt-4-turbo1.00050.000800.000
gpt-3.5-turbo1.000200.0001.000.000
text-embedding-*1.000200.0001.000.000
whisper-150
tts-150
moderations-*10.000
مدلRPMTPMTPD
gpt-4-turbo5.000300.000
gpt-3.5-turbo5.000700.000
text-embedding-*5.0001.000.000
whisper-1250
tts-1250
moderations-*100.000

اطلاعات مربوط به محدودیت‌های Rate limit در هدرهای HTTP Response #

هدر تمام HTTP Responseهایی که از سمت سرور برای شما ارسال می‌شوند شامل اطلاعات مربوط به محدودیت‌های باقی مانده بر روی آن مدل در است.

لیست هدرهای مربوطه در جدول زیر آمده است:

Header NameSample Valueتوضیحات
X-RateLimit-Limit-Requests100حداکثر تعداد درخواستی که می‌توانید در یک دقیقه ارسال کنید.
X-RateLimit-Remaining-Requests50تعداد درخواست‌های باقی مانده.
X-RateLimit-Reset-Requests1707958989زمان باقی‌مانده تا ریست شدن تعداد درخواست‌های باقی مانده. (واحد Unix time)
X-RateLimit-Limit-Tokens-Per-Day1.000حداکثر تعداد توکنی که می‌توانید در یک روز مصرف کنید.
X-RateLimit-Remaining-Tokens-Per-Day700تعداد توکن‌های باقی مانده.
X-RateLimit-Reset-Tokens-Per-Day1707958989زمان باقی‌مانده تا ریست شدن تعداد توکن‌های باقی مانده. (واحد Unix time)
X-RateLimit-Limit-Tokens-Per-Minute100حداکثر تعداد توکنی که می‌توانید در یک دقیقه مصرف کنید.
X-RateLimit-Remaining-Tokens-Per-Minute40تعداد توکن‌های باقی مانده.
X-RateLimit-Reset-Tokens-Per-Minute1707958989زمان باقی‌مانده تا ریست شدن تعداد توکن‌های باقی مانده. (واحد Unix time)