Rate limit

Rate limit

محدودیت‌های Rate limit به منظور حفظ کیفیت خدمات ما برای همه کاربران است. Rate limit بر روی تعداد دفعاتی که یک کاربر می‌تواند در یک دوره زمانی مشخص به خدمات ما دسترسی پیدا کند، محدودیت اعمال می‌کند.

Rate limit چگونه کار می‌کند؟ #

محدودیت‌های Rate limit به سه روش اندازه‌گیری می‌شوند:

  • RPM (تعداد درخواست‌ها - API request - در هر دقیقه)
  • TPM (تعداد توکن‌ها در هر دقیقه)
  • TPD (تعداد توکن‌ها در هر روز)

محدودیت‌های Rate limit می‌توانند بر اساس هر یک از گزینه‌ها تحت تأثیر قرار بگیرند، بسته به اینکه کدام‌یک اول اتفاق می‌افتد. به عنوان مثال، اگر RPM=20 و TPM=1000 باشد و شما در کمتر از یک دقیقه بیش از ۲۰ درخواست که کمتر از ۱۰۰۰ توکن مصرف می‌کنند را ارسال کنید, درین صورت درخواست‌های ارسالی بعدی در بازه یک دقیقه از سمت سرور رد می‌شوند.

توجه داشته باشید که محدودیت‌های Rate limit به اکانت اعمال می‌شوند و نه به کلیدهای API. بنابراین تولید چندین کلید API مختلف به معنای افزایش محدودیت‌های Rate limit برای آن اکانت نیست.

محدودیت‌های Rate limit بر اساس میزان استفاده #

محدودیت‌های Rate limit بر اساس میزان مصرف شما از APIهای گیلاس تعیین می‌شود. در ابتدا برای هر اکانت محدودیت‌های پایه اعمال می‌شود و از آن پس هر چه مصرف شما از APIهای گیلاس بیشتر شود میزان محدودیت‌های Rate limit اکانت شما کاهش پیدا می‌کند.

جدول زیر محدودیت‌های پایه برای هر اکانت را نشان می‌دهد. تصور ما این است که محدودیت‌های پایه برای بیشتر از ۹۰ درصد کاربران کافی باشد.

مدلRPMTPMTPD
gpt-4o5.000800.00080.000.000
gpt-4o-mini5.0004.000.000400.000.000
gpt-4-turbo5.000600.00060.000.000
gpt-3.5-turbo3.5004.000.000400.000.000
mistral-*120100.0001.000.000
codestral-latest120100.0001.000.000
text-embedding-*5.000800.0005.000.000
whisper-1500
tts-1500
moderations-*500

اطلاعات مربوط به محدودیت‌های Rate limit در هدرهای HTTP Response #

هدر تمام HTTP Responseهایی که از سمت سرور برای شما ارسال می‌شوند شامل اطلاعات مربوط به محدودیت‌های باقی مانده بر روی آن مدل در است.

لیست هدرهای مربوطه در جدول زیر آمده است:

Header NameSample Valueتوضیحات
X-RateLimit-Limit-Requests100حداکثر تعداد درخواستی که می‌توانید در یک دقیقه ارسال کنید.
X-RateLimit-Remaining-Requests50تعداد درخواست‌های باقی مانده.
X-RateLimit-Reset-Requests1707958989زمان باقی‌مانده تا ریست شدن تعداد درخواست‌های باقی مانده. (واحد Unix time)
X-RateLimit-Limit-Tokens-Per-Day1.000حداکثر تعداد توکنی که می‌توانید در یک روز مصرف کنید.
X-RateLimit-Remaining-Tokens-Per-Day700تعداد توکن‌های باقی مانده.
X-RateLimit-Reset-Tokens-Per-Day1707958989زمان باقی‌مانده تا ریست شدن تعداد توکن‌های باقی مانده. (واحد Unix time)
X-RateLimit-Limit-Tokens-Per-Minute100حداکثر تعداد توکنی که می‌توانید در یک دقیقه مصرف کنید.
X-RateLimit-Remaining-Tokens-Per-Minute40تعداد توکن‌های باقی مانده.
X-RateLimit-Reset-Tokens-Per-Minute1707958989زمان باقی‌مانده تا ریست شدن تعداد توکن‌های باقی مانده. (واحد Unix time)