محدودیتهای Rate limit به منظور حفظ کیفیت خدمات ما برای همه کاربران است. Rate limit بر روی تعداد دفعاتی که یک کاربر میتواند در یک دوره زمانی مشخص به خدمات ما دسترسی پیدا کند، محدودیت اعمال میکند.
Rate limit چگونه کار میکند؟ #
محدودیتهای Rate limit به سه روش اندازهگیری میشوند:
- RPM (تعداد درخواستها - API request - در هر دقیقه)
- TPM (تعداد توکنها در هر دقیقه)
- TPD (تعداد توکنها در هر روز)
محدودیتهای Rate limit میتوانند بر اساس هر یک از گزینهها تحت تأثیر قرار بگیرند، بسته به اینکه کدامیک اول اتفاق میافتد. به عنوان مثال، اگر RPM=20 و TPM=1000 باشد و شما در کمتر از یک دقیقه بیش از ۲۰ درخواست که کمتر از ۱۰۰۰ توکن مصرف میکنند را ارسال کنید, درین صورت درخواستهای ارسالی بعدی در بازه یک دقیقه از سمت سرور رد میشوند.
توجه داشته باشید که محدودیتهای Rate limit به اکانت اعمال میشوند و نه به کلیدهای API. بنابراین تولید چندین کلید API مختلف به معنای افزایش محدودیتهای Rate limit برای آن اکانت نیست.
محدودیتهای Rate limit بر اساس میزان استفاده #
محدودیتهای Rate limit بر اساس میزان مصرف شما از APIهای گیلاس تعیین میشود. هر چه مصرف شما از APIهای گیلاس بیشتر شود اکانت شما به طور خودکار به طرح بالاتر انتقال پیدا میکند و میزان محدودیتهای استفاده از APIها به طور خودکار کاهش مییابد.
اگر قصد کاهش سریعتر محدودیتهای Rate limit روی اکانت خود را دارید میتوانید با پرداخت هزینهی طرح مورد نظر اکانت خود را به آن طرح ارتقاء دهید.
طرح | حداقل مصرف |
---|---|
طرح رایگان | — |
طرح برنزی | معادل 20$ |
طرح نقرهای | معادل 50$ |
طرح طلایی | معادل 200$ |
طرح مورد نظر خود را انتخاب کنید تا از میزان محدودیتهای Rate limit آن مطلع شوید.
مدل | RPM | TPM | TPD |
---|---|---|---|
gpt-4-turbo | 100 | 5.000 | 100.000 |
gpt-3.5-turbo | 100 | 10.000 | 200.000 |
text-embedding-* | 100 | 10.000 | 200.000 |
whisper-1 | 5 | — | — |
tts-1 | 5 | — | — |
moderations-* | 100 | — | — |
مدل | RPM | TPM | TPD |
---|---|---|---|
gpt-4-turbo | 500 | 15.000 | 300.000 |
gpt-3.5-turbo | 500 | 50.000 | 500.000 |
text-embedding-* | 500 | 50.000 | 500.000 |
whisper-1 | 25 | — | — |
tts-1 | 25 | — | — |
moderations-* | 500 | — | — |
مدل | RPM | TPM | TPD |
---|---|---|---|
gpt-4-turbo | 1.000 | 50.000 | 800.000 |
gpt-3.5-turbo | 1.000 | 200.000 | 1.000.000 |
text-embedding-* | 1.000 | 200.000 | 1.000.000 |
whisper-1 | 50 | — | — |
tts-1 | 50 | — | — |
moderations-* | 10.000 | — | — |
مدل | RPM | TPM | TPD |
---|---|---|---|
gpt-4-turbo | 5.000 | 300.000 | — |
gpt-3.5-turbo | 5.000 | 700.000 | — |
text-embedding-* | 5.000 | 1.000.000 | — |
whisper-1 | 250 | — | — |
tts-1 | 250 | — | — |
moderations-* | 100.000 | — | — |
اطلاعات مربوط به محدودیتهای Rate limit در هدرهای HTTP Response #
هدر تمام HTTP Responseهایی که از سمت سرور برای شما ارسال میشوند شامل اطلاعات مربوط به محدودیتهای باقی مانده بر روی آن مدل در است.
لیست هدرهای مربوطه در جدول زیر آمده است:
Header Name | Sample Value | توضیحات |
---|---|---|
X-RateLimit-Limit-Requests | 100 | حداکثر تعداد درخواستی که میتوانید در یک دقیقه ارسال کنید. |
X-RateLimit-Remaining-Requests | 50 | تعداد درخواستهای باقی مانده. |
X-RateLimit-Reset-Requests | 1707958989 | زمان باقیمانده تا ریست شدن تعداد درخواستهای باقی مانده. (واحد Unix time) |
X-RateLimit-Limit-Tokens-Per-Day | 1.000 | حداکثر تعداد توکنی که میتوانید در یک روز مصرف کنید. |
X-RateLimit-Remaining-Tokens-Per-Day | 700 | تعداد توکنهای باقی مانده. |
X-RateLimit-Reset-Tokens-Per-Day | 1707958989 | زمان باقیمانده تا ریست شدن تعداد توکنهای باقی مانده. (واحد Unix time) |
X-RateLimit-Limit-Tokens-Per-Minute | 100 | حداکثر تعداد توکنی که میتوانید در یک دقیقه مصرف کنید. |
X-RateLimit-Remaining-Tokens-Per-Minute | 40 | تعداد توکنهای باقی مانده. |
X-RateLimit-Reset-Tokens-Per-Minute | 1707958989 | زمان باقیمانده تا ریست شدن تعداد توکنهای باقی مانده. (واحد Unix time) |