OpenAI обходит Nvidia с необычайно быстрой моделью кодирования на чипах размером с пластину
Но 1000 токенов в секунду на самом деле скромны по стандартам Cerebras. Компания имеет измеренный 2100 токенов в секунду на Llama 3.1 70B и сообщил 3000 токенов в секунду на собственной открытой модели OpenAI gpt-oss-120B, что позволяет предположить, что сравнительно более низкая скорость Codex-Spark отражает накладные расходы более крупной или более сложной модели. Агенты кодирования … Read more