Цены на акции производителей DRAM упали за последние пять дней на фоне анонса новой технологии TurboQuant от Google. Объявление было сделано 24 марта, и компания утверждает, что её алгоритм способен снизить потребление памяти моделями искусственного интеллекта в шесть раз и увеличить скорость вычислений в восемь раз.
На момент написания статьи акции Micron Technology (NASDAQ: MU) упали на 19,5% за последние пять дней. В Южной Корее акции SK Hynix снизились на 6%, а Samsung Electronics — на 5%.
TurboQuant представляет собой продвинутый алгоритм квантизации, разработанный Google для значительного сжатия данных в больших языковых моделях (LLM) и системах поиска векторов. Он эффективно решает проблемы с памятью в кэше ключ-значение и ускоряет поиск сходств без потери точности модели.
Эффективность TurboQuant достигается за счет сочетания двух инновационных методик: PolarQuant, который упрощает геометрию данных с использованием полярных координат для устранения традиционного избыточного использования памяти, и Quantized Johnson-Lindenstrauss (QJL), 1-битный математический проверщик ошибок. Эти методы позволяют сжимать кэш ключ-значение до 3 бит без необходимости дополнительной настройки модели, что обеспечивает увеличение скорости выполнения на GPU в восемь раз.
Такая эффективность делает TurboQuant новым стандартом для оптимизации работы ИИ-моделей.