Forklog 2026-03-26 12:45:31

Google разработала «аналог Pied Piper» для восьмикратного ускорения вычислений в нейросетях

Исследовательское подразделение Google представило TurboQuant — алгоритм сжатия памяти для искусственного интеллекта. Пользователи сравнили разработку с технологией стартапа Pied Piper из сериала «Кремниевая долина». TurboQuant is the new Pied Piper 🤣 pic.twitter.com/iMAYJs02zt— Justin Trimble (@justintrimble) March 25, 2026 TurboQuant кратно снижает требования к ресурсам для работы больших языковых моделей и систем векторного поиска.   Искусственный интеллект оперирует сложными многомерными массивами, хранящими информацию о словах или изображениях. Эти данные занимают много места в кэше и замедляют генерацию ответов. Традиционные методы сжатия требуют хранения дополнительных переменных, что часто нивелирует пользу от оптимизации. TurboQuant решает проблему перерасхода памяти с помощью двух механизмов. Первый алгоритм переводит векторы в полярную систему координат и сжимает основной объем данных. Второй работает как математический контролер, используя всего один бит памяти для устранения остаточных скрытых ошибок. Генеральный директор Cloudflare Мэттью Принс сравнил алгоритм с достижениями китайской модели DeepSeek, которая ранее продемонстрировала высокую эффективность при минимальных затратах на оборудование. This is Google’s DeepSeek. So much more room to optimize AI inference for speed, memory usage, power consumption, and multi-tenant utilization. Lots of teams at @Cloudflare focused on these areas. #staytuned https://t.co/hHoY4sLT2I— Matthew Prince 🌥 (@eastdakota) March 25, 2026 Разработчики проверили технологию на открытых моделях Llama, Gemma и Mistral. Алгоритм сжал кэш до трех бит без потери качества ответов. Потребление памяти сократилось минимум в шесть раз, а скорость вычислений на графических ускорителях H100 выросла в восемь раз. Инновация не требует дополнительного обучения нейросетей. По заверениям корпорации, технологию внедрят в поисковые алгоритмы и собственные ИИ-продукты, включая Gemini. Публичная презентация проекта состоится на профильных конференциях ICLR и AISTATS в 2026 году. Напомним, 25 марта Google раскрыла планы по переходу на постквантовую криптографию. https://forklog.com/news/ai/google-obnovila-vajb-kodera-opal/

Прочтите Отказ от ответственности : Весь контент, представленный на нашем сайте, гиперссылки, связанные приложения, форумы, блоги, учетные записи социальных сетей и другие платформы («Сайт») предназначен только для вашей общей информации, приобретенной у сторонних источников. Мы не предоставляем никаких гарантий в отношении нашего контента, включая, но не ограничиваясь, точность и обновление. Никакая часть содержания, которое мы предоставляем, представляет собой финансовый совет, юридическую консультацию или любую другую форму совета, предназначенную для вашей конкретной опоры для любых целей. Любое использование или доверие к нашему контенту осуществляется исключительно на свой страх и риск. Вы должны провести собственное исследование, просмотреть, проанализировать и проверить наш контент, прежде чем полагаться на них. Торговля - очень рискованная деятельность, которая может привести к серьезным потерям, поэтому проконсультируйтесь с вашим финансовым консультантом, прежде чем принимать какие-либо решения. Никакое содержание на нашем Сайте не предназначено для запроса или предложения