腾讯 Открытый исходный код混元-A13B模型

Jin10 данные 27 июня сообщают, что 27 июня Tencent выпустила и открыла исходный код модели混元-A13B. Как сообщается, это крупная модель на основе архитектуры смешанных экспертов (MoE) с общим количеством параметров 80 миллиардов и активными параметрами 13 миллиардов, которая значительно снижает задержку вывода и вычислительные расходы, при этом обеспечивая результаты на уровне ведущих открытых моделей; в экстремальных условиях достаточно одной низкобюджетной графической карты.

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить