Jin10 данные 27 июня сообщают, что 27 июня Tencent выпустила и открыла исходный код модели混元-A13B. Как сообщается, это крупная модель на основе архитектуры смешанных экспертов (MoE) с общим количеством параметров 80 миллиардов и активными параметрами 13 миллиардов, которая значительно снижает задержку вывода и вычислительные расходы, при этом обеспечивая результаты на уровне ведущих открытых моделей; в экстремальных условиях достаточно одной низкобюджетной графической карты.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
腾讯 Открытый исходный код混元-A13B模型
Jin10 данные 27 июня сообщают, что 27 июня Tencent выпустила и открыла исходный код модели混元-A13B. Как сообщается, это крупная модель на основе архитектуры смешанных экспертов (MoE) с общим количеством параметров 80 миллиардов и активными параметрами 13 миллиардов, которая значительно снижает задержку вывода и вычислительные расходы, при этом обеспечивая результаты на уровне ведущих открытых моделей; в экстремальных условиях достаточно одной низкобюджетной графической карты.