多语言,多模态,多领域的大模型技术栈

现代人工智能大模型技术体系的核心组成与应用方向

📁

自研20-130亿参数集行业大模型底座

(文/图/音/视频)

构建了覆盖20亿到130亿参数规模的自主研发大模型底座,支持文本、图像、音频和视频等多种数据类型的处理与理解,为各行业应用提供强大的AI基础能力。

CV大模型
NLP大模型
多模态大模型
Data大模型
🧠

具备领域专家一样的逻辑推理能力及精准度

(数据及算法驱动,国内唯一)

通过先进的数据处理和算法优化,使模型具备与领域专家相当的逻辑推理能力和决策精准度,尤其在复杂任务处理方面表现出色,是国内唯一拥有此能力的技术体系。

Attribute is all you need
Transformer
machine translation
人类行为逻辑链
code learning 代码逻辑链
复杂任务逻辑推理
跨任务交叉"涌现"
🌐

多语言行业大模型,葡语系/一带一路语系OpenAI

(国际唯一,小语种OpenAI)

专注于开发多语言行业大模型,特别是在葡萄牙语系和"一带一路"沿线国家语言方面达到国际领先水平,成为国际上少数能提供小语种AI能力的技术体系之一。

基于Transformer架构
基于中/英-平行语料对齐模型
SFT (Supervised Fine-Tuning)
RLHF (人类反馈强化学习)
PE (Prompt Engineering)
RAG (检索增强生成)
葡语大模型
马来语大模型
泰语大模型
越南语大模型
📦

压缩技术实现轻量化至低算力设备部署

(模型压缩技术)

通过先进的模型压缩技术,将大型模型进行轻量化处理,使其能够在算力有限的设备上高效运行,大大扩展了AI模型的应用场景和部署灵活性。

模型蒸馏算法:
Patient-KD
DistilBERT
DynaBERT
TinyBERT
移动端部署
边缘计算设备
嵌入式系统
低功耗设备
参数修剪技术
知识蒸馏优化
量化压缩方法
结构重参数化